期刊文献+

《数据分析与知识发现》 CSSCI CSCD 北大核心

作品数1338被引量4906H指数26
《数据分析与知识发现》(Data Analysis and Knowledge Discovery)是由中国科学院主管、中国科学院文献情报中心主办的学术性专业期刊。期刊聚焦各行各业中以大数据为基础、依...查看详情>>
  • 曾用名 现代图书情报技术
  • 主办单位中国科学院文献情报中心
  • 国际标准连续出版物号2096-3467
  • 国内统一连续出版物号10-1478/G2
  • 出版周期月刊
共找到1,338篇文章
< 1 2 71 >
每页显示 20 50 100
EBSCO推出临床决策Dyna创新中心
1
《数据分析与知识发现》 EI CSCD 北大核心 2024年第2期55-55,共1页
EBSCO临床决策部门的临床和医疗保健专家团队开始在其医疗资源中利用生成式人工智能技术,目标是以前所未有的速度为临床医生、护士和医疗保健专业人员提供行业领先的、基于证据的、专家编辑的、值得信赖的信息。在Dyna创新中心(Dyna Inn... EBSCO临床决策部门的临床和医疗保健专家团队开始在其医疗资源中利用生成式人工智能技术,目标是以前所未有的速度为临床医生、护士和医疗保健专业人员提供行业领先的、基于证据的、专家编辑的、值得信赖的信息。在Dyna创新中心(Dyna Innovation Center),EBSCO与机构和个人合作,共同加强对临床医生和患者的决策支持。尝试将生成式人工智能等尖端技术无缝集成到临床决策支持解决方案中。在当今的信息环境中,临床医生必须经过几个步骤才能获取所需的临床信息,即在搜索界面输入查询,然后查看搜索结果并导航到某个主题寻找答案。临床决策部门的临床专家正在探索如何利用人工智能,通过在EBSCO的循证环境中使用大型语言模型来轻松获得即时的答案。在临床环境中使用人工智能时,有必要采取审慎的方法,尤其是在考虑临床诊断和治疗时。Clinical Decisions编辑团队正在围绕质量、安全性和患者隐私、透明度、管理和公平性发布负责任地使用人工智能的原则。该团队首先将安全环境放在首位。 展开更多
关键词 人工智能 无缝集成 临床决策 医疗保健 语言模型 临床医生 患者隐私 EBSCO
原文传递
面向实时财经信息的领域情感歧义搭配词典构建研究
2
作者 赵又霖 徐竟楠 陆颖隽 《数据分析与知识发现》 CSCD 北大核心 2023年第7期100-110,共11页
【目的】针对由于忽略歧义词的动态极性而导致情感分析有误的问题,有效识别具有经济学特征的情感歧义词并提取其搭配词,解决该领域歧义词适配性问题。【方法】以动态财经新闻信息为研究对象,计算短语中词汇正负情感值以识别提取歧义种子... 【目的】针对由于忽略歧义词的动态极性而导致情感分析有误的问题,有效识别具有经济学特征的情感歧义词并提取其搭配词,解决该领域歧义词适配性问题。【方法】以动态财经新闻信息为研究对象,计算短语中词汇正负情感值以识别提取歧义种子词,通过关联规则、点互信息等算法挖掘其强相关搭配词,标注搭配词对情感极性后构建歧义搭配词典,从动态维度对实时更新的新闻文本进行情感挖掘测评。【结果】实证结果表明,加入歧义搭配词典后对财经信息文本情感分析的准确率为89.62%,召回率为87.52%,F1值为88.57%,较未加入歧义搭配词典分别提高5.79、15.89和10.84个百分点。【局限】在利用情感歧义搭配词典进行文本情感挖掘过程中,存在设置种子词与其搭配词检索字符间隔较远而未被有效识别的情况。【结论】本文构建的歧义搭配词典有效扩充了经济学领域情感词典,在细粒度和深度上对领域情感词典进行完善及优化,显著提升了领域文本情感挖掘的准确性。 展开更多
关键词 财经信息 歧义搭配词典 关联规则 情感词典
原文传递
融合外部知识和用户交互特征的虚假新闻检测 被引量:1
3
作者 刘帅 傅丽芳 《数据分析与知识发现》 EI CSCD 北大核心 2023年第11期79-87,共9页
【目的】针对虚假新闻在社交媒体中肆意传播这一现象,通过融入外部知识特征和用户交互特征,构建多维度数据分类模型以提高虚假新闻检测的效率和准确性。【方法】提取虚假新闻文本的背景知识,通过维基知识图谱引入外部知识检测新闻内容... 【目的】针对虚假新闻在社交媒体中肆意传播这一现象,通过融入外部知识特征和用户交互特征,构建多维度数据分类模型以提高虚假新闻检测的效率和准确性。【方法】提取虚假新闻文本的背景知识,通过维基知识图谱引入外部知识检测新闻内容与既有知识体系的内在一致性,同时根据心理学中相似效应理论分析传播链上的用户交互,通过改进图卷积网络的连接边权更真实地体现用户间相互影响,构建了一个融合外部知识、新闻内容、传播链特征与用户交互关系的多维度数据虚假新闻检测模型。【结果】在两个公开数据集Twitter15、Twitter16上验证模型的性能,与5个类似模型进行对比分析,该模型的准确率分别达到0.901和0.927。【局限】未考虑新闻附加内容中隐藏的知识信息和语言表达等其他特征,模型的可解释性也需要进一步提高。【结论】外部知识和传播链用户交互特征等多维度数据信息融合的检测模型能够有效提高虚假新闻的识别准确率。 展开更多
关键词 虚假新闻检测 特征工程 网络社交媒体 知识图谱
原文传递
基于因果分析图的城市交通流短时预测研究 被引量:1
4
作者 王洁 高原 +2 位作者 张蕾 马力文 冯筠 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第11期111-125,共15页
【目的】有效地挖掘区域之间复杂的空间作用关系机制,提高短时交通流预测精度。【方法】提出一种新的图神经网络模型,该模型融合区域功能相似性矩阵与因果关系矩阵,按照“交通时序因果关系挖掘→时空特征提取→未来状态预测”的逻辑进... 【目的】有效地挖掘区域之间复杂的空间作用关系机制,提高短时交通流预测精度。【方法】提出一种新的图神经网络模型,该模型融合区域功能相似性矩阵与因果关系矩阵,按照“交通时序因果关系挖掘→时空特征提取→未来状态预测”的逻辑进行预测建模,训练图神经网络捕获区域内流量的时空依赖性特征,从而实现交通流量预测。【结果】在成都市滴滴出行数据集上进行实验分析,结果表明所提模型较其他8种基线模型效果均有一定的提升,相较于最优基线模型,在RMSE及MAE值上分别降低了3.098%和4.783%。【结论】交通时序因果图可以同时融合传统方法中通常需要考虑的空间距离关系特征、道路连通性特征、功能相似性特征等,且因果关系的引入能在一定程度上提升区域交通流的预测性能。 展开更多
关键词 短时交通流预测 交通时序因果图 时空数据 图神经网络
原文传递
基于招聘广告的岗位人才需求分析框架构建与实证研究 被引量:7
5
作者 岳铁骐 傅友斐 徐健 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第2期151-166,共16页
【目的】面向网络招聘广告提出一个完整、系统的岗位人才需求分析的框架,并基于框架对我国互联网行业人才需求进行分析。【方法】采集互联网行业招聘广告,构建LDA模型以实现岗位需求的主题挖掘与分类,利用Word2Vec模型与依存句法分析得... 【目的】面向网络招聘广告提出一个完整、系统的岗位人才需求分析的框架,并基于框架对我国互联网行业人才需求进行分析。【方法】采集互联网行业招聘广告,构建LDA模型以实现岗位需求的主题挖掘与分类,利用Word2Vec模型与依存句法分析得到主题词-程度词词表并构建主题本体。【结果】实证分析发现互联网行业岗位主要分布于我国的东南沿海与一线城市,计算机技术和个人素质能力是互联网行业最为看重的两项主题能力,不同类别的岗位对人才的能力需求差异较大;并基于框架构建了对不同岗位需求的量化评价。【局限】校园招聘的数据样本较少,导致分析结果与实际情况存在偏差;构建LDA模型时分词不够完善,某些主题代表性不强。【结论】实证分析表明岗位人才需求分析框架对人才市场需求和岗位能力要求的分析是有效的,并依据分析结果提出了制定职业规划、提高培养计划灵活性等建议。 展开更多
关键词 招聘广告 岗位人才需求分析 LDA主题模型 本体
原文传递
算法可帮助人工智能系统避开“对抗性”目标输入
6
作者 本刊 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第4期114-114,共1页
在一个完美的世界中,人们所看到的就是所感知到的,如果这个完美世界真实存在,那么人工智能(AI)系统的工作将非常简单明了。以自动驾驶汽车上采用的防撞系统为例,如果可以完全相信车载摄像头的视觉输入,那么AI系统可以直接将输入映射为... 在一个完美的世界中,人们所看到的就是所感知到的,如果这个完美世界真实存在,那么人工智能(AI)系统的工作将非常简单明了。以自动驾驶汽车上采用的防撞系统为例,如果可以完全相信车载摄像头的视觉输入,那么AI系统可以直接将输入映射为适当的动作:向右转向、向左转向或继续执行,以避免撞到车载摄像头看到的行人或障碍物。但是,如果相机出现故障使得图像稍微偏移几个像素怎么办?如果汽车盲目地信任所谓的"对抗性目标输入",则可能会采取不必要的潜在危险动作。 展开更多
关键词 人工智能系统 潜在危险 防撞系统 自动驾驶汽车 向右转 向左转 视觉输入 对抗性
原文传递
基于作者偏好和异构信息网络的科技文献推荐方法研究 被引量:7
7
作者 王勤洁 秦春秀 +2 位作者 马续补 刘怀亮 徐存真 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第8期54-64,共11页
【目的】采用异构信息网络理论和作者偏好,提高科技文献推荐质量。【方法】基于异构信息网络理论,提出一种可以融合多语义信息的科技文献推荐方法。首先,结合作者偏好信息为科技文献异构信息网络中的元路径加权;其次,采用DPRel算法计算... 【目的】采用异构信息网络理论和作者偏好,提高科技文献推荐质量。【方法】基于异构信息网络理论,提出一种可以融合多语义信息的科技文献推荐方法。首先,结合作者偏好信息为科技文献异构信息网络中的元路径加权;其次,采用DPRel算法计算作者与文献之间的相关度。在此基础上,构建加权作者-文献矩阵,按相关度降序排列得到推荐列表。【结果】从Web of Science中收集实验数据集,实验结果表明,在三个数据集中所提方法相较于基于单条元路径计算作者-文献相关度的推荐方法在平均成功推荐率上分别提高了6%、8%、6%,并且文献成功推荐提高率分别为14.8%、27.6%、13.0%。【局限】在数据预处理阶段由人工进行关键词统一,对于海量数据,人工处理关键词不现实。【结论】所提推荐方法提高了异构信息网络中科技文献推荐的质量。 展开更多
关键词 科技文献推荐 异构信息网络 作者偏好 元路径加权
原文传递
基于可视化的基金资助热点及其演化发现方法研究 被引量:6
8
作者 陈挺 王海名 王小梅 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第2期60-67,共8页
【目的】设计基于可视化的基金资助热点发现方法,用于分析科研立项重点以及发现其演化过程。【方法】基于NASA小企业研发计划基金申请书的文本特征,绘制连续时间窗口下基金资助图谱,通过识别图谱中项目密度分布较高的区域定位资助热点,... 【目的】设计基于可视化的基金资助热点发现方法,用于分析科研立项重点以及发现其演化过程。【方法】基于NASA小企业研发计划基金申请书的文本特征,绘制连续时间窗口下基金资助图谱,通过识别图谱中项目密度分布较高的区域定位资助热点,并根据两期图谱中热点位置、内容变化分析研判资助热点演变趋势。【结果】在两个时间窗口内,可明确区分出消亡的、持续的和新兴的资助热点及其演化过程。【局限】分析方法中涉及文本特征提取、可视化与概率密度计算等多个步骤需要多次调优,热点与演化判断分析尚未形成计算指标,无法脱离领域专家的判读。【结论】本文提出的基于可视化图谱的基金资助热点及其演化的发现方法,可直观地反映资助机构的资助布局热点变化情况,经领域专家判读与其认知相符,或可在科研管理与决策者审视宏观科研布局中起到辅助作用。 展开更多
关键词 可视化 核密度 基金资助热点 演化
原文传递
社交媒体情境下的情感分析研究综述 被引量:15
9
作者 谭荧 张进 夏立新 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第1期1-11,共11页
【目的】调研近年来社交媒体情境下的情感分析相关研究,重点介绍情感挖掘的任务和方法。【文献范围】利用Web of Science核心数据库检索2015年-2019年间,主题为Social Media和Sentiment Analysis的文献,并结合引文分析和浏览的方法补充... 【目的】调研近年来社交媒体情境下的情感分析相关研究,重点介绍情感挖掘的任务和方法。【文献范围】利用Web of Science核心数据库检索2015年-2019年间,主题为Social Media和Sentiment Analysis的文献,并结合引文分析和浏览的方法补充文献集,共计收集163篇并引用代表性文献91篇。【方法】针对社交媒体情境下的情感分析研究方向、技术和应用进行内容分析。【结果】归纳10余种情感分析任务,总结适用于社交媒体平台的情感分析改进方法,并论述了这些情感分析结果的应用领域。【局限】未深入解析情感分析算法的步骤和过程。【结论】本文分析了情感分析研究的现有核心技术和改进方向,发现了该领域在社交媒体情境下的不同任务和挑战。 展开更多
关键词 社交媒体 情感分析 情感分析任务
原文传递
网络在线信任影响因素研究综述 被引量:9
10
作者 张毅 杨奕 邓雯 《数据分析与知识发现》 CSSCI CSCD 北大核心 2020年第5期15-26,共12页
【目的】理清网络在线信任影响因素,洞察信任者与被信任者需求,发掘内外部环境的影响差异,解释各影响因子的作用效应,精准提升用户信任度。【文献范围】在Web of Science、CNKI等数据库中分别以"online trust"、"network... 【目的】理清网络在线信任影响因素,洞察信任者与被信任者需求,发掘内外部环境的影响差异,解释各影响因子的作用效应,精准提升用户信任度。【文献范围】在Web of Science、CNKI等数据库中分别以"online trust"、"network trust"、"system trust"和"在线信任"、"网络信任"、"系统信任"等关键词进行检索,通过筛选共获得代表性文献91篇。【方法】回顾网络在线信任发展历程与概念内涵,系统梳理该领域主要影响因素指标。【结果】当前研究热点集中于信任者特征、被信任对象特征、技术平台、外部环境等4项影响因素及影响效应,以及新兴技术对在线信任的影响与重构。其主题演化趋势同信任理论与信息技术相结合的发展脉络密切相关。【局限】仅将影响因素和评价指标作为探讨核心,未涉及相关领域其他方面。【结论】分析当前研究情境维度及呈现特征,该领域未来仍具有较大探索空间,可尝试从理论模型、研究方法、研究视角等层面持续优化。 展开更多
关键词 电子政务 网络在线信任 研究评述
原文传递
基于引用共词网络的领域基础词汇发现研究 被引量:6
11
作者 程齐凯 王佳敏 陆伟 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第6期57-65,共9页
【目的】从学术文献中发现领域基础词汇,为把握学科知识结构和发展脉络提供支持。【方法】将引文网络引入到共词分析中,构造关键词之间的引用共词网络,采用PageRank算法对候选词汇重要性进行排名,基于约11万篇计算机领域文献集进行实证... 【目的】从学术文献中发现领域基础词汇,为把握学科知识结构和发展脉络提供支持。【方法】将引文网络引入到共词分析中,构造关键词之间的引用共词网络,采用PageRank算法对候选词汇重要性进行排名,基于约11万篇计算机领域文献集进行实证研究。【结果】从定性和定量的角度与词频法和共词分析法进行对比,结果表明本文方法效果较好,能更好地拟合专家人工筛选结果,盲选实验的平均准确度达72.6%。【局限】仅以计算机领域为例进行实验。【结论】本研究提出一种融合引用共词网络和Page Rank算法的领域基础词汇发现策略,能够提高领域基础词汇发现的效率和质量。 展开更多
关键词 基础词汇 引用共词网络 PAGERANK 词频法 共词分析
原文传递
邻域粗糙集融合网格搜索组合分类器的理财决策知识获取研究 被引量:4
12
作者 李静 刘潇 王效俐 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第1期85-94,共10页
【目的】为提高金融机构理财决策知识获取的效率和有效性,提出邻域粗糙集融合网格搜索组合分类器的理财决策知识获取模型。【方法】建立理财决策知识获取系统框架,采用邻域粗糙集方法对决策系统进行知识约简,采用SMOTE过采样方法消除数... 【目的】为提高金融机构理财决策知识获取的效率和有效性,提出邻域粗糙集融合网格搜索组合分类器的理财决策知识获取模型。【方法】建立理财决策知识获取系统框架,采用邻域粗糙集方法对决策系统进行知识约简,采用SMOTE过采样方法消除数据的不平衡性,采用网格搜索方法搜索组合分类器的最优参数。通过模型的训练和测试,对约简组合进行评估和优选,选出最佳约简;最后,通过约简获取决策系统的规则知识,存入组织知识库,完成知识获取。【结果】采用4521条真实理财数据进行实证分析,测试集购买类样本准确率(Sensitivity)达到83.55%,未购买类样本准确率(Specificity)达到80.74%, AUC值达到0.8214。【局限】未针对保险、消费贷款等其他类型的营销数据进行验证。【结论】邻域粗糙集融合网格搜索组合分类器的分类模型能够有效提高理财决策系统的整体分类能力,识别和获取关键客户知识,提高金融机构理财产品决策的效益和效率。 展开更多
关键词 知识获取 邻域粗糙集 组合分类器 网格搜索
原文传递
基于Q-LDA主题模型的网络健康社区主题挖掘研究 被引量:9
13
作者 杨磊 王子润 侯贵生 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第11期52-59,共8页
【目的】信息质量是主题发现的重要影响因素,通过构建Q-LDA模型进行网络健康社区主题挖掘,弥补LDA主题模型在网络信息质量方面的不足,并增强模型的主题表示能力。【方法】研究网络健康信息质量评价体系,并对网络健康信息进行质量加权,在... 【目的】信息质量是主题发现的重要影响因素,通过构建Q-LDA模型进行网络健康社区主题挖掘,弥补LDA主题模型在网络信息质量方面的不足,并增强模型的主题表示能力。【方法】研究网络健康信息质量评价体系,并对网络健康信息进行质量加权,在LDA主题模型的基础上建立Q-LDA主题挖掘模型,利用实际数据对模型进行验证。【结果】Q-LDA模型的结果可解释性和主题表达能力优于传统的LDA主题模型,其主题挖掘效率提高16%,能够更有效地挖掘网络健康社区信息所隐藏的主题。【局限】只选取网络健康社区内某一种疾病版块的文本数据,其代表性可能存在不足。【结论】在考虑网络健康信息质量的情况下进行主题挖掘,其结果能更好地满足网络健康社区用户的需求。 展开更多
关键词 文本数据 在线健康社区 知识发现 主题挖掘
原文传递
时空数据建模方法研究综述 被引量:15
14
作者 李旭晖 刘洋 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第3期1-13,共13页
【目的】总结时空数据建模方法,以期为时空知识的组织和管理研究提供理论基础。【文献范围】在百度学术、谷歌学术、EI、CNKI中分别以检索式"时空数据模型"、"spatio-temporal data model"在限定时间范围、期刊类... 【目的】总结时空数据建模方法,以期为时空知识的组织和管理研究提供理论基础。【文献范围】在百度学术、谷歌学术、EI、CNKI中分别以检索式"时空数据模型"、"spatio-temporal data model"在限定时间范围、期刊类型内进行文献检索,获得部分相关文献,根据研究主题相关程度筛选最终获得64篇相关文献。【方法】根据建模对象的抽象层次对时空数据模型进行分类,分别从物理层、逻辑层和应用层三个层次对时空数据模型的相关研究进行综述。【结果】近年来物理层对时空数据模型的研究主要侧重于对以往模型的修正,应用层的时空数据模型集中于满足各领域具体需求,而逻辑层的研究在表达能力方面有待改进。【局限】不同层次的时空数据模型横向对比研究较少。【结论】未来大规模的时空信息管理和利用,将为时空数据建模的深入发展提供广阔的空间。 展开更多
关键词 时空数据模型 物理层 逻辑层 应用层
原文传递
关于实体解析基本方法的研究和述评 被引量:3
15
作者 高广尚 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第5期27-40,共14页
【目的】探讨实体解析理论中经典的实体解析方法及逻辑思路。【文献范围】在GoogleScholar和CNKI中分别以检索词"Entity Resolution"、"Collective Analysis"、"Crowdsourced"、"Active Learning&qu... 【目的】探讨实体解析理论中经典的实体解析方法及逻辑思路。【文献范围】在GoogleScholar和CNKI中分别以检索词"Entity Resolution"、"Collective Analysis"、"Crowdsourced"、"Active Learning"、"Privacy-Preserving"和"实体解析"进行文献检索,再结合主题筛选,精读并使用追溯法获得实体解析研究的代表性文献共86篇。【方法】针对每种实体解析方法,归纳分析该方法的基本思想,并通过图示直观地呈现其中的解析过程;重点分析梳理方法实现过程中,现有研究所采用的关键策略、算法或技术等。【结果】实体解析是数据质量管理的基本操作,也是发现数据价值的关键步骤。【局限】未深入分析各实体解析方法的评价指标和应用情况。【结论】尽管现有实体解析方法能在一定程度上满足大部分应用的需求,但在大数据环境下其仍然面临着数据混杂性、隐私保护和分布式环境等方面的挑战。 展开更多
关键词 实体解析 协同分析 众包 主动学习 隐私保护
原文传递
基于LDA模型的HSK作文生成 被引量:1
16
作者 徐艳华 苗雨洁 +1 位作者 苗琳 吕学强 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第9期80-87,共8页
【目的】研究HSK5作文自动生成,为汉语教师写作教学以及汉语学习者备考提供参考。【方法】将"HSK动态作文语料库"作为基本语料库,基于LDA模型训练语料库,融合交叉熵选择句子的策略,生成包含关键词的文本。通过人工评价,对比... 【目的】研究HSK5作文自动生成,为汉语教师写作教学以及汉语学习者备考提供参考。【方法】将"HSK动态作文语料库"作为基本语料库,基于LDA模型训练语料库,融合交叉熵选择句子的策略,生成包含关键词的文本。通过人工评价,对比待评价文本和参考标准,对生成文本进行评分。【结果】实验结果表明,生成的文本内容包含所有关键词,且与主题相关。【局限】训练文本有一部分是改正后的HSK作文语料,来自母语为非汉语的外国人的作文,以致内容连贯性不强、内容不够丰富。【结论】该方法完成了根据关键词写作的任务,生成的文本可以很好地围绕关键词展开,并切合主题,本文提出的融合策略使生成的文本可读性较强。 展开更多
关键词 自然语言生成 LDA模型 人工评价
原文传递
面向高校学生深度辅导领域的主题建模和主题上下位关系识别研究 被引量:5
17
作者 庞贝贝 苟娟琼 穆文歆 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第6期92-101,共10页
【目的】对高校学生深度辅导这一特定领域知识进行建模,提出一个支持小规模知识获取和建模的框架。【方法】采用LDA模型识别出文档集合所包含的主题及标识主题的词组;对"文档–主题"矩阵进行概念层次分析,获取主题之间的上下... 【目的】对高校学生深度辅导这一特定领域知识进行建模,提出一个支持小规模知识获取和建模的框架。【方法】采用LDA模型识别出文档集合所包含的主题及标识主题的词组;对"文档–主题"矩阵进行概念层次分析,获取主题之间的上下位关系;并将建模结果统一编码为本体的形式存入知识库,以便进行知识检索。【结果】本研究面向深度辅导具体应用,引入概念层次分析法,在LDA建模基础上进一步细化主题知识的粒度,改善了LDA主题建模结果难以表达主题之间关联关系的难题。【局限】未考虑新的深度辅导文档带来的知识库增量更新问题。【结论】本研究框架能够很好地支持深度辅导领域中诸如学生问题、交流方式、引导技巧等多粒度知识的建模与检索。 展开更多
关键词 LDA 形式概念分析 知识建模 本体
原文传递
我国内地城市电子政务服务能力分布规律——基于地理区域、政务渠道、政务维度综合视角 被引量:4
18
作者 司文峰 胡广伟 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第9期1-9,共9页
【目的】为解决电子政务服务能力分析切入视角单一的局限,采用综合视角进行全面的分析。【方法】通过应用多维指标体系测评地级以上城市网站及"两微一端",分别基于地理区域、政务渠道、政务维度视角进行统计分析与归纳讨论。... 【目的】为解决电子政务服务能力分析切入视角单一的局限,采用综合视角进行全面的分析。【方法】通过应用多维指标体系测评地级以上城市网站及"两微一端",分别基于地理区域、政务渠道、政务维度视角进行统计分析与归纳讨论。【结果】揭示了我国内地城市电子政务服务水平偏低、发展不平衡的态势和分布规律;得出比较影响、互相影响、效果影响显著不同的重要结论;并归纳出7种不同的电子政务服务阶段。【局限】来源数据非时间序列,分析样本未扩展至县镇。【结论】基于地理区域、政务渠道、政务维度的综合视角对提升电子政务服务能力提出了整体性提升、平衡性发展、同类性借鉴等建议。 展开更多
关键词 电子政务服务 服务能力 地理区域 政务渠道 政务维度
原文传递
基于主题过滤与主题关联的学科主题演化分析 被引量:21
19
作者 曲佳彬 欧石燕 《数据分析与知识发现》 CSSCI CSCD 北大核心 2018年第1期64-75,共12页
【目的】针对采用LDA模型识别出的主题中往往含有一些无意义的主题,严重影响演化分析的精确性问题,本文提出采用主题过滤和主题关联的方式,构建学科主题在时间序列上的演化路径,并分析主题在内容上的演化情况。【方法】计算主题在所有... 【目的】针对采用LDA模型识别出的主题中往往含有一些无意义的主题,严重影响演化分析的精确性问题,本文提出采用主题过滤和主题关联的方式,构建学科主题在时间序列上的演化路径,并分析主题在内容上的演化情况。【方法】计算主题在所有文献中出现的概率,识别并过滤边缘主题;根据主题中词汇分布的倾向性,识别并过滤无意义的噪音主题。将过滤后的主题作为主题演化分析的主题,通过计算相邻时间段中主题间的JS散度识别相关主题,从而根据主题间的相关关系构建主题演化路径。【结果】以"机器学习"领域的文献为例,构建学科主题演化路径,展示主题间的新生、消亡、继承、分裂和合并5种演化方式,并以微观的"图像识别"为例,验证了方法的有效性。【局限】在构建主题演化路径时,采用人工判断方法设置阈值,具有一定的主观性。【结论】本文方法避免了不重要的边缘主题和无意义的噪音主题对相邻时间段中相关主题识别造成的干扰,提高了所构建的主题演化路径的准确性,能够更为准确地展示学科主题的演化规律。 展开更多
关键词 学科主题演化 主题过滤 LDA主题模型 演化分析
原文传递
近5年信息检索的研究热点与发展趋势综述——基于相关会议论文的分析 被引量:7
20
作者 杨超凡 邓仲华 +1 位作者 彭鑫 刘斌 《数据分析与知识发现》 CSSCI CSCD 2017年第7期35-43,共9页
【目的】统计近5年相关会议集收录的论文,分析信息检索的研究热点与发展趋势。【文献范围】检索2012年–2016年ACL、ACMMM、ICML、KDD、SIGIR等5个信息检索领域的相关会议集收录的论文。【方法】使用爬虫软件获取5个相关会议收录的论文... 【目的】统计近5年相关会议集收录的论文,分析信息检索的研究热点与发展趋势。【文献范围】检索2012年–2016年ACL、ACMMM、ICML、KDD、SIGIR等5个信息检索领域的相关会议集收录的论文。【方法】使用爬虫软件获取5个相关会议收录的论文的摘要和关键词,并利用分词工具对其处理,进行统计分析和文献研究。【结果】发现目前信息检索中移动搜索是主流;检索模型不断优化;注重过滤和推荐;与人工智能关系密切,用户隐私以及医疗健康也是信息检索重点关注的内容。【局限】仅采集论文的摘要和关键词数据,未进行全文内容以及引文的分析。【结论】反映目前信息检索的大致发展状况,为其他学者开展新的研究提供借鉴和参考。 展开更多
关键词 信息检索 会议论文 研究热点 发展趋势
原文传递
上一页 1 2 71 下一页 到第
使用帮助 返回顶部