期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于可视化工具的深度学习研究现状分析 被引量:2
1
作者 纪有书 王东波 《江苏科技信息》 2021年第17期52-57,共6页
[目的/意义]探究国内外深度学习研究热点,对比国内外研究差异,为国内深度学习研究提供参考。[方法/过程]利用CNKI和WoS收录的深度学习研究相关论文,借助可视化工具Vosviewer绘制科学知识谱图,分别从发文量、研究机构、学科分布和关键词... [目的/意义]探究国内外深度学习研究热点,对比国内外研究差异,为国内深度学习研究提供参考。[方法/过程]利用CNKI和WoS收录的深度学习研究相关论文,借助可视化工具Vosviewer绘制科学知识谱图,分别从发文量、研究机构、学科分布和关键词等方面对比分析国内外深度学习研究现状,把握国内外深度学习研究方向和热点。[结果/结论]2012年以来,国内外深度学习研究领域的文献总量快速增长,同时国内机构在文献数量上有更高的参与度,并且目前发展仍然保有活力。近年来研究的热点在图像、通信领域、自然语言处理和强化学习等方向。 展开更多
关键词 深度学习 Vosviewer 定量分析 研究热点
下载PDF
基于课表知识抽取的情报学课程设置启示研究 被引量:8
2
作者 沈思 左明聪 +3 位作者 王东波 纪有书 刘浏 谢靖 《情报学报》 CSSCI CSCD 北大核心 2020年第12期1253-1263,共11页
情报学课程体系改革近年来逐渐成为研究的热点。在获取国外iSchool学校课程表的基础上,结合Bi-LSTM和BERT深度学习模型,构建课程名称的自动抽取模型,其中最优的BERT模型的调和平均值达到了92.92%。在该模型的基础上完成对所有课程名称... 情报学课程体系改革近年来逐渐成为研究的热点。在获取国外iSchool学校课程表的基础上,结合Bi-LSTM和BERT深度学习模型,构建课程名称的自动抽取模型,其中最优的BERT模型的调和平均值达到了92.92%。在该模型的基础上完成对所有课程名称的知识抽取,从而构建了相对全面和体系化的iSchool课程知识体系。在所抽取的知识基础上,从整体和类别的角度对国外iSchool课程的内容进行系统和深入的统计与分析;并在上述分析的基础上,对国内开设情报学相应的课程提供了切实可行的建议。 展开更多
关键词 情报学课程 深度学习 ISCHOOL 知识抽取 BERT
下载PDF
定量对比视角下的国外数字人文研究进展分析 被引量:2
3
作者 张琪 纪有书 王东波 《农业图书情报》 2019年第11期4-14,共11页
[目的/意义]数字人文研究在国内的发展已经近十年,明确国内外数字人文研究的差异有助于国内数字人文研究的进一步开展。[方法/过程]首先通过对学科与机构合作的定量统计对比了国内外数字人文研究中各学科参与度、机构合作模式的差异。... [目的/意义]数字人文研究在国内的发展已经近十年,明确国内外数字人文研究的差异有助于国内数字人文研究的进一步开展。[方法/过程]首先通过对学科与机构合作的定量统计对比了国内外数字人文研究中各学科参与度、机构合作模式的差异。针对存在的差异,利用CiteSpace中的共被引聚类、突现检测、双图叠加等功能,以图谱为线索介绍了国外数字人文研究的研究进展。[结果/结论]国内外数字人文研究的主要差异在于国内外计算机、人文学科的参与程度。结合CiteSpace的共被引聚类功能,确定了国际数字人文研究中计算机学科的7个类群和两个研究主题,人文学科中的五个类群和两个研究主题。通过对两学科共被引网络的双图叠加,发现国际数字人文研究中计算机学科和人文学科的合作相对较少,前者较为先进的技术未能较快融入后者的研究中。综上,笔者提倡国内计算机和人文学科深入参与数字人文研究中,并应注重加强数字人文基础学科与应用学科之间的合作。 展开更多
关键词 数字人文 科学计量学 CITESPACE
下载PDF
基于词对齐的古汉语同义词自动抽取研究——以前四史典籍为例 被引量:2
4
作者 纪有书 王东波 黄水清 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第11期135-144,共10页
【目的】针对古汉语领域同义词自动抽取研究较少以及现代汉语同义词抽取方法在古汉语不适用的问题,提出一种无监督抽取古汉语同义词的方法。【方法】构建句子级别古白对齐语料,利用词对齐算法实现典籍语料的词对齐,根据词对齐结果设计... 【目的】针对古汉语领域同义词自动抽取研究较少以及现代汉语同义词抽取方法在古汉语不适用的问题,提出一种无监督抽取古汉语同义词的方法。【方法】构建句子级别古白对齐语料,利用词对齐算法实现典籍语料的词对齐,根据词对齐结果设计规则抽取同义词。【结果】词对齐方法可以用来解决古汉语同义词自动抽取问题,该方法在前四史语料上实现了16 272组同义词的抽取,抽样评估结果显示第一次序结果词抽取准确率达到40.12%。【局限】该方法难以适用于没有古白句子级别对齐语料的典籍;同时,抽取结果依赖分词算法和词对齐算法的效果,抽取效果仍有提升空间。【结论】本研究基于词对齐构建一个古汉语词典,有较好的应用性,可以对依赖手工编纂的同义词词典进行扩充,为人文计算研究向语义层面的挖掘提供基础。 展开更多
关键词 同义词 词对齐 古汉语典籍 数字人文
原文传递
面向多领域先秦典籍的分词词性一体化自动标注模型构建 被引量:22
5
作者 张琪 江川 +4 位作者 纪有书 冯敏萱 李斌 许超 刘浏 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第3期2-11,共10页
【目的】探究基于深度学习方法的古籍分词词性一体化标注技术,构建覆盖多领域古籍的自动标注模型。【方法】采用涵盖"经史子集"的25部先秦典籍作为训练语料,在未加入任何人工特征的前提下,基于BERT构建了先秦典籍分词词性一... 【目的】探究基于深度学习方法的古籍分词词性一体化标注技术,构建覆盖多领域古籍的自动标注模型。【方法】采用涵盖"经史子集"的25部先秦典籍作为训练语料,在未加入任何人工特征的前提下,基于BERT构建了先秦典籍分词词性一体化标注模型。最终将模型应用于《史记》,并对《史记》中构成事件的4种基本词类(人名、地名、时间词、动词)进行整体统计与个例分析。【结果】在语料涵盖历史、政论等多种领域且体裁多样的条件下,所构建的先秦典籍分词词性一体化标注模型在开放测试中分词准确率达到95.98%,词性标注准确率达到88.97%。在《史记》上的应用进一步证明了模型的稳定性和实用性。【局限】通过绘制词类标注混淆热力图分析模型错标类型,发现因词类分布样本不均衡、部分词类句法特征相似、兼类等所造成的词性误标有待进一步解决。【结论】将深度学习模型BERT应用于古汉语分词与词性标注,所构建的分词词性一体化标注模型适用于史籍、诗歌、典章制度等多领域的先秦典籍。 展开更多
关键词 数字人文 先秦典籍 古籍智能处理技术 分词 词性标注 深度学习
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部