知识抽取技术综述被引量：15

Survey of knowledge extraction technologies

下载PDF

导出

摘要知识抽取主要研究如何从无语义信息的文档内容中抽取与本体匹配的事实知识,进而实现对Web数据充分、有效的利用,已经成为国内外语义Web领域的研究热点之一。介绍了知识抽取相关技术知识,系统地分析比较了面向英文和中文的知识抽取方法,着重探讨了对中文自然语言文档内容的自动知识抽取方法,指出了目前该类方法的不足,并展望了知识抽取发展的方向。 Knowledge extraction,whose main task is to extract the factual knowledge from the no-semantics-embedded documents and to realize the full and effective use of Web data,has become a hot topic in the semantic Web field. Firstly,this paper gave a brief introduction of knowledge extraction related technologies. Secondly,analyzed and compared the English-oriented and Chinese-oriented knowledge extraction methods systematically,especially the methods towards Chinese natural language documents. Lastly,pointed out the main drawbacks of the current methods and discussed the future development direction of knowledge extraction.

作者刘鹏博车海燕陈伟

机构地区上海市特种设备监督检验技术研究院吉林大学计算机科学与技术学院

出处《计算机应用研究》 CSCD 北大核心 2010年第9期3222-3226,共5页 Application Research of Computers

基金吉林省青年科研基金资助项目(20090108) 吉林省科技发展计划资助项目(20090111) 吉林大学基本科研业务费资助项目(421032051421)

关键词知识抽取语义WEB 综述 knowledge extraction semantic Web survey

分类号 TP31 [自动化与计算机技术—计算机软件与理论] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献42

1BERNERS-LEE T,HENDLER J,LASSILA O.The semantic Web[J].Scientific American,2001,284(5):34-43.
2BENJAMINS V R,CONTRERAS J,CORCHO O,et al.Six challenges for the semantic Web[C]//Proc of Semantic Web Workshop.Berlin:Springer,2002.
3STUDER R,BENJAMINS V R,FENSEL D.Knowledge enginee-ring:principles and methods[J].Data and Knowledge Enginee-ring,1998,25(1-2):161-197.
4MANOLA F,MILLER E.RDF primer[BE/OL].(2004-02-10)[2008-09-20].http://www.w3.org/TR/rdf-primer/.
5MILLER G A,BECKWITH R,FELLBAUM C,et al.Introduction to WordNet:an on-line lexical database[J].Journal of Lexicography,1990,3(4):235-312.
6DONG Zhen-dong,DONG Qiang.HowNet[EB/OL].(2000)[2008-10-06].http://www.keenage.com/zhiwang/e_zhiwang.html.
7荆涛,左万利,孙吉贵,车海燕.中文网页语义标注：由句子到RDF表示[J].计算机研究与发展,2008,45(7):1221-1231. 被引量：31
8COHEN W,HURST M,JENSEN L.A flexible learning system for wrapping tables and lists in HTML documents[C]//Proc of the 11th International World Wide Web Conference.New York:ACM Press,2002:232-241.
9KOSALA R,BLOCKEEL H,BRUYNOOGHE M,et al.Information extraction from structured documents using k-testable tree automaton inference[J].Data & Knowledge Engineering,2006,58(2):129-158.
10TENIER S,TOUSSAINT Y,NAPOLI A,et al.Instantiation of relations for semantic annotation[C]//Proc of IEEE/WIC/ACM International Conference on Web Intelligence.Washington DC:IEEE Computer Society,2006:463-472.

二级参考文献151

1王睿,张洁,张由仪,于禛,姚天昉.基于混合模型的中文命名实体抽取系统[J].清华大学学报（自然科学版）,2005,45(S1):1908-1914. 被引量：10
2林亚平,刘云中,周顺先,陈治平,蔡立军.基于最大熵的隐马尔可夫模型文本信息抽取[J].电子学报,2005,33(2):236-240. 被引量：48
3车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：116
4于满泉,陈铁睿,许洪波.基于分块的网页信息解析器的研究与设计[J].计算机应用,2005,25(4):974-976. 被引量：55
5刘非凡,赵军,吕碧波,徐波,于浩,夏迎炬.面向商务信息抽取的产品命名实体识别研究[J].中文信息学报,2006,20(1):7-13. 被引量：47
6俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：157
7崔世起,刘群,孟遥,于浩,西野文人.基于大规模语料库的新词检测[J].计算机研究与发展,2006,43(5):927-932. 被引量：32
8周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：112
9王浩畅,赵铁军.基于SVM的生物医学命名实体的识别[J].哈尔滨工程大学学报,2006,27(B07):570-574. 被引量：18
10李中国,刘颖.边界模板和局部统计相结合的中国人名识别[J].中文信息学报,2006,20(5):44-50. 被引量：13

共引文献286

1郭崇慧,许蒙.一种基于众包模式的试题知识点标注方法[J].信息与管理研究,2019,0(6):64-72. 被引量：3
2高原,施元磊,张蕾,曹天奕,冯筠.基于游记文本的游客游览行程重构[J].数据分析与知识发现,2020,4(2):165-172. 被引量：5
3吴天昊,古丽拉·阿东别克.基于神经元块级别注意力机制的LSTM关系抽取[J].计算机应用研究,2020,37(S02):76-79. 被引量：6
4韩萌,李蔚清.基于特征增强的中文STEM课程知识的关系抽取[J].计算机应用研究,2020,37(S01):40-42. 被引量：3
5李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
6盛泳潘,付雪峰,吴天星.基于开放域抽取的多文档概念图构建研究[J].计算机应用研究,2020,37(1):19-25. 被引量：2
7于江德,谷川,葛文英,樊孝忠.一种基于字和子串联合标注的汉语分词方法[J].山西大学学报（自然科学版）,2011,34(3):357-362. 被引量：2
8明仲,蔡树彬,李师贤,徐晶.本体的继承及一致性分析[J].电子学报,2005,33(4):660-666. 被引量：1
9明仲,李师贤,蔡树彬,徐晶.建立本体的协作-挖掘方法[J].中山大学学报（自然科学版）,2005,44(3):15-19.
10曹宇峰,曹存根.基于本体的中医舌诊知识的获取[J].计算机应用研究,2006,23(3):31-34. 被引量：17

同被引文献177

1李宪港,李强.典型智能博弈系统技术分析及指控系统智能化发展展望[J].智能科学与技术学报,2020,2(1):36-42. 被引量：21
2龚建华,李亚斌,王道军,黄明祥,王伟星.地理知识可视化中知识图特征与应用--以小流域淤地坝系规划为例[J].遥感学报,2008,12(2):355-361. 被引量：11
3周明建,高济,李飞.基于本体论的Web信息抽取[J].计算机辅助设计与图形学学报,2004,16(4):535-541. 被引量：34
4黄玲,陈龙.基于网页分块的正文信息提取方法[J].计算机应用,2008,28(S2):326-328. 被引量：13
5赵振南,张宏军.兵要地志信息系统的关键技术分析[J].计算机工程,2004,30(17):65-67. 被引量：4
6许勇,宋柔.基于HMM的百科辞典文本中句子的知识点分类[J].计算机工程与应用,2005,41(4):35-37. 被引量：5
7车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：116
8陈悦,刘则渊.悄然兴起的科学知识图谱[J].科学学研究,2005,23(2):149-154. 被引量：823
9张晓艳,王挺,陈火旺.命名实体识别研究[J].计算机科学,2005,32(4):44-48. 被引量：66
10姜吉发.一种事件信息抽取模式获取方法[J].计算机工程,2005,31(15):96-98. 被引量：27

引证文献15

1路威,赵丽君.兵要知识图谱的构建与应用研究[J].测绘地理信息,2022,47(4):119-123. 被引量：3
2郑彦宁,化柏林.句子级知识抽取在情报学中的应用分析[J].情报理论与实践,2011,34(12):1-4. 被引量：18
3王志华,魏斌,李占波,赵伟.基于本体的Web信息抽取系统[J].计算机工程与设计,2012,33(7):2634-2639. 被引量：14
4金燕.基于本体的Web信息抽取研究综述[J].图书馆学研究,2012(16):2-6. 被引量：2
5陈巧,施佺.基于蚂蚁算法的Deep Web页面信息抽取方法研究[J].煤炭技术,2013,32(2):176-178. 被引量：3
6陈雪,梁永全,赵相彬.改进的基于本体的Web信息抽取[J].计算机应用与软件,2013,30(7):14-16. 被引量：6
7李长玲,郭凤娇,魏绪秋.基于时序关键词的学科交叉研究主题分析——以情报学与计算机科学为例[J].情报资料工作,2014,35(6):44-48. 被引量：22
8崔梦娇,李红莲,吕学强,周建设.基于高校网站内容的实体抽取研究[J].北京信息科技大学学报（自然科学版）,2016,31(5):92-96. 被引量：1
9葛斌,谭真,张翀,肖卫东.军事知识图谱构建技术[J].指挥与控制学报,2016,2(4):302-308. 被引量：31
10马费成,周利琴.面向智慧健康的知识管理与服务[J].中国图书馆学报,2018,44(5):4-19. 被引量：66

二级引证文献199

1马费成,张帅.我国图书情报领域新兴交叉学科发展探析[J].中国图书馆学报,2023,49(2):4-14. 被引量：22
2胡卉.数智环境下老年人健康信息服务可及性影响因素研究[J].知识管理论坛,2023(2):155-167. 被引量：3
3刘宇航.图书馆智慧知识服务体系架构的研究[J].图书馆界,2022(5):11-15. 被引量：3
4李芊芊,付兴,杨凤,侯鉴宸,陶晓华,韩帅,贾昌民.基于“病脉证并治”诊疗思维的《伤寒论》知识图谱构建与应用[J].世界科学技术-中医药现代化,2022,24(9):3613-3621. 被引量：8
5翟兴,肖源,王若佳,楚玉鹏,李京忠.数智环境下智慧健康信息服务体系构建研究[J].情报科学,2022,40(10):43-50. 被引量：10
6成浩,梁平,刘超鑫,王泽玉,孙会来.情报信息驱动下的军事目标知识深度认知研究[J].网络安全与数据治理,2023,42(S02):139-143.
7余晓蕾,朱笛,王立昊,林军,向剑文.基于知识图谱的嵌入式操作系统测试用例复用推荐模型[J].武汉大学学报（理学版）,2023,69(2):187-194. 被引量：3
8郭晓宇,彭浩.基于本体的网页数据抽取技术的探讨[J].中国多媒体与网络教学学报（电子版）,2020(19):4-5.
9翟倩倩,古想花,刘喜文.慢性病智慧健康教育体系研究[J].医药论坛杂志,2021,42(19):1-5. 被引量：1
10路威,赵丽君.兵要知识图谱的构建与应用研究[J].测绘地理信息,2022,47(4):119-123. 被引量：3

1赵志群.职业教育远程教育资源建设的两个指导思想[J].信息技术教育,2007(6):70-72. 被引量：6
2邹亮.基于OWL的电子政务知识分类与表示研究[J].科技广场,2010(6):20-24.
3孙叔琦,孙珂,赵世奇,李生,王海峰,杨沐昀.一种基于事实知识的实体相关度计算方法[J].中文信息学报,2016,30(3):178-186.
4车海燕,冯铁,张家晨,陈伟,李大利.面向中文自然语言文档的自动知识抽取方法[J].计算机研究与发展,2013,50(4):834-842. 被引量：17
5沙宗尧,边馥苓.基于面向对象知识表达的空间推理决策及应用[J].遥感学报,2004,8(2):165-171. 被引量：5
6郑兴远.企业招标知识库及其建设阶段探讨[J].石油知识,2014(3):55-58.
7郑兴远.企业招标知识库及其建设阶段探讨[J].石油科技论坛,2014,33(1):35-38. 被引量：1

计算机应用研究

2010年第9期

浏览历史

内容加载中请稍等...

知识抽取技术综述被引量：15

参考文献42

二级参考文献151

共引文献286

同被引文献177

引证文献15

二级引证文献199

相关作者

相关机构

相关主题

浏览历史

知识抽取技术综述 被引量：15

参考文献42

二级参考文献151

共引文献286

同被引文献177

引证文献15

二级引证文献199

相关作者

相关机构

相关主题

浏览历史

知识抽取技术综述被引量：15