融合多类型特征的特定领域实体识别研究被引量：3

DOMAIN-SPECIFIC ENTITY RECOGNITION WITH THE SUPPORT OF MULTI-TYPE FEATURES

下载PDF

导出

摘要特定领域实体具有分布稀疏、类型有限、领域性强等特点,与普通命名实体具有较大差别,在使用神经网络模型构建识别模型中面临训练语料规模有限、带标实体稀疏等困难.以武器装备名识别为例,研究深度学习框架下,词性、句法和领域知识融入神经网络模型的方法和效果.实验结果表明,在融入词性和领域知识后,武器装备名识别的F值分别提升了0.97%与9.5%.此外,通过在不同语料规模下进行实验并定量分析不同类型特征的分布特点,初步给出造成不同类型特征对深度学习模型有着不同支持作用的原因. The domain-specific entities have the characteristics of sparse distribution,limited types and strong domains.They are quite different from ordinary named entities.It is difficult to construct recognition model by using neural network model due to the limited size of training corpus and sparse labeled entities.Taking the identification of military equipment names as example,we study the method and effect of the integration of part of speech,syntax and domain knowledge into the neural network model under the framework of depth learning.The experimental results show that after the integration of part of speech and domain knowledge,the F value of military equipment name recognition increases by 0.97%and 9.5%respectively.By conducting experiments under different corpus size and quantitatively analyzing the distribution characteristics of different types of features,the reasons that different types of features have different supporting effects for deep learning are given.

作者雷树杰邢富坤王闻慧 Lei Shujie;Xing Fukun;Wang Wenhui(Luoyang Campus,Information Engineering University of PLA Strategic Support Forces,Luoyang 471003,Henan,China;School of Foreign Languages,Qingdao University,Qingdao 266000,Shandong,China)

机构地区战略支援部队信息工程大学洛阳校区青岛大学外语学院

出处《计算机应用与软件》北大核心 2019年第11期210-217,共8页 Computer Applications and Software

关键词英文武器装备名 Bi-LSTM+CRF 多类型特征特征分析 English military equipment name Bi-LSTM+CRF Multi-type feature Feature analysis

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1雷树杰,邢富坤.英文武器装备名的构成类型与构造模式研究[J].中国科技术语,2019,21(1):14-20. 被引量：2
2冯艳红,于红,孙庚,孙娟娟.基于BLSTM的命名实体识别方法[J].计算机科学,2018,45(2):261-268. 被引量：51

二级参考文献6

1黄德根,李泽中,万如.基于SVM和CRF的双层模型中文机构名识别[J].大连理工大学学报,2010,50(5):782-787. 被引量：13
2刘明宝,侯杰.美军武器装备命名规则简介[J].现代军事,2003,0(7):22-25. 被引量：3
3冯蕴天,张宏军,郝文宁.面向军事文本的命名实体识别[J].计算机科学,2015,42(7):15-18. 被引量：50
4李丽双,何红磊,刘珊珊,黄德根.基于词表示方法的生物医学命名实体识别[J].小型微型计算机系统,2016,37(2):302-307. 被引量：19
5孙丽萍,过弋,唐文武,徐永斌.基于构成模式和条件随机场的企业简称预测[J].计算机应用,2016,36(2):449-454. 被引量：3
6冯艳红,于红,孙庚,赵禹锦.基于词向量和条件随机场的领域术语识别方法[J].计算机应用,2016,36(11):3146-3151. 被引量：24

共引文献51

1彭骁男,周兰江,张建安,周枫.融合多特征的老挝语人名地名命名实体识别[J].中国水运（下半月）,2020,20(3):74-77. 被引量：1
2步一,薛睿,孟凡,黄文彬.知识图谱的关键技术及其在情报学中的应用[J].情报学进展,2022(1):349-384. 被引量：1
3成于思,施云涛.融合词典特征的Bi-LSTM-WCRF中文人名识别[J].中文信息学报,2020(4):69-76. 被引量：7
4于红,戚浩然,苏延明,刘海映,张思佳,程名,卢晓黎,穆晓辉.海洋渔业标准化在线信息集成服务与推广平台关键技术分析[J].海洋信息,2018,33(4):33-38. 被引量：6
5黄晴雁,牟永敏.命名实体识别方法研究进展[J].现代计算机（中旬刊）,2018(12):12-17. 被引量：4
6徐啸,朱艳辉,冀相冰.基于自注意力深度学习的微博实体识别研究[J].湖南工业大学学报,2019,33(2):48-52. 被引量：5
7马建红,张亚梅,姚爽,张炳斐,郭昌宏.基于BLSTM＿attention＿CRF模型的新能源汽车领域术语抽取[J].计算机应用研究,2019,36(5):1385-1389. 被引量：16
8翟社平,段宏宇,李兆兆.基于BILSTM_CRF的知识图谱实体抽取方法[J].计算机应用与软件,2019,36(5):269-274. 被引量：23
9侯丽仙,李艳玲,李成城.面向任务口语理解研究现状综述[J].计算机工程与应用,2019,55(11):7-15. 被引量：9
10祖木然提古丽·库尔班,艾山·吾买尔.中文命名实体识别模型对比分析[J].现代计算机,2019,0(14):3-7. 被引量：11

同被引文献38

1刘非凡,赵军,吕碧波,徐波,于浩,夏迎炬.面向商务信息抽取的产品命名实体识别研究[J].中文信息学报,2006,20(1):7-13. 被引量：47
2张小衡,王玲玲.中文机构名称的识别与分析[J].中文信息学报,1997,11(4):21-32. 被引量：83
3李玉森,张雪英,袁正午.面向GIS的地理命名实体识别研究[J].重庆邮电大学学报（自然科学版）,2008,20(6):719-724. 被引量：10
4岑志坚.地方志文献的特征、价值及开发[J].科技情报开发与经济,2009,19(4):87-89. 被引量：9
5袁里驰.基于依存关系的句法分析统计模型[J].中南大学学报（自然科学版）,2009,40(6):1630-1635. 被引量：13
6朱锁玲,包平.方志类古籍地名识别及系统构建[J].中国图书馆学报,2011,37(3):118-124. 被引量：32
7陈钰枫,宗成庆,苏克毅.汉英双语命名实体识别与对齐的交互式方法[J].计算机学报,2011,34(9):1688-1696. 被引量：17
8翟剑锋.深度学习在自然语言处理中的应用[J].电脑编程技巧与维护,2013(18):74-76. 被引量：13
9何炎祥,罗楚威,胡彬尧.基于CRF和规则相结合的地理命名实体识别方法[J].计算机应用与软件,2015,32(1):179-185. 被引量：68
10韩春燕,刘玉娇,琚生根,李若晨,苏翀.中文微博命名体识别[J].四川大学学报（自然科学版）,2015,52(3):511-516. 被引量：9

引证文献3

1陈业明,戴齐,刘捷.融合字位置特征的铁路事故命名实体识别[J].计算机系统应用,2022,31(12):211-219. 被引量：3
2何玉洁,杜方,史英杰,宋丽娟.基于深度学习的命名实体识别研究综述[J].计算机工程与应用,2021,57(11):21-36. 被引量：35
3翟姗姗,余华娟,陈健瑶,夏立新.基于多维特征分析的戏曲类方志文献命名实体识别研究[J].情报学报,2024,43(9):1094-1104.

二级引证文献37

1江洋洋,金伯,张宝昌.深度学习在自然语言处理领域的研究进展[J].计算机工程与应用,2021,57(22):1-14. 被引量：22
2赵辉,庞海婷,冯珊珊,韩东辰.中文命名实体识别技术综述[J].长春工业大学学报,2021,42(5):444-450. 被引量：9
3于润羽,杜军平,薛哲,徐欣,奚军庆.面向科技学术会议的命名实体识别研究[J].智能系统学报,2022,17(1):50-58. 被引量：3
4张厚昌,刘成良.融合嵌入字词特征的中文医疗命名实体识别[J].中华医学图书情报杂志,2021,30(9):42-49. 被引量：5
5江千军,桂前进,王磊,徐瑞翔,王京景,麦立,许水清.命名实体识别技术研究进展综述[J].电力信息与通信技术,2022,20(2):15-24. 被引量：13
6赵丹丹,黄德根,孟佳娜,谷丰,张攀.多头注意力与字词融合的中文命名实体识别[J].计算机工程与应用,2022,58(7):142-149. 被引量：14
7樊昊,陈俊杰,高静,刘晓玲.基于BiLSTM-CRF纪检监察事件命名实体识别[J].计算机仿真,2022,39(6):464-468. 被引量：3
8刘江峰,冯钰童,王东波,胡昊天,张逸勤.数字人文视域下SikuBERT增强的史籍实体识别研究[J].图书馆论坛,2022,42(10):61-72. 被引量：19
9秦煜峰,刘爽.基于RoForm的电商领域命名实体识别[J].大连民族大学学报,2022,24(5):448-454. 被引量：1
10崔雨萌,王靖亚,闫尚义,陶知众.基于深度学习的警情记录关键信息自动抽取[J].大数据,2022,8(6):127-142. 被引量：2

1齐运鑫.医务人员应重视药品说明书的学习[J].今日健康,2016,15(5):362-362.
2李延睿,李燕妮.近三十年回汉民族团结研究回顾与展望[J].北方民族大学学报（哲学社会科学版）,2019,0(6):25-29.
3陈果,许天祥.小规模知识库指导下的细分领域实体关系发现研究[J].情报学报,2019,38(11):1200-1211. 被引量：9
4宋扬.服务、游戏、圈层：垂直领域知识付费的场景化发展路径[J].编辑之友,2019,0(11):39-43. 被引量：6
5彭柳林,池泽新,付江凡,余艳锋.劳动力老龄化背景下农机作业服务与农业科技培训对粮食生产的调节效应研究——基于江西省的微观调查数据[J].农业技术经济,2019,0(9):91-104. 被引量：29
6蔡珍珍.高职高专服装设计专业人才培养模式的探讨[J].智库时代,2019,0(46):246-246. 被引量：1
7张翠,周茂杰.一种基于CNN与双向LSTM融合的文本情感分类方法[J].计算机时代,2019,0(12):38-41. 被引量：3
8成于思,施云涛.基于深度学习和迁移学习的领域自适应中文分词[J].中文信息学报,2019,33(9):9-16. 被引量：14
9倪德财,王静丽.生态体育旅游的价值表现及开发策略[J].智库时代,2019,0(45):278-278. 被引量：3
10刘哲宁,朱聪慧,郑德权,赵铁军.面向特定标注数据稀缺领域的命名实体识别[J].指挥信息系统与技术,2019,10(5):14-18. 被引量：5

计算机应用与软件

2019年第11期

浏览历史

内容加载中请稍等...

融合多类型特征的特定领域实体识别研究被引量：3

参考文献2

二级参考文献6

共引文献51

同被引文献38

引证文献3

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

融合多类型特征的特定领域实体识别研究 被引量：3

参考文献2

二级参考文献6

共引文献51

同被引文献38

引证文献3

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

融合多类型特征的特定领域实体识别研究被引量：3