基于Bi-LSTM的生物医学文本语义消歧研究被引量：3

Word Sense Disambiguation in Biomedical Text Based on Bi-LSTM

下载PDF

导出

摘要生物医学文本语义消歧研究中,上下文语义表示存在精度不高、忽略语言特性等问题,对此提出一种基于Bi-LSTM的新型语言模型。该模型通过考虑上下文词序将整个句义信息以无监督学习方式嵌入低维连续空间,并以此生成高质量的上下文表示,然后利用该方法构建歧义向量,最终计算cosine相似度,完成对歧义词的分类。实验表明,相比传统线性语言模型,基于Bi-LSTM生成的语义向量能更好地表示歧义词的语义信息,并在不同生物医学文本数据集中达到高准确度(95.01/91.27)。 Aiming at the problem that the representation of context semantics in biomedical text semantic disambiguation has low preci. sion and neglected language characteristics,a new language model based on Bi-LSTM is proposed. The model embeds the entire sen. tence meaning information into the low-dimensional contiguous space by considering the context word order,and generates a high-quality context representation,and then uses the context representation method to construct the ambiguity vector,and finally cal. culates the cosine similarity to complete the classification. Classification of ambiguous words. Experiments show that compared with the traditional linear language model,the semantic vector generated by Bi-LSTM can better represent the semantic information of ambigu. ous words and achieve the highest accuracy in different biomedical text data sets(95.01/91.27).

作者罗曜儒李智 LUO Yao-ru;LI Zhi(Electrical Engineering Department,University of Sichuan,Chengdu 610065,China)

机构地区四川大学电子信息学院

出处《软件导刊》 2019年第4期57-59,63,共4页 Software Guide

关键词语义消歧 Bi-LSTM 无监督学习生物医学上下文表示 word sense disambiguation Bi-LSTM unsupervised learning biomedical domain context representation

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献4

1邓凡,鱼滨.基于语义计算的中文歧义字段消歧算法[J].计算机技术与发展,2008,18(6):107-110. 被引量：1
2杨安,李素建,李芸.基于领域知识和词向量的词义消歧方法[J].北京大学学报（自然科学版）,2017,53(2):204-210. 被引量：14
3高雪霞,炎士涛.基于WordNet词义消歧的语义检索研究[J].湘潭大学自然科学学报,2017,39(2):118-121. 被引量：8
4赵谦,荆琪,李爱萍,段利国.一种基于语义与句法结构的短文本相似度计算方法[J].计算机工程与科学,2018,40(7):1287-1294. 被引量：18

二级参考文献9

1孙茂松,邹嘉彦.汉语自动分词研究中的苦干理论问题[J].语言文字应用,1995(4):40-46. 被引量：45
2周爱武,汪贤惠,刘慧婷.基于HowNet词汇相关性的文本聚类[J].微电子学与计算机,2015,32(4):90-93. 被引量：4
3葛斌,李芳芳,郭丝路,汤大权.基于知网的词汇语义相似度计算方法研究[J].计算机应用研究,2010,27(9):3329-3333. 被引量：66
4孙志军,郑烇,袁婧,刘恒,王嵩.基于浅层语义分析技术的语义检索[J].计算机科学,2012,39(6):107-110. 被引量：8
5孙滨,刘林.一种基于《知网》的文本语义相似度的计算方法[J].计算机与数字工程,2014,42(2):187-189. 被引量：4
6张沪寅,刘道波,温春艳.基于《知网》的词语语义相似度改进算法研究[J].计算机工程,2015,41(2):151-156. 被引量：22
7秦添轶,林蝉,宋博宇,关毅.一种实体描述短文本相似度计算方法[J].智能计算机与应用,2015,5(2):34-37. 被引量：3
8张沪寅,温春艳,刘道波,叶刚.改进的基于本体的语义相似度计算[J].计算机工程与设计,2015,36(8):2206-2210. 被引量：10
9张艳杰,邵雄凯,刘建舟.一种基于语义与结构的句子相似度计算方法[J].湖北工业大学学报,2015,30(5):82-85. 被引量：5

共引文献36

1张春祥,赵凌云,高雪瑶.基于卷积神经网络的词义消歧[J].北京邮电大学学报,2019,42(3):114-119. 被引量：3
2马晓军,郭剑毅,王红斌,张志坤,线岩团,余正涛.融合词向量和主题模型的领域实体消歧[J].模式识别与人工智能,2017,30(12):1130-1137. 被引量：8
3汪一百,陈实,叶剑锋.利用深度学习的文本相似度计算方法[J].湘潭大学自然科学学报,2018,40(2):104-107. 被引量：4
4李国佳,赵莹地,郭鸿奇.一种基于多义词向量表示的词义消歧方法[J].智能计算机与应用,2018,8(4):52-56. 被引量：4
5吕晓伟,章露露.基于词向量的无监督词义消歧方法[J].软件导刊,2018,17(9):193-195. 被引量：3
6王仁武,陈川宝,孟现茹.基于词向量扩展的学术资源语义检索技术[J].图书情报工作,2018,62(19):111-119. 被引量：11
7耿晓军.基于半监督支持向量机的期刊收稿系统自动分类方法[J].现代电子技术,2018,41(24):174-177. 被引量：1
8唐善成,马付玉,张镤月,陈熊熊.采用Seq2Seq模型的非受限词义消歧方法[J].西北大学学报（自然科学版）,2019,49(3):351-355. 被引量：5
9黄恒琪,于娟,廖晓,席运江.知识图谱研究综述[J].计算机系统应用,2019,28(6):1-12. 被引量：213
10肖锐,蒋家琪,张云春.多义词语义拓扑及有监督的词义消歧研究[J].计算机科学,2019,46(S11):13-18. 被引量：1

同被引文献18

1鹿文鹏,黄河燕.基于依存适配度的知识自动获取词义消歧方法[J].软件学报,2013,24(10):2300-2311. 被引量：11
2杨陟卓,黄河燕.基于语言模型的有监督词义消歧模型优化研究[J].中文信息学报,2014,28(1):19-25. 被引量：8
3杨陟卓.基于上下文语境的词义消歧方法[J].计算机应用,2015,35(4):1006-1008. 被引量：4
4闫蓉,高光来.上下文边界可变的词义消歧[J].计算机工程与设计,2015,36(10):2843-2848. 被引量：2
5杨安,李素建,李芸.基于领域知识和词向量的词义消歧方法[J].北京大学学报（自然科学版）,2017,53(2):204-210. 被引量：14
6杨陟卓.基于上下文翻译的有监督词义消歧研究[J].计算机科学,2017,44(4):252-255. 被引量：11
7史兆鹏,邹徐熹,向润昭.基于依存句法分析的多特征词义消歧[J].计算机工程,2017,43(9):210-213. 被引量：12
8李国佳,赵莹地,郭鸿奇.一种基于多义词向量表示的词义消歧方法[J].智能计算机与应用,2018,8(4):52-56. 被引量：4
9吕晓伟,章露露.基于词向量的无监督词义消歧方法[J].软件导刊,2018,17(9):193-195. 被引量：3
10孟禹光,周俏丽,张桂平,蔡东风.引入词性标记的基于语境相似度的词义消歧[J].中文信息学报,2018,32(8):9-18. 被引量：6

引证文献3

1王伟,黄德根.基于滑动语义串匹配(SMOSS)的汉语词义消歧[J].小型微型计算机系统,2020,41(7):1345-1350. 被引量：2
2余本功,季晓晗.基于ADGCN-MFM的多模态讽刺检测研究[J].数据分析与知识发现,2023,7(10):85-94. 被引量：1
3陈董,王曼,戴光裕,张硕,汤斯亮,庄越挺.基于大小语言模型协同的社区矛盾调解框架[J].软件导刊,2024,23(7):40-44.

二级引证文献3

1王梓森,梁英,刘政君,谢小杰,张伟,史红周.科研项目同行评议专家学术专长匹配方法[J].计算机应用,2021,41(8):2418-2426. 被引量：6
2江伟豪,严丽,屠要峰,周祥生,李忠良.RDF问答系统中一种基于N-gram的消歧方法[J].小型微型计算机系统,2022,43(5):969-975. 被引量：1
3林洁霞,朱小栋.CMHICL:基于跨模态分层交互网络和对比学习的多模态讽刺检测[J].计算机应用研究,2024,41(9):2620-2627.

1方明之.自然语言处理技术发展与未来[J].科技传播,2019,11(6):143-144. 被引量：15
2胡银安.论小学英语教学中的情感教育[J].考试周刊,2019,0(22):17-17.
3高俊芳,夏劲伟.基于《现代汉语词典》语义空间的中文文本语义相似度研究[J].情报探索,2018(11):10-15. 被引量：2
4刘文洁,林磊,孙承杰.基于迁移学习的语义推理网络[J].智能计算机与应用,2018,8(6):195-198.
5刘刚,左权,杨倩茹.一种基于指纹融合的跨语言剽窃检测技术[J].计算机应用研究,2019,36(1):168-174. 被引量：5
6李胜.基于JavaScript的面向对象语言特性及其程序设计[J].科技与创新,2019(6):112-113. 被引量：2
7吕明,陶建华,金花,揭林俊,苏畅.“互联网+”模式下河长制综合管理平台研究与实践[J].江苏通信,2019,35(1):41-43. 被引量：5
8蒙晓忻.浅析高中语文诗歌鉴赏教学策略[J].好家长,2018,0(56):220-220.
9林涛.基于无监督学习的物联网卡流量异常检测算法[J].城市建设理论研究（电子版）,2018,8(28):188-188. 被引量：2
10潘敬,胥少阳.打开交易数据背后的“黑匣子”——以伦锌为例的实证分析[J].中国有色金属,2019,0(5):40-41.

软件导刊

2019年第4期

浏览历史

内容加载中请稍等...

基于Bi-LSTM的生物医学文本语义消歧研究被引量：3

参考文献4

二级参考文献9

共引文献36

同被引文献18

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Bi-LSTM的生物医学文本语义消歧研究 被引量：3

参考文献4

二级参考文献9

共引文献36

同被引文献18

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于Bi-LSTM的生物医学文本语义消歧研究被引量：3