基于注意力CNLSTM模型的新闻文本分类被引量：20

News Text Classification Based on CNLSTM Model with Attention Mechanism

下载PDF

导出

摘要结合卷积神经网络(CNN)和嵌套长短期记忆网络(NLSTM)2种模型,基于注意力机制提出一个用于文本表示和分类的CNLSTM模型。采用CNN提取短语序列的特征表示,利用NLSTM学习文本的特征表示,引入注意力机制突出关键短语以优化特征提取的过程。在3个公开新闻数据集中进行性能测试,结果表明,该模型的分类准确率分别为96.87 %、95.43 %和97.58 %,其性能比baseline方法有显著提高。 Combining Convolutional Neural Network (CNN) and Nested Long Short-Term Memory (NLSTM) models,this paper proposes a CNLSTM model for text representation and classification based on the attention mechanism.The model uses CNN to extract feature of phrase sequences,and then uses NLSTM to learn the representation of text features.By introducing attention mechanisms,the key phrases are highlighted to optimize feature extraction.Experiments on three published news data sets demonstrate that the classification accuracy of the model is 96.87 %,95.43 %,and 97.58 %,respectively,and its performance is significantly improved compared with the baseline methods.

作者刘月翟东海任庆宁 LIU Yue;ZHAI Donghai;REN Qingning(School of Information Science and Technology,Southwest Jiaotong University,Chengdu 610097,China)

机构地区西南交通大学信息科学与技术学院

出处《计算机工程》 CAS CSCD 北大核心 2019年第7期303-308,314,共7页 Computer Engineering

基金国家自然科学基金(61540060)

关键词卷积神经网络特征表示嵌套长短期记忆网络注意力机制文本分类 Convolutional Neural Network (CNN) feature representation Nested Long Short-Term Memory(NLSTM) attention mechanism text classification

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1陈钊,徐睿峰,桂林,陆勤.结合卷积神经网络和词语情感序列特征的中文情感分析[J].中文信息学报,2015,29(6):172-178. 被引量：49
2夏从零,钱涛,姬东鸿.基于事件卷积特征的新闻文本分类[J].计算机应用研究,2017,34(4):991-994. 被引量：19
3李荣艳,金鑫,王春辉,郑宁,别荣芳.一种新的中文文本分类算法[J].北京师范大学学报（自然科学版）,2006,42(5):501-505. 被引量：6
4翟林,刘亚军.支持向量机的中文文本分类研究[J].计算机与数字工程,2005,33(3):21-23. 被引量：14
5谢逸,饶文碧,段鹏飞,陈振东.基于CNN和LSTM混合模型的中文词性标注[J].武汉大学学报（理学版）,2017,63(3):246-250. 被引量：20
6周瑛,刘越,蔡俊.基于注意力机制的微博情感分析[J].情报理论与实践,2018,41(3):89-94. 被引量：44
7黄磊,杜昌顺.基于递归神经网络的文本分类研究[J].北京化工大学学报（自然科学版）,2017,44(1):98-104. 被引量：40
8胡朝举,梁宁.基于深层注意力的LSTM的特定主题情感分析[J].计算机应用研究,2019,36(4):1075-1079. 被引量：30
9彭玉青,宋初柏,闫倩,赵晓松,魏铭.基于VDCNN与LSTM混合模型的中文文本分类研究[J].计算机工程,2018,44(11):190-196. 被引量：10
10阳馨,蒋伟,刘晓玲.基于多种特征池化的中文文本分类算法[J].四川大学学报（自然科学版）,2017,54(2):287-292. 被引量：11

二级参考文献65

1高洁,吉根林.文本分类技术研究[J].计算机应用研究,2004,21(7):28-30. 被引量：36
2张爱丽,刘广利,刘长宇.基于SVM的多类文本分类研究[J].情报杂志,2004,23(9):6-7. 被引量：7
3刘华.基于关键短语的文本分类研究[J].中文信息学报,2007,21(4):34-41. 被引量：14
4Christopher JC Bulges. A Tutorial on Support Vector Machines for Pattern Recognition [J ]. Data Mining and Knowledge Discovery, 1998,2(2) :955 - 974.
5Chih - Chung Chang, Chih - Jen Lin. LIBSVM : a library for support vector machines, 2001. Software available.
6Chih- Wei Hsu, Chih- Jen Lin. A oornparison of methods for multi - class support vector machines [ J ]. IEEE Transactions on Neural Networks, 2002, 13, 415- 425.
7Andrew McCallum, Karnal Nigarn. A comparison of event models for Naive Bayes text classification[A]. In AAAI -98 Workshop on Learning for Text Categorization, 1998.
8SimonHaykin 叶世伟史忠植译.神经网络原理[M].北京:机械工业出版社,2004..
9Jiawei Han，Micheline Kamber，范明，孟小峰，等．数据挖掘概念与技术[M]．2005．157．
10Ian H．Witten，Eibe Frank．数据挖掘实用机器学习技术[M]．北京：机械工业出版社，2006

共引文献217

1马超群,杨竟澜,任奕帅,谢志斌.基于H-LSTM模型的沪深300指数价格预测研究[J].计量经济学报,2021(2):437-451. 被引量：4
2李蕾,谢旸,蒋亚飞,刘咏彬.一种用于图卷积网络的社交关系方向门控算法[J].北京邮电大学学报,2020(5):77-83. 被引量：1
3张小艳,李强.基于SVM的分类方法综述[J].科技信息,2008(28):344-345. 被引量：23
4张艳华,王海涌,郑丽英.基于支持向量机的文本分类技术研究[J].甘肃科学学报,2006,18(3):72-74. 被引量：5
5张雪英.基于机器学习的文本自动分类研究进展[J].情报学报,2006,25(6):730-739. 被引量：11
6刘秀松.带有云化核函数的SVM文本分类方法[J].科技情报开发与经济,2007,17(30):13-15. 被引量：1
7刘秀松.基于改进的SVM文本分类建模[J].情报理论与实践,2007,30(6):841-843. 被引量：7
8袁玉萍,胡亮,周志坚.基于遗传算法对支持向量机模型中参数优化[J].计算机工程与设计,2008,29(19):5016-5018. 被引量：19
9闵鹏鹏,郑诚,胡哲.基于商空间粒度的覆盖聚类算法的研究[J].计算机与现代化,2008(11):62-65. 被引量：1
10袁玉萍,邹艳华.基于支持向量机LOO误差估计的研究[J].重庆科技学院学报（自然科学版）,2009,11(4):164-165.

同被引文献110

1葛艳,郑利杰,杜军威,陈卓.基于BLSTM-Attention神经网络模型的化工事故分类[J].计算机系统应用,2020,29(10):205-210. 被引量：2
2何宇虹,黄沛杰,杜泽峰,刘威,朱建恺,章锦川.结合特殊领域实体识别的远监督话语领域分类[J].中文信息学报,2020(5):10-18. 被引量：1
3翟林,刘亚军.支持向量机的中文文本分类研究[J].计算机与数字工程,2005,33(3):21-23. 被引量：14
4张宁,贾自艳,史忠植.使用KNN算法的文本分类[J].计算机工程,2005,31(8):171-172. 被引量：98
5李文斌,刘椿年,陈嶷瑛.基于特征信息增益权重的文本分类算法[J].北京工业大学学报,2006,32(5):456-460. 被引量：19
6李荣艳,金鑫,王春辉,郑宁,别荣芳.一种新的中文文本分类算法[J].北京师范大学学报（自然科学版）,2006,42(5):501-505. 被引量：6
7刘海峰,王元元,张学仁.文本分类中一种改进的特征选择方法[J].情报科学,2007,25(10):1534-1537. 被引量：9
8李文波,孙乐,张大鲲.基于Labeled-LDA模型的文本分类新算法[J].计算机学报,2008,31(4):620-627. 被引量：103
9张永奎,李红娟.基于类别关键词的突发事件新闻文本分类方法[J].计算机应用,2008,28(B06):139-140. 被引量：11
10曾润喜,徐晓林.网络舆情突发事件预警系统、指标与机制[J].情报杂志,2009,28(11):52-54. 被引量：185

引证文献20

1朱弘扬,马海斌,葛天祎.基于卷积神经网络的高精度文本分类方法[J].电脑知识与技术,2019,15(7X):204-207.
2王孟轩,张胜,王月,雷霆,杜渂.改进的CRNN模型在警情文本分类中的研究与应用[J].应用科学学报,2020,38(3):388-400. 被引量：2
3余莉萍,梁镇麟,梁瑞宇.基于改进LSTM的儿童语音情感识别模型[J].计算机工程,2020,46(6):40-49. 被引量：11
4李梅.基于Weka平台的文本分类实验研究[J].楚雄师范学院学报,2020,35(3):115-119. 被引量：1
5张翠肖,郝杰辉,刘星宇,孙月肖.基于CNN-BiLSTM的中文微博立场分析研究[J].计算机技术与发展,2020,30(7):154-159. 被引量：6
6陶永才,刘亚培,马建红,李琳娜,石磊,卫琳.一种结合压缩激发块和CNN的文本分类模型[J].小型微型计算机系统,2020,41(9):1925-1929. 被引量：4
7胡春涛,夏玲玲,张亮,王超,韩旭.基于胶囊网络和卷积网络的文本分类对比[J].计算机技术与发展,2020,30(10):86-91. 被引量：3
8张宇昂,贾云鹏,刘家鹏.一种多特征融合的长文本分类方法[J].中国电子科学研究院学报,2020,15(9):910-916. 被引量：5
9吴汉瑜,严江,黄少滨,李熔盛,姜梦奇.用于文本分类的CNN_BiLSTM_Attention混合模型[J].计算机科学,2020,47(S02):23-27. 被引量：24
10杨春霞,李锐,秦家鹏.一种粒度融合的新闻文本主题分类模型[J].小型微型计算机系统,2020,41(11):2256-2259. 被引量：8

二级引证文献94

1周重云,李宗华,曾祥富,钟世位,马文杰.基于LSTM深度神经网络的自动移船预测控制[J].中国水运,2020(12):79-81.
2陈超,吴亚东,付朝帅,童兴,李攀,褚琦凯,王雪楠.中国白酒文化可视化研究[J].大数据,2021,7(2):78-98. 被引量：1
3刘天琪.突发事件的文本主题分类研究[J].福建电脑,2021,37(4):50-52.
4黄敏,闫思贤.基于NewTF-IDF的新闻文本特征提取算法研究[J].湖北民族大学学报（自然科学版）,2021,39(2):187-192. 被引量：6
5赵姝颖,肖宁,曾华圣,王海兮,常明芳.基于RoBerta的立场检测与趋势预测模型设计[J].应用科技,2021,48(3):27-33. 被引量：4
6张萌萌,梁艳红.补充语义信息的多特征融合模糊文本分类[J].信息技术与信息化,2021(6):45-47. 被引量：1
7黄卫春,陶自强,熊李艳.密集池化连接和短语注意力下的文本分类算法[J].科学技术与工程,2021,21(17):7193-7199. 被引量：1
8王立梅,朱旭光,汪德嘉,张勇,邢春晓.基于深度学习的民事案件判决结果分类方法研究[J].计算机科学,2021,48(8):80-85. 被引量：8
9龚维印,韦旭勤.基于BiLSTM-CNN模型的新闻文本分类[J].电脑知识与技术,2021,17(21):105-107. 被引量：1
10段云浩,武浩.基于特征表示增强的Web API推荐[J].云南大学学报（自然科学版）,2021,43(5):877-886. 被引量：1

1李珊珊,陈黎,唐裕婷,王艺霖,于中华.利用整数线性规划自动抽取多样性关键短语[J].计算机科学,2019,46(B06):56-59. 被引量：2
2顾凌云.基于多注意力的中文命名实体识别[J].信息与电脑,2019,0(9):41-44.
3Xiu-Bin Wang,Bo Han.Characteristics of Rogue Waves on a Soliton Background in the General Coupled Nonlinear Schr?dinger Equation[J].Communications in Theoretical Physics,2019,71(2):152-160.
4甘兰萍,孙通,刘津,刘木华.共线双脉冲LIBS结合变量筛选定量检测腐霉利含量[J].光谱学与光谱分析,2019,39(2):584-588. 被引量：1
5张志豪,杨文忠,袁婷婷,李东昊,王雪颖.基于LSTM神经网络模型的交通事故预测[J].计算机工程与应用,2019,55(14):249-253. 被引量：33
6吴浩,王昕璨,李欣芸,刘志芬,陈俊杰,郭浩.基于多层次模板的脑功能网络特征选择及分类[J].计算机应用,2019,39(7):1948-1953. 被引量：1
7黄迎春,左甜甜.QoS约束的代表性Skyline Web服务选择[J].火力与指挥控制,2019,44(1):141-146. 被引量：1
8Xiaomin Zhang,Yuefeng Song,Guoxiong Wang,Xinhe Bao.Co-electrolysis of CO_2 and H_2O in high-temperature solid oxide electrolysis cells: Recent advance in cathodes[J].Journal of Energy Chemistry,2017,26(5):839-853. 被引量：7
9吴爱华.滚雪球:徐杰舜学术现象述评[J].民族艺术,2019(3):15-26.
10姚朝,辛平安,施卜今,周艳平.基于LSTM时间递归神经网络的短期电力负荷预测[J].云南水力发电,2019,35(3):163-165. 被引量：7

计算机工程

2019年第7期

浏览历史

内容加载中请稍等...

基于注意力CNLSTM模型的新闻文本分类被引量：20

参考文献10

二级参考文献65

共引文献217

同被引文献110

引证文献20

二级引证文献94

相关作者

相关机构

相关主题

浏览历史

基于注意力CNLSTM模型的新闻文本分类 被引量：20

参考文献10

二级参考文献65

共引文献217

同被引文献110

引证文献20

二级引证文献94

相关作者

相关机构

相关主题

浏览历史

基于注意力CNLSTM模型的新闻文本分类被引量：20