融合BERT和卷积门控的生成式文本摘要方法被引量：5

An abstractive text summarization method combining BERT and convolutional gating unit

导出

摘要结合注意力机制的循环神经网络(RNN)模型是目前主流的生成式文本摘要方法,采用基于深度学习的序列到序列框架,但存在并行能力不足或效率低的缺陷,并且在生成摘要的过程中存在准确率低和重复率高的问题.为解决上述问题,提出一种融合BERT预训练模型和卷积门控单元的生成式摘要方法.该方法基于改进Transformer模型,在编码器阶段充分利用BERT预先训练的大规模语料,代替RNN提取文本的上下文表征,结合卷积门控单元对编码器输出进行信息筛选,筛选出源文本的关键内容;在解码器阶段,设计3种不同的Transformer,旨在探讨BERT预训练模型和卷积门控单元更为有效的融合方式,以此提升文本摘要生成性能.实验采用ROUGE值作为评价指标,在LCSTS中文数据集和CNN/Daily Mail英文数据集上与目前主流的生成式摘要方法进行对比的实验,结果表明所提出方法能够提高摘要的准确性和可读性. The recurrent neural network(RNN)model combined with the attention mechanism is the current mainstream abstractive text summarization method,which uses a sequence-to-sequence framework based on deep learning.However,the abstractive summarization model based on the RNN has insufficient parallel ability or performance defects of longterm dependence,and the problem of low accuracy and high repetition rate in the process of generating summary.In order to overcome these problems,an abstractive summarization model method combining the BERT pre-training model and the convolutional gating unit is proposed based on the improved Transformer model.In the encoder stage,it makes full use of the large-scale corpus pre-trained by the BERT to replace the RNN to extract the contextual representation of the text,and then combines the convolutional gating unit to filter the output of the encoder to filter out the source text.In the decoder stage,three different Transformers are designed,for exploring a more effective fusion method of the BERT pre-training model and convolutional gating unit to improve the performance of text summarization.The ROUGE value is used as the evaluation index in the experiments.The experimental results on the LCSTS Chinese dataset and CNN/Daily Mail dataset show that the proposed method improves the accuracy and readability of the abstract.

作者邓维斌李云波张一明王国胤朱坤 DENG Wei-bin;LI Yun-bo;ZHANG Yi-ming;WANG Guo-yin;ZHU Kun(Chongqing Key Laboratory of Computational Intelligence,Chongqing University of Posts and Telecommunications,Chongqing 400065,China;78111 Troops of People's Liberation Army of China,C Chengdu 610031,China)

机构地区重庆邮电大学计算智能重庆市重点实验室中国人民解放军

出处《控制与决策》 EI CSCD 北大核心 2023年第1期152-160,共9页 Control and Decision

基金国家研发计划项目(2018YFC0832100,2018YFC0832102) 国家自然科学基金重点项目(61936001) 国家自然科学基金项目(61876027) 重庆市自然科学基金创新群体科学基金项目(cstc2019jcyj-cxttX0002)。

关键词生成式文本摘要序列到序列预训练模型卷积门控单元信息筛选 Transformer模型 the abstractive summarization sequence-to-sequence pre-training model convolution gating unit filter Transformer model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1吴仁守,王红玲,王中卿,周国栋.全局自匹配机制的短文本摘要生成方法[J].软件学报,2019,30(9):2705-2717. 被引量：13
2田珂珂,周瑞莹,董浩业,印鉴.基于编码器共享和门控网络的生成式文本摘要方法[J].北京大学学报（自然科学版）,2020,56(1):61-67. 被引量：6

共引文献15

1邹德芳,胡秦斌.基于树到串模型强化的神经机器翻译模型构建[J].计算机仿真,2021,38(2):344-347. 被引量：3
2许柏炎,蔡瑞初,梁智豪.一种用于代码注释自动生成的语法辅助复制机制[J].计算机工程,2021,47(4):92-99. 被引量：3
3蓝雯飞,周伟枭,许智明,朱容波,罗一凡.基于混合过滤编码的神经中文生成式摘要[J].中南民族大学学报（自然科学版）,2021,40(3):305-311.
4谭金源,刁宇峰,杨亮,祁瑞华,林鸿飞.基于BERT-SUMOPN模型的抽取-生成式文本自动摘要[J].山东大学学报（理学版）,2021,56(7):82-90. 被引量：10
5邹蕾,崔斌,樊超,孙豫峰.基于双向编码文本摘要-长短期记忆-注意力的检察建议文本自动生成模型[J].科学技术与工程,2021,21(25):10780-10788. 被引量：9
6梁梦英,李德玉,王素格,廖健,郑建兴,陈千.Senti-PG-MMR:多文档游记情感摘要生成方法[J].中文信息学报,2022,36(3):128-135. 被引量：3
7徐正祥,王英,汪洪吉,王鑫.基于特征加强的异构网络潜在摘要模型[J].计算机科学与探索,2022,16(11):2537-2546. 被引量：1
8魏鹏飞,曾碧,汪明慧,曾安.基于深度学习的口语理解联合建模算法综述[J].软件学报,2022,33(11):4192-4216. 被引量：8
9赵伟,王文娟,任彦凝,刘群,胥钟予,彭露.基于改进Transformer的生成式文本摘要模型[J].重庆邮电大学学报（自然科学版）,2023,35(1):185-192. 被引量：6
10张翔,毛兴静,赵容梅,琚生根.融入全局信息的抽取式摘要研究[J].计算机科学,2023,50(4):188-195. 被引量：2

同被引文献31

1Yong Bie,Yan Yang.A Multitask Multiview Neural Network for End-to-End Aspect-Based Sentiment Analysis[J].Big Data Mining and Analytics,2021,4(3):195-207. 被引量：5
2张琼.加强图书网络营销的途径[J].科技与出版,2012(6):78-79. 被引量：5
3张玲.新媒体技术环境下图书馆宣传推广策略[J].图书情报工作,2015,59(1):78-81. 被引量：64
4郭艳卿,赵锐,孔祥维,付海燕,蒋金平.基于事件要素加权的新闻摘要提取方法[J].计算机科学,2016,43(1):237-241. 被引量：9
5林萌,罗森林,贾丛飞,韩磊,原玉娇,潘丽敏.融合句义结构模型的微博话题摘要算法[J].浙江大学学报（工学版）,2015,49(12):2316-2325. 被引量：5
6李阳辉,谢明,易阳.基于深度学习的社交网络平台细粒度情感分析[J].计算机应用研究,2017,34(3):743-747. 被引量：31
7刘彼洋,孙锐,姬东鸿.基于矩阵分解和子模最大化的微博新闻摘要方法[J].计算机应用研究,2017,34(10):2892-2896. 被引量：5
8沈华东,彭敦陆.AM-BRNN:一种基于深度学习的文本摘要自动抽取模型[J].小型微型计算机系统,2018,39(6):1184-1189. 被引量：19
9刘争.公共图书馆图书宣传工作的困惑与策略[J].办公室业务,2019,0(12):57-58. 被引量：1
10吴仁守,王红玲,王中卿,周国栋.全局自匹配机制的短文本摘要生成方法[J].软件学报,2019,30(9):2705-2717. 被引量：13

引证文献5

1李岱峰,林凯欣,李栩婷.基于提示学习与T5 PEGASUS的图书宣传自动摘要生成器[J].数据分析与知识发现,2023,7(3):121-130. 被引量：6
2崔少国,王奥迪,杜兴.融合流注意力机制的中文摘要生成方法[J].小型微型计算机系统,2023,44(12):2685-2691.
3甘陈敏,唐宏,杨浩澜,刘小洁,刘杰.融合卷积收缩门控的生成式文本摘要方法[J].计算机工程,2024,50(2):98-104.
4徐健,张婧,宋玲钰,高原源.基于RoBERTa-BiLSTM-CRF融合模型的在线评论细粒度情感分析[J].系统工程理论与实践,2023,43(12):3519-3535. 被引量：1
5李继同,高泽明,田野,王文东,蒋林涛.意图驱动的自治网络关键技术[J].信息通信技术,2024,18(4):31-36.

二级引证文献7

1庞春艳,郑虹.基于关键词抽取和提示学习的生成式文本摘要生成方法[J].长春工业大学学报,2023,44(5):461-467.
2张琪,范永胜.基于改进T5 PEGASUS模型的新闻文本摘要生成[J].电子科技,2023,36(12):72-78. 被引量：5
3罗佳,李萌.基于BiLSTM-CRF模型的房屋出租App系统的设计与实现[J].软件,2024,45(1):18-20.
4安波,赵维纳,龙从军.基于提示学习的低资源藏文文本分类[J].中文信息学报,2024,38(2):70-78.
5安波.基于提示学习的小样本文献分类方法[J].图书馆论坛,2024,44(5):96-104. 被引量：1
6李红莲,陈浩天,张乐,吕学强,田驰.融合情感-主题双通道信息的评论摘要生成模型[J].数据分析与知识发现,2024,8(6):30-43. 被引量：1
7李准,宋媚,祝义.基于两阶段网络和提示学习的少样本中文命名实体识别[J].南京邮电大学学报（自然科学版）,2024,44(5):87-94.

1王定美,张睿骁,赵龙.基于MMoE-TCN的综合能源系统短期多元负荷预测[J].电气传动自动化,2023,45(1):39-45. 被引量：2
2骆欣,纪颖.结合内容特征提取和弹幕文本的短视频推荐模型构建及仿真[J].自动化与仪器仪表,2023(1):42-47.
3陈士同.把握文本,从材料中寻找解题密码--以2022年高考真题为例谈论述类文本的备考[J].学语文,2023(1):49-51.
4苏琦,王红玲,王中卿.基于预训练模型的无监督剧本摘要[J].计算机科学,2023,50(2):310-316. 被引量：1
5胡德敏,光萍.基于Transformer的融合用户负反馈的重排序推荐方法[J].智能计算机与应用,2022,12(12):196-201. 被引量：1
6陈渐伟,于传强,刘志浩,唐圣金,张志浩,舒洪斌.多轴特种车辆的数据建模方法及横向动力学应用[J].兵工学报,2023,44(1):165-175. 被引量：1
7肖蕾蕾,史二娜.基于PLC的模糊控制在轨道交通中的应用研究[J].自动化与仪器仪表,2023(1):75-79. 被引量：2
8杨振宇,王磊,马博,杨雅婷,董瑞,艾孜麦提·艾瓦尼尔,王震.一种针对维汉的跨语言远程监督方法[J].计算机工程,2023,49(2):271-278.
9邓露,胡珀,李炫宏.知识增强的生物医学文本生成式摘要研究[J].数据分析与知识发现,2022,6(11):1-12. 被引量：2
10李刚,余正涛,黄于欣.案件要素异构图的舆情新闻抽取式摘要[J].计算机工程与应用,2023,59(4):112-119.

控制与决策

2023年第1期

浏览历史

内容加载中请稍等...

融合BERT和卷积门控的生成式文本摘要方法被引量：5

参考文献2

共引文献15

同被引文献31

引证文献5

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

融合BERT和卷积门控的生成式文本摘要方法 被引量：5

参考文献2

共引文献15

同被引文献31

引证文献5

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

融合BERT和卷积门控的生成式文本摘要方法被引量：5