基于词项—句子—文档三层图模型的多文档自动摘要被引量：6

Multi-Document Summarization Based on the Term-Sentence-Document Tri-layer Graph Model

下载PDF

导出

摘要应用图模型来研究多文档自动摘要是当前研究的一个热点,它以句子为顶点,以句子之间相似度为边的权重构造无向图结构。由于此模型没有充分考虑句子中的词项权重信息以及句子所属的文档信息,针对这个问题,该文提出了一种基于词项—句子—文档的三层图模型,该模型可充分利用句子中的词项权重信息以及句子所属的文档信息来计算句子相似度。在DUC2003和DUC2004数据集上的实验结果表明,基于词项—句子—文档三层图模型的方法优于LexRank模型和文档敏感图模型。 Graph model has been widely applied to document summarization by using sentence as the graph nodes, and the similarity between sentences as the weights of edge. However, the knowledge of terms and documents are neglected in this model. In this paper, we propose a tri-layer graph model based on the term, the sentence and the documentto make full use of knowledge when computing the similarity of sentences. The experimental results on the data sets of DUC＇2003 and DUC＇2004 show that the proposed model outperforms the state-of-the-art LexRank model and Document Sensitive Ranking model.

作者熊娇王明文李茂西万剑怡

机构地区江西师范大学计算机信息工程学院

出处《中文信息学报》 CSCD 北大核心 2014年第6期201-207,共7页 Journal of Chinese Information Processing

基金国家自然科学基金(61272212 61163006 61203313)

关键词图模型多文档自动摘要句子相似度词项—句子— 文档图 graph model multi-document summarization the similarity of sentences term-sentence-document graph

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1秦兵,刘挺,李生.多文档自动文摘综述[J].中文信息学报,2005,19(6):13-20. 被引量：51
2刘挺,王开铸.自动文摘的四种主要方法[J].情报学报,1999,18(1):10-19. 被引量：55
3纪文倩,李舟军,巢文涵,陈小明.一种基于LexRank算法的改进的自动文摘系统[J].计算机科学,2010,37(5):151-154. 被引量：15
4Heng CHEN Hai JIN Feng ZHAO.PSG： a two-layer graph model for document summarization[J].Frontiers of Computer Science,2014,8(1):119-130. 被引量：2

二级参考文献95

1苏海菊,王永成.中文科技文献文摘的自动编写[J].情报学报,1989,8(6):433-439. 被引量：26
2莫燕,王永成.中文文献摘要的自动编制[J].现代图书情报技术,1993(3):10-12. 被引量：15
3秦兵 LiuTing LiSheng.Summarization based on physical features and logical structure of multi documents[J].High Technology Letters,2005,11(2):133-136. 被引量：2
4李明.从字频统计出发的中文文摘自动编写[J].现代图书情报技术,1996(3):42-45. 被引量：20
5Luhn H P. The Automatic Creation of Literature Abstracts[J]. IBM Journal of Research and Development, 1958 : 159-165.
6Edmundson W. Automatic Abstracting and Indexing:Survey and Recommendations[J]. Communication of the ACM, 1961,4 (5): 226-234.
7Edmundson W. New methods in automatic abstracting [J].Journal of the Association for Computing Machinery, 1996,16(2): 264-285.
8Pollock J J, Zamora A. Automatic Abstracting Research at Chemical Abstracts Service[J]. Journal of Chemical Information and Computer Sciences, 1975,15(4) : 226-232.
9Paice C D. The Automatic Generation of Literature Abstracts: An Approach Based on the Identification of Self-indicating Phrases[J]. Information Retrieval Research.
10Schank C, Abelson P. Scripts, Plans, Goals, and Understanding: An Inquiry into Human Knowledge Structures[M]. Hillsdale, New Jersey: Lawrence Erlbaum Associates, 1977.

共引文献112

1梁媛,王东波,黄水清.面向人民日报语料的新闻自动摘要生成[J].知识管理论坛,2022(4):452-464. 被引量：1
2刘茂福,李淑君,金可佳,张晓龙.多文档自动文摘中的特征组合优化[J].计算机系统应用,2008,17(8):59-63. 被引量：3
3郭庆琳,樊孝忠.基于文本聚类和NLU的自动文摘系统的研究与实现[J].现代电力,2004,21(4):76-80. 被引量：1
4金旭,杨炳儒,菅志刚.自动文摘方法分析[J].计算机应用研究,2004,21(9):5-6. 被引量：8
5王志琪,王永成,刘传汉.论自动文摘及其分类[J].情报学报,2005,24(2):214-221. 被引量：2
6郭庆琳,樊孝忠,柳长安.文本聚类在自动文摘中的应用研究[J].计算机应用,2005,25(5):1036-1038. 被引量：4
7郭庆琳,樊孝忠,柳长安.基于文本聚类和NLU的自动文摘研究[J].北京理工大学学报,2005,25(8):705-709. 被引量：1
8尹存燕,戴新宇,陈家骏.Internet上文本的自动摘要技术[J].计算机工程,2006,32(3):88-90. 被引量：13
9董建设,任丽,周燕玲.中文自动文摘在搜索引擎中的应用[J].情报科学,2006,24(2):267-269. 被引量：2
10郭庆琳,樊孝忠,柳长安.基于文本聚类的自动文摘系统的研究与实现[J].计算机工程,2006,32(4):30-32. 被引量：8

同被引文献87

1陈燕敏,王晓龙,刘远超,楼喜中.一种基于文章主题和内容的自动摘要方法[J].计算机工程与应用,2004,40(33):11-14. 被引量：12
2莫燕,王永成.中文文献摘要的自动编制[J].现代图书情报技术,1993(3):10-12. 被引量：15
3王永成.自动编制文献摘要及知识的自动提取[J].现代图书情报技术,1993(3):13-13. 被引量：1
4秦兵,刘挺,李生.多文档自动文摘综述[J].中文信息学报,2005,19(6):13-20. 被引量：51
5黄水清,李志燕,梁刚.面向计算机类文献的自动摘要系统的研究与实现[J].图书与情报,2006(3):93-97. 被引量：1
6官礼和.Internet网络新闻文本自动摘要的研究[J].计算机工程与设计,2007,28(14):3518-3520. 被引量：9
7赵妍妍,秦兵,车万翔,刘挺.中文事件抽取技术研究[J].中文信息学报,2008,22(1):3-8. 被引量：106
8王永成,许慧敏.OA中文文献自动摘要系统[J].情报学报,1997,16(2):128-132. 被引量：26
9王知津.基于句子选择的自动文本摘要方法及其评价[J].现代图书情报技术,1998(1):46-51. 被引量：2
10纪文倩,李舟军,巢文涵,陈小明.一种基于LexRank算法的改进的自动文摘系统[J].计算机科学,2010,37(5):151-154. 被引量：15

引证文献6

1梁媛,王东波,黄水清.面向人民日报语料的新闻自动摘要生成[J].知识管理论坛,2022(4):452-464. 被引量：1
2李江龙,吕学强,周建设,刘秀磊.金融领域的事件句抽取[J].计算机应用研究,2017,34(10):2915-2918. 被引量：6
3王玮,欧阳纯萍,阳小华,罗凌云,刘志明.融合句子情感和主题相似性的中文新闻文本情感摘要[J].计算机应用研究,2017,34(12):3543-3546. 被引量：4
4荀静,杨玉珍.基于TextRank的文本情感摘要提取方法[J].计算机应用与软件,2018,35(10):80-84. 被引量：8
5吴云,杨长春,梅佳俊,顾寰.词句协同自动摘要提取方法[J].计算机工程与设计,2018,39(9):2776-2779. 被引量：2
6孙旭,沈彬,严馨,张金鹏,徐广义.基于Transformer和TextRank的微博观点摘要方法[J].广西师范大学学报（自然科学版）,2023,41(4):96-108.

二级引证文献21

1梁媛,王东波,黄水清.面向人民日报语料的新闻自动摘要生成[J].知识管理论坛,2022(4):452-464. 被引量：1
2杨毅.基于句子聚类的中文文本自动摘要算法的研究[J].微型电脑应用,2017,33(8):54-56. 被引量：1
3荀静,杨玉珍.基于TextRank的文本情感摘要提取方法[J].计算机应用与软件,2018,35(10):80-84. 被引量：8
4郑国伟,吕学强,夏红科,周建设.基于LSTM的金融新闻倾向性[J].计算机工程与设计,2018,39(11):3462-3467. 被引量：4
5王庆福.智能化校园国内外现状研究[J].科学大众（科技创新）,2018,0(8):15-16.
6徐雷,潘珺.事件表示方式及其语义表示模型研究[J].情报杂志,2019,38(6):159-167. 被引量：14
7黄宗财,仇培元,陆锋,吴升.基于联合主题特征的网络新闻文本蕴含环境污染事件检测[J].地球信息科学学报,2019,21(10):1510-1517. 被引量：5
8毛瑞彬,吕华揆,朱菁.上市公司公告篇章级信息抽取框架与实现[J].情报科学,2019,37(11):73-78. 被引量：3
9Shengli Zhou,Xin Wang,Zerui Yang.Monitoring and Early Warning of New Cyber-Telecom Crime Platform Based on BERT Migration Learning[J].China Communications,2020,17(3):140-148. 被引量：6
10陶兴,张向先,郭顺利,张莉曼.学术问答社区用户生成内容的W2V-MMR自动摘要方法研究[J].数据分析与知识发现,2020,4(4):109-118. 被引量：8

1刘德喜,何炎祥,姬东鸿,杨华.基于基本要素向量空间的英文多文档自动摘要[J].计算机工程,2007,33(14):166-167. 被引量：2
2仇丽青,李伟明.上下文敏感的多文档自动摘要生成方法[J].计算机工程,2010,36(21):265-266.
3邵洲,张晖.基于完全稀疏主题模型的多文档自动摘要[J].计算机工程与设计,2014,35(3):1032-1036. 被引量：1
4罗毅辉,熊曙初.一种集成框架下的分布式多文档自动摘要方法[J].情报杂志,2013,32(11):133-136. 被引量：3
5仇丽青,刘瑞,张辉.基于词频统计的多文档自动摘要生成方案[J].微计算机信息,2009,25(6):181-182. 被引量：4
6刘茂福,余博,胡慧君.基于维基百科的多文档自动摘要系统研究[J].微型机与应用,2011,30(16):89-91.
7刘德荣 ,王永成 ,刘传汉 .基于主题概念的多文档自动摘要研究[J].情报学报,2005,24(1):69-74. 被引量：7
8纪文倩,李舟军,巢文涵,陈小明.一种基于LexRank算法的改进的自动文摘系统[J].计算机科学,2010,37(5):151-154. 被引量：15
9安玲.一种基于测地距离的多文档自动摘要方法[J].林区教学,2014,0(9):91-93.
10张晗,赵玉虹.基于Clique聚类的精神分裂症多文档自动摘要研究[J].中华医学图书情报杂志,2016,25(3):18-24. 被引量：1

中文信息学报

2014年第6期

浏览历史

内容加载中请稍等...

基于词项—句子—文档三层图模型的多文档自动摘要被引量：6

参考文献4

二级参考文献95

共引文献112

同被引文献87

引证文献6

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于词项—句子—文档三层图模型的多文档自动摘要 被引量：6

参考文献4

二级参考文献95

共引文献112

同被引文献87

引证文献6

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

基于词项—句子—文档三层图模型的多文档自动摘要被引量：6