词句协同排序的自动摘要算法被引量：5

Automatic summarization algorithm based on word-sentence co-ranking

下载PDF

导出

摘要为了提高自动摘要的质量,研究了基于图模型的词句协同排序的自动摘要算法技术.自动摘要试图从原始文本中提取一定数量的重要句子形成节录式摘要,句排序是实现自动摘要的典型手段,已有工作大多通过构建词或句关联网络,再使用PageRank计算节点排序分值,该算法考虑词与句之间的互影响,提出词句协同排序的自动摘要算法,在句关联网络上融入词对句子排序分值的影响,而词的重要性由包含其句子的排序分值所决定.在句排序结果基础上,提出基于冗余度的句选择方法,以进一步提升自动摘要质量.在10篇中文文档上的试验结果表明,较之于单纯的句排序方法,所提出方法能有效提升自动摘要的准确率和召回率. To improve the quality of automatic summarization,the graph-based word-sentence co-ranking method was investigated. Automatic summarization aims to extract a number of sentences from original document to form the so-called extractive summary. Sentence ranking is one of the typical techniques for automatic summarization. Existing studies commonly construct a network of words or sentences and employ PageRank to obtain the ranking scores. Based on the interaction between word and sentence,a novel word-sentence co-ranking method was proposed for automatic summarization. The importance of words was incorporated into the ranking process on the network of sentences,while the weight of every word was determined by all sentences containing the word. Based on redundancy,a sentence selection method was presented for further improving the quality of auto-generated summary. The experimental results on ten Chinese documents demonstrate that compared with the ranking method only on sentence network,the proposed method can significantly improve the precision and recall rate of automatic summaries.

作者陈晨张璐伍之昂

机构地区南京财经大学信息工程学院南京财经大学江苏省电子商务重点实验室

出处《江苏大学学报（自然科学版）》 EI CAS CSCD 北大核心 2016年第4期443-449,共7页 Journal of Jiangsu University：Natural Science Edition

基金国家科技支撑计划项目(2013BAH16F01) 国家电子商务信息处理联合研究中心项目(2013B01035) 江苏省高校自然科学基金资助项目(15KJB520012)

关键词自动摘要单文本文摘节录式摘要词句协同排序 PAGERANK automatic summarization summary of single-document extractive summary word-sentence co-ranking PageRank

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1张云涛,龚玲,王永成.基于综合方法的文本主题句的自动抽取[J].上海交通大学学报,2006,40(5):771-774. 被引量：16
2李波,石慧霞,王毅.一种基于同义词发现的文本扩充算法[J].重庆理工大学学报（自然科学）,2014,28(2):76-81. 被引量：4

二级参考文献27

1董振东.[EB/OL].知网http://www.keenage.com,1999.
2Sunayama W, Yachida M. Panoramic view system for extracting key sentences based on viewpoints and application to a search engine[J]. Journal of Network and Computer Applications, 2005, 28(2):115 - 127.
3Halteren H V. New feature sets for summarization by sentence extraction[J]. IEEE Intelligent Systems,2003, 18(4):34-42.
4Morris A, Kasper G, Adams D. The effects and limitations of automated text condensing on reading comprehension performance [J]. Information Systems Research, 1992, 3(1):17-35.
5Goldstein J, Kantrowitz M, Mittal V, et al.Summarizing text documents: Sentence selection and cvaluation metrics[C]// Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. Berkeley, CA:ACM, 1999:121-128.
6Jing H, Barzily R, McKeown K, etal. Summarization evaluation methods experiments and analysis[C]//AAAI Intelligent Text Summarization Workshop. Stanford, CA: AAAI, 1998:60-68.
7Crammer K, Gentile C. Multiclass classification with ban- dit feedback using adaptive regularization [ J ]. Machine Learning,2013,90:357 - 383.
8Wenbin Zheng, Lixin An, Zhanyi Xu. Dimensionality Re- duction by Combining Category Information and Latent Semantic Index for Text Categorization [ J]. Journal of In- formation & Computational Science, 2013,10 ( 8 ) : 2463 - 2469.
9Bin Zhang, Alex Marin, Brian Hutchinson. Learning Phrase Patterns for Text Classification [ J ]. IEEE Trans- actions on audio, speech, and language processing,2013, 21 (6) :1180 - 1189.
10Baccianella S, Esuli A, Sebastiani F. Using micro-docu- ments for feature selection: The case of ordinal text classi- fication [ J ]. Expert Systems with Applications, 2013,40 : 4687 - 4696.

共引文献18

1何维,王宇.基于句子关系图的网页文本主题句抽取[J].现代图书情报技术,2009(3):57-61. 被引量：9
2杜文洁.用于化学文摘生成的压缩算法[J].计算机与应用化学,2010,27(2):249-252.
3段晓丽,王宇.基于主题分割与PageRank算法的文本主题抽取[J].现代图书情报技术,2010(12):34-39. 被引量：2
4孔胜,王宇.基于句子相似度的文本主题句提取算法研究[J].情报学报,2011,30(6):605-609. 被引量：12
5王力,李培峰,朱巧明.一种基于LDA模型的主题句抽取方法[J].计算机工程与应用,2013,49(2):160-164. 被引量：10
6何琳,常颖聪.不同标引策略下的文本主题表达质量比较研究[J].图书馆杂志,2014,33(5):29-33. 被引量：2
7李然,张华平,赵燕平,商建云.基于主题模型与信息熵的中文文档自动摘要技术研究[J].计算机科学,2014,41(B11):298-300. 被引量：7
8黄庆宇,卢珞先.基于数据世系的微博信息管理与检索算法研究[J].计算机科学,2015,42(10):198-201. 被引量：1
9杨春艳,潘有能,赵莉.基于语义和引用加权的文献主题提取研究[J].图书情报工作,2016,60(9):131-138. 被引量：9
10阿力甫.阿不都克里木,李晓.基于TextRank算法和互信息相似度的维吾尔文关键词提取及文本分类[J].计算机科学,2016,43(12):36-40. 被引量：8

同被引文献79

1赵沁平.虚拟现实综述[J].中国科学（F辑:信息科学）,2009,39(1):2-46. 被引量：663
2陈燕敏,王晓龙,刘远超,楼喜中.一种基于文章主题和内容的自动摘要方法[J].计算机工程与应用,2004,40(33):11-14. 被引量：12
3莫燕,王永成.中文文献摘要的自动编制[J].现代图书情报技术,1993(3):10-12. 被引量：15
4王永成.自动编制文献摘要及知识的自动提取[J].现代图书情报技术,1993(3):13-13. 被引量：1
5黄水清,李志燕,梁刚.面向计算机类文献的自动摘要系统的研究与实现[J].图书与情报,2006(3):93-97. 被引量：1
6官礼和.Internet网络新闻文本自动摘要的研究[J].计算机工程与设计,2007,28(14):3518-3520. 被引量：9
7李文航,龚建华,张利辉,周洁萍.面向移动的协同虚拟地理研讨室[J].武汉大学学报（信息科学版）,2007,32(9):817-820. 被引量：6
8王永成,许慧敏.OA中文文献自动摘要系统[J].情报学报,1997,16(2):128-132. 被引量：26
9陈启祥,王长顺.网络游戏引擎中的同步技术研究[J].软件导刊,2009,8(3):100-102. 被引量：3
10王知津.基于句子选择的自动文本摘要方法及其评价[J].现代图书情报技术,1998(1):46-51. 被引量：2

引证文献5

1梁媛,王东波,黄水清.面向人民日报语料的新闻自动摘要生成[J].知识管理论坛,2022(4):452-464. 被引量：1
2徐小龙,杨春春.一种基于主题聚类的多文本自动摘要算法[J].南京邮电大学学报（自然科学版）,2018,38(5):70-78. 被引量：7
3吴云,杨长春,梅佳俊,顾寰.词句协同自动摘要提取方法[J].计算机工程与设计,2018,39(9):2776-2779. 被引量：2
4邓可君,华凯,邓昌明,姜宁,袁玲,彭一明,张治坤.基于机器学习的论文作者名消歧方法研究[J].四川大学学报（自然科学版）,2019,56(2):241-245. 被引量：8
5王学勇,邹蕾,崔斌.基于VR技术的跨部门协同虚拟研讨空间系统[J].中国管理信息化,2022,25(1):163-168. 被引量：2

二级引证文献20

1梁媛,王东波,黄水清.面向人民日报语料的新闻自动摘要生成[J].知识管理论坛,2022(4):452-464. 被引量：1
2周国民,宣鑫乐,沈佳琪,陈光宣.基于实体关联的消歧算法研究[J].中国电子科学研究院学报,2020,15(3):271-277. 被引量：2
3潘晓英,伍哲,陈柳,杨芳.基于WBLDA的学术文献摘要主题聚类[J].计算机应用研究,2020,37(8):2273-2278. 被引量：1
4沈喆,王毅,姚毅凡,成颖.面向学术文献的作者名消歧方法研究综述[J].数据分析与知识发现,2020,4(8):15-27. 被引量：10
5宋明,李超,何明,徐吉兵.基于聚类与深度学习的自监督文本摘要方法[J].通讯世界,2020,27(12):237-238.
6谭金源,刁宇峰,祁瑞华,林鸿飞.基于BERT-PGN模型的中文新闻文本自动摘要生成[J].计算机应用,2021,41(1):127-132. 被引量：12
7陈红.基于事件时序关系的自动摘要抽取[J].盐城工学院学报（自然科学版）,2021,34(1):31-35.
8王进,陈瑀,孙开伟.基于梯度提升的多标签分类器链方法[J].江苏大学学报（自然科学版）,2021,42(3):309-317. 被引量：3
9林克柔,王昊,龚丽娟,张宝隆.融合多特征的中文论文同名学者消歧研究[J].数据分析与知识发现,2021,5(4):90-102. 被引量：3
10牛太冬,靳达森,张海若,张宪帅.基于机器学习的论文评分研究[J].信息与电脑,2021,33(11):54-56.

1郁建中.运行软件时内存不足的解决办法(节录)[J].金陵职业大学学报,2000,15(3):16-17.
2一笑.采访日立环球存储科技公司设计中心总监Bjarne Thuesen先生(节录)[J].电视技术,2005(10):58-58.
3闫智飞.网络视频轻松“节录”[J].电脑爱好者,2017,0(3):41-42.
4庆如.信息化改变一切[J].电器工厂设计,2001,22(2):27-31.
5鲁宇红.计算机数据管理系统与智能仪表的数据传输(节录)[J].金陵职业大学学报,2000,15(3):14-16.
6寇苏玲,蔡庆生.应用于用户兴趣建模的多文本关键词抽取研究[J].计算机仿真,2007,24(2):103-105. 被引量：2
7王伟.深耕金融谋发展 2009年《金融电子化》联络站会议发言节录[J].金融电子化,2009(10):14-14.
8李石养,陈忠惠.“泛珠房博会”高峰论坛精彩言论[J].广东建设信息,2005(12):8-10.
9宋金歌,杨景,陈平,佘玉梅.一种非负矩阵分解的快速稀疏算法[J].云南民族大学学报（自然科学版）,2011,20(4):262-266. 被引量：5
10谢浩,孙伟.基于段落-句子互增强的自动文摘算法[J].计算机科学,2013,40(11A):246-250. 被引量：3

江苏大学学报（自然科学版）

2016年第4期

浏览历史

内容加载中请稍等...

词句协同排序的自动摘要算法被引量：5

参考文献2

二级参考文献27

共引文献18

同被引文献79

引证文献5

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

词句协同排序的自动摘要算法 被引量：5

参考文献2

二级参考文献27

共引文献18

同被引文献79

引证文献5

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

词句协同排序的自动摘要算法被引量：5