自动文摘的方法研究被引量：3

Research of Automatic Summarization Methods

下载PDF

导出

摘要文中总结了自动文摘的主要研究方法和策略并把方法分成了三大类:自动摘录、基于信息抽取的自动文摘和基于理解的自动文摘。自动摘录方法是从文章中抽取重要句子来形成文摘;基于信息抽取的文摘方法是用从文章中抽取的信息填充已经编好的框架,然后用模板将内容输出;基于理解的文摘方法是利用自然语言处理技术生成文摘。文中重点总结了单主题文章和多主题文章的自动摘录方法,在多种算法进行优缺点比较后提出了一种新的多主题划分方法。 It summarizes the main automatic abstracting research methods and strategies and divides the methods into three major categories： automatically extracted summarization,automatic summarization based on information extraction and summarization based on understanding.Automatically extracted method uses that extract important sentences from the article to form a digest;Abstract based on information extraction method uses that extract information from the article to fill framework which has been prepared,and then use the template to output the content;Abstract based on understanding is to use natural language processing technology to generate abstracts.focuses on automatically extracted summarization from single theme articles and multi-topic articles.After comparing advantages and disadvantages of variety of algorithms,a new multi-topic classification method is proposed.

作者卫佳君宋继华

机构地区北京师范大学信息科学与技术学院

出处《计算机技术与发展》 2011年第8期188-191,共4页 Computer Technology and Development

基金国家社科基金项目(05BYY022)

关键词句子权值相似度关联网络词频聚类主题划分 sentence weights similarity association networks word frequency cluster topic segmentation

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1陶余会,周水庚,关佶红.一种基于文本单元关联网络的自动文摘方法[J].模式识别与人工智能,2009,22(3):440-444. 被引量：5
2郭庆琳,樊孝忠,柳长安.文本聚类在自动文摘中的应用研究[J].计算机应用,2005,25(5):1036-1038. 被引量：4
3刘挺,吴岩,王开铸.基于信息抽取和文本生成的自动文摘系统设计[J].情报学报,1997,16(S1):31-36. 被引量：13
4刘挺,王开铸.自动文摘的四种主要方法[J].情报学报,1999,18(1):10-19. 被引量：55
5王萌,何婷婷,姬东鸿,王晓荣.基于HowNet概念获取的中文自动文摘系统[J].中文信息学报,2005,19(3):87-93. 被引量：22
6杨建林.一种使用自动聚类思想的自动文摘方法[J].情报学报,2001,20(5):532-536. 被引量：7
7纪文倩,李舟军,巢文涵,陈小明.一种基于LexRank算法的改进的自动文摘系统[J].计算机科学,2010,37(5):151-154. 被引量：15
8柴晓丽,张丽伟,管玉玲.基于HowNet自动文摘的研究[J].电脑编程技巧与维护,2009(S1):164-165. 被引量：1
9傅间莲,陈群秀.自动文摘系统中的主题划分问题研究[J].中文信息学报,2005,19(6):28-35. 被引量：13
10王志琪,王永成,刘传汉.基于互增强关系的自动文摘句子加权方法[J].上海交通大学学报,2007,41(8):1297-1300. 被引量：6

二级参考文献85

1苏海菊,王永成.中文科技文献文摘的自动编写[J].情报学报,1989,8(6):433-439. 被引量：25
2莫燕,王永成.中文文献摘要的自动编制[J].现代图书情报技术,1993(3):10-12. 被引量：15
3秦兵 LiuTing LiSheng.Summarization based on physical features and logical structure of multi documents[J].High Technology Letters,2005,11(2):133-136. 被引量：2
4李明.从字频统计出发的中文文摘自动编写[J].现代图书情报技术,1996(3):42-45. 被引量：20
5Erkan G, Radev D R. LexRank: Graph-Based Lexical Centrality as Salience in Text Summarization. Journal of Artificial Intelligence Research, 2004, 22 : 457 - 479.
6Luhn H P. The Automatic Creation of Literature Abstracts. IBM Journal of Research and Development , 1958, 2(2) : 159 -165.
7Edmundson H P. New Methods in Automatic Abstracting. Journal of the ACM, 1969, 16(2):264-285.
8Barzilay R, Elhadad M. Using Lexical Chains for Text Summarization // Mani I, Maybury M T, eds. Advances in Automatic Text Summarization. Cambridge, USA: MIT Press, 1999:111- 121.
9Radev D R, Mckeown K R. Generating Natural Language Summaries from Multiple On-line Sources. Computational Linguistics, 1998, 24(3): 470-500.
10Nenkova A, Vanderwende L. The Impact of Frequency on Summari zation. Technical Report, MSR-TR-2005-101, Redmond, USA: Microsoft Research, 2005.

共引文献124

1梁媛,王东波,黄水清.面向人民日报语料的新闻自动摘要生成[J].知识管理论坛,2022(4):452-464. 被引量：1
2刘茂福,李淑君,金可佳,张晓龙.多文档自动文摘中的特征组合优化[J].计算机系统应用,2008,17(8):59-63. 被引量：3
3贺胜.信息抽取技术内涵及应用[J].南京师范大学文学院学报,2004(2):184-188. 被引量：3
4郭庆琳,樊孝忠.基于文本聚类和NLU的自动文摘系统的研究与实现[J].现代电力,2004,21(4):76-80. 被引量：1
5金旭,杨炳儒,菅志刚.自动文摘方法分析[J].计算机应用研究,2004,21(9):5-6. 被引量：8
6王志琪,王永成,刘传汉.论自动文摘及其分类[J].情报学报,2005,24(2):214-221. 被引量：2
7郭庆琳,樊孝忠,柳长安.文本聚类在自动文摘中的应用研究[J].计算机应用,2005,25(5):1036-1038. 被引量：4
8郭庆琳,樊孝忠,柳长安.基于文本聚类和NLU的自动文摘研究[J].北京理工大学学报,2005,25(8):705-709. 被引量：1
9尹存燕,戴新宇,陈家骏.Internet上文本的自动摘要技术[J].计算机工程,2006,32(3):88-90. 被引量：13
10董建设,任丽,周燕玲.中文自动文摘在搜索引擎中的应用[J].情报科学,2006,24(2):267-269. 被引量：2

同被引文献34

1董翔,肖兰喜,杜宪宋,吴晨,刘瑞峰.基于网络的山东地震灾情收集分析处理系统[J].华北地震科学,2007,25(3):6-10. 被引量：21
2周立柱,林玲.聚焦爬虫技术研究综述[J].计算机应用,2005,25(9):1965-1969. 被引量：153
3高琰,谷士文,谭立球.基于多种策略的页面内容提取算法[J].西南交通大学学报,2007,42(4):473-477. 被引量：4
4USGS. Did you feel it [ EB/OL]. (2012 - 12 - 28) [ 2013 - 01 - 25 ]. http ://earthquake. usgs. gov/earthquakes/dyfv/.
5JRC. Europe media monitor[ EB/OL]. (2012 - 12 - 28 ) [ 2013 - O1 - 251. http ://emm. newsbrief, eu/overview, html.
6Brin S, Page L. The anatomy of a large -scale hypertextual web search engine[ J3. Computer Networks and ISDN Systems, 1998:107 -117.
7Jon M. Kleinberg. Authoritative sources in a hyperlinked environment [ C ]//In Tarjan RE and Baeeker T( eds. ). Proceedings of the 9th ACM - SIAM Symposium on Discrete Algorithms. New Orleans: ACM Press, 1997:668 -677.
8Aggarwal C C. Collaborative crawling: mining user experiences for topical resource discovery[ C ]//Proceedings of the eighth ACM SIGKDD inter- national conference on knowledge discovery and data mining. USA:ACM Press, 2002.
9Liu H Y, Mlilios E, Janssen J. Probabilistic models for focused web crawling[ C]//Proceedings of the 6th Annual ACM International Workshop on Web Information and Data Management New York, USA: ACM Press, 2004.
10Liu H Y, Mlilios E, Janssen J. Focused crawling by learning HMM from user' s topic - specific browsing[ C] //Proceeding of the web intelli- gence. IEEE/WIC/ACM International Conference on Web intelligence. USA: IEEE Computer Society, 2004.

引证文献3

1帅向华,胡素平,刘钦,甄盟.地震灾情网络媒体获取与处理模型[J].自然灾害学报,2013,22(3):178-184. 被引量：16
2孙晓腾,李学明.基于论文关键词和篇章结构的自动文摘抽取方法[J].现代计算机,2018,24(9):8-12.
3习海旭,何胜,黄纯国.融合语步和文本多特征的科技论文结构化摘要生成[J].情报学报,2023,42(10):1176-1186.

二级引证文献16

1杨天青,姜立新,席楠.地震速报灾情信息过滤与推漫方法研究——以芦山7.0级地震为例[J].自然灾害学报,2015,24(1):96-103. 被引量：5
2帅向华,刘钦,甄盟,冯蔚.基于天地图的互联网地震灾情快速获取与处理系统设计与实现[J].震灾防御技术,2014,9(3):479-486. 被引量：16
3帅向华,胡素平,郑向向.基于互联网信息快速估计汶川地震有感范围[J].地震地质,2014,36(4):1094-1105. 被引量：5
4杨天青,席楠,张翼,李杰飞.基于离散灾情信息的地震烈度分布快速判定方法研究[J].地震,2016,36(2):48-59. 被引量：11
5曹彦波,吴艳梅,许瑞杰,张方浩.基于微博舆情数据的震后有感范围提取研究[J].地震研究,2017,40(2):303-310. 被引量：27
6李东平,刘倩倩,龚俊.基于海量视频监控的中小地震烈度快速判断方法尝试[J].地震研究,2017,40(2):324-332. 被引量：6
7王辉山,肖健,郑韵.基于移动终端的地震应急辅助决策系统研究[J].自然灾害学报,2017,26(5):30-35. 被引量：9
8韩雪华,王卷乐,卜坤,王玉洁.基于Web文本的灾害事件信息获取进展[J].地球信息科学学报,2018,20(8):1037-1046. 被引量：16
9洪惠群,林金发.灾情图中建筑物识别算法的研究[J].绵阳师范学院学报,2018,37(8):101-106.
10王辉山,林岩钊,吴楠楠.地震应急辅助决策系统设计与应用[J].科技资讯,2017,15(22):14-16.

1肖升,何炎祥.改进的潜在语义分析中文摘录方法[J].计算机应用研究,2012,29(12):4507-4511. 被引量：8
2姜贤塔,陈根才.利用语料库技术的中文自动文摘系统[J].中文信息学报,1999,13(2):16-23. 被引量：4
3何新宇.基于中心词耦合度和PageRank的文本自动摘录算法[J].中山大学研究生学刊（社会科学版）,2013,34(3):43-50. 被引量：1
4原玉娇,罗森林,林萌,潘丽敏.融合句义结构模型的短文本推荐算法研究[J].信息安全研究,2015,1(1):67-73. 被引量：1
5郑诚,刘福君,李清.基于指代消解和篇章结构分析的自动摘录算法[J].计算机工程,2012,38(16):170-173. 被引量：2
6崔国庆,金波,张爱新.基于KSVD与MCA的图像修复技术研究[J].通信技术,2013,46(2):22-25. 被引量：4
7周运,牟占生.一种基于Domain Ontology的Web文档抽取机制[J].河南师范大学学报（自然科学版）,2009,37(3):124-126. 被引量：1
8刘业妃,王福龙,奚祥艳,刘志煌.改进的Criminisi图像修复算法[J].小型微型计算机系统,2014,35(12):2754-2758. 被引量：11
9孔敏,毕建钢.政务信息处理与政府决策[J].电子政务,2009(2):66-74. 被引量：4
10党宏社,张娜.一种基于贝叶斯压缩感知的图像修复方法[J].河南大学学报（自然科学版）,2014,44(5):601-607. 被引量：5

计算机技术与发展

2011年第8期

浏览历史

内容加载中请稍等...

自动文摘的方法研究被引量：3

参考文献10

二级参考文献85

共引文献124

同被引文献34

引证文献3

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

自动文摘的方法研究 被引量：3

参考文献10

二级参考文献85

共引文献124

同被引文献34

引证文献3

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

自动文摘的方法研究被引量：3