基于段落匹配和分布密度的偏重摘要实现机制被引量：1

The Design and Implementation of Query-Biased Summarization Based on Passage Match and Density Distribution

下载PDF

导出

摘要本文提出了基于段落匹配和分布密度的偏重文本摘要实现机制,旨在满足摘要的个性化要求。首先在关键字同义扩充的基础上,利用基于侧面相似度的段落匹配方法,获取相关的文本段落集合。然后通过计算文本窗口的分布密度函数,获取关键字集聚区域,依据覆盖区域的句子权重,输出的最终偏重摘要。最后进行了评价实验,通过问答测验和相似比较,效果良好,而且表明偏重摘要对于多主题文本更为有效。 There is an important issue that text summarization has to embody the personal information need and provide the indicative message for user. In this paper, a mechanism of query-biased summarization is presented based on passage matching and density distribution. First, each keyword and its synonymies are regarded as a query profile, and then the relevant passages are retrieved by profile matching. The density of term in these passages is calculated by Hanning window fuhction, and the centralizing areas of keywords are acquired. Considering the density distribution and the number of keywords included, the important sentences are extracted as the final output query-biased summarization. The evaluations were made through Question and Answering test and similarity comparison, and it showed that our mechanism improved the ability to meet personal information need and illustrated more effective on multi-theme texts.

作者林鸿飞杨志豪赵晶

机构地区大连理工大学计算机系

出处《中文信息学报》 CSCD 北大核心 2007年第1期43-48,共6页 Journal of Chinese Information Processing

基金国家自然科学基金资助项目(6037309560673039)

关键词计算机应用中文信息处理文本摘要偏重摘要同义扩充段落匹配分布密度 computer application Chinese information processing text summarization query-biased summarization synonymous expansion passage match density distribution

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献16

1郭燕慧,钟义信,马志勇,姚均勇.自动文摘综述[J].情报学报,2002,21(5):582-591. 被引量：24
2吴岩,李秀坤,王开铸.HIT-97Ⅰ型英文自动文摘系统[J].情报学报,1998,17(5):358-364. 被引量：14
3Ryen White,Joe M.Jose,Ian Ruthven,Using Top-Ranking Sentences for Web Search Result Presentation[A],In:Proceedings of the 12^th International World Wide Web Conference[C],2003.
4Tsutomu Hirao,Hideki Isozaki,Eisaku Maeda,Yuji Matsumoto,Extracting Important Sentences with Support Vector Machine[A],In:Proceedings of the 19^th International Conference on Computational Linguistics[C],2002.
5Auastasios Tombros,Mark Sanderson.Advantages of Query Biased Summaries in Information Retrieval[A],In:Proceedings of the 21^st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval[C],1998.
6Mingfang Wu,Ross Wilkinson,Cecile Paris,Evaluation a Query-biased Document Summarization Approach for the Question Answering Task[A],In:Proceedings of 2004 Australasian Language Technology Workshop (ALTW2004)[C],2004.
7Manabu Okumura,Hajime Mochizuki,Manabu,Hajime,Query-Biased Summarization Based on Lexical Chaining,Computational Intelligence[J],Vol.16,No.4,578-585,2000.
8Ryen White,Joe M.Jose,Ian Ruthven,Query-Biased Web Page Summarization:A Task-Oriented Evaluation[A],In:Proceedings of the 24^th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval[C],2001.
9Mark Sanderson,Accurate User Directed Summarization from Existing Tools[A].In:Proceedings of the 7^th International Conference on Information and Knowledge Management[C],1998.
10林鸿飞,姚天顺.基于潜在语义索引的文本浏览机制[J].中文信息学报,2000,14(5):49-56. 被引量：29

二级参考文献20

1刘挺,吴岩,王开铸.基于信息抽取和文本生成的自动文摘系统设计[J].情报学报,1997,16(S1):31-36. 被引量：13
2苏海菊,王永成.中文科技文献文摘的自动编写[J].情报学报,1989,8(6):433-439. 被引量：26
3莫燕,王永成.中文文献摘要的自动编制[J].现代图书情报技术,1993(3):10-12. 被引量：15
4王建波,杜春玲,王开铸.基于篇章理解的自动文摘研究[J].中文信息学报,1995,9(3):33-42. 被引量：12
5杨小兰宋帆等.基于选择生成文摘法的自动文摘系统研究与实现.全国第四届计算语言学联合学术会议论文集[M].北京:清华大学出版社,1997.313-318.
6刘伟权.自然语言理解与汉语文本信息处理理论研究：博士论文[M].北京:北京邮电大学图书馆,1997..
7Yang Y，Proceedingsofthe 14thInternationalConferenceonMachineLearning，1997年
8吴立德，大规模中文文本处理，1997年
9姚天顺，自然语言理解，1995年
10王永成,许慧敏.OA中文文献自动摘要系统[J].情报学报,1997,16(2):128-132. 被引量：26

共引文献125

1罗洋.自动文摘抽取的研究[J].科技信息,2009(1). 被引量：1
2宁卓,邹阳,傅光轩.基于内容的智能EMAIL安全拦截系统模型[J].计算机工程,2000,26(S1):227-231. 被引量：1
3胡俊华,杨波,李金屏.自然语言理解研究略述[J].济南大学学报（社会科学版）,2001,11(5):58-62. 被引量：8
4金旭,杨炳儒,菅志刚.自动文摘方法分析[J].计算机应用研究,2004,21(9):5-6. 被引量：8
5郑海,林鸿飞.基于段落匹配的文本分类机制[J].计算机工程与应用,2004,40(28):174-176. 被引量：3
6冯伟.基于内容的智能E-mail安全拦截系统模型[J].三峡大学学报（自然科学版）,2004,26(5):453-455.
7李玉红,寇兴权.基于关键词集合的产品信息描述与检索系统[J].控制工程,2005,12(2):168-169. 被引量：1
8章成志,侯汉清.面向概念挖掘的文本层次模型研究[J].中国图书馆学报,2005,31(2):58-61. 被引量：3
9王志琪,王永成,刘传汉.论自动文摘及其分类[J].情报学报,2005,24(2):214-221. 被引量：2
10邱均平,文庭孝,周黎明.汉语自动分词与内容分析法研究[J].情报学报,2005,24(3):309-317. 被引量：11

同被引文献55

1钟义信.自然语言理解的全信息方法论[J].北京邮电大学学报,2004,27(4):1-12. 被引量：42
2孟小峰,周龙骧,王珊.数据库技术发展趋势[J].软件学报,2004,15(12):1822-1836. 被引量：176
3苏海菊,王永成.中文科技文献文摘的自动编写[J].情报学报,1989,8(6):433-439. 被引量：26
4王萌,何婷婷,姬东鸿,王晓荣.基于HowNet概念获取的中文自动文摘系统[J].中文信息学报,2005,19(3):87-93. 被引量：22
5郭庆琳,樊孝忠,柳长安.基于文本聚类和NLU的自动文摘研究[J].北京理工大学学报,2005,25(8):705-709. 被引量：1
6秦兵,刘挺,李生.多文档自动文摘综述[J].中文信息学报,2005,19(6):13-20. 被引量：51
7秦兵,刘挺,陈尚林,李生.多文档文摘中句子优化选择方法研究[J].计算机研究与发展,2006,43(6):1129-1134. 被引量：13
8傅间莲,陈群秀.基于规则和统计的中文自动文摘系统[J].中文信息学报,2006,20(5):10-16. 被引量：21
9刘德喜,何炎祥,姬东鸿,杨华.一种基于演化算法进行句子抽取的多文档自动摘要系统SBGA[J].中文信息学报,2006,20(6):46-53. 被引量：10
10耿增民,贾云得,刘万春,朱玉文.基于Web的文摘技术研究[J].中文信息学报,2006,20(6):54-60. 被引量：1

引证文献1

1刘德喜,吴世汉,万常选.XML文本自动文摘研究综述[J].计算机应用研究,2009,26(11):4014-4018.

1林鸿飞,杨元生.用户兴趣模型的表示和更新机制[J].计算机研究与发展,2002,39(7):843-847. 被引量：23
2郑海,林鸿飞.基于段落匹配的文本分类机制[J].计算机工程与应用,2004,40(28):174-176. 被引量：3
3闫英杰,林鸿飞,杨志豪,赵晶.关键词密度分布法在偏重摘要中的应用研究[J].计算机工程,2007,33(16):156-158. 被引量：1
4李雅慧,郭婷,孙丽颖.一种基于高频词和段落匹配的论文抄袭检测系统设计[J].现代经济信息,2009(22):324-324. 被引量：1
5秦玉平,王秀坤,艾青,刘卫江.基于模糊支持向量机的多主题文本分类算法研究[J].小型微型计算机系统,2008,29(3):548-551. 被引量：4
6徐浩.从政策层面透视浙江电子商务发展[J].信息化建设,2015,0(6):19-21.
7林鸿飞,丁洪文,杨志豪,赵晶.基于概念和统计的问答系统实现机制[J].大连理工大学学报,2006,46(2):280-285. 被引量：4
8廖涛,刘宗田,王先传.基于事件的多主题文本自动文摘方法[J].计算机工程,2013,39(3):236-240. 被引量：1
9廖涛,刘宗田,王利.多主题文本摘要抽取的研究与实现[J].计算机工程,2011,37(6):21-23. 被引量：5
10刘静,肖璐.基于依存句法分析的多主题文本摘要研究[J].情报杂志,2014,33(6):167-171. 被引量：3

中文信息学报

2007年第1期

浏览历史

内容加载中请稍等...

基于段落匹配和分布密度的偏重摘要实现机制被引量：1

参考文献16

二级参考文献20

共引文献125

同被引文献55

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于段落匹配和分布密度的偏重摘要实现机制 被引量：1

参考文献16

二级参考文献20

共引文献125

同被引文献55

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于段落匹配和分布密度的偏重摘要实现机制被引量：1