多文档文摘评价标准的研究被引量：3

Research on standard of evaluation of multi-document summarization

下载PDF

导出

摘要多文档自动文摘是自然语言处理领域的一个重要研究方向。但对于多文档文摘的评价方法仍然存在方法单一,缺乏统一标准的问题。针对这些问题,就多文档文摘信息覆盖度尝试性地提出一套标准。该标准将涉及以下几个重要参数:改进BLEU参数(改进召回率),与原文档有效词覆盖度,高频词覆盖度。实验证明利用该标准能准确反映出文摘系统在信息覆盖度方面的优劣,并且接近人工评价结果。 Multi-document automatic summarization is an important branch of natural language understanding.But the methods of evaluation of the Multi-document automatic summarization also have many problems,which are single and lack of uniform standard.The investigative point in this text is to attempt to give a standard aiming at the covered rate of information of Multi-document automatic summarization.This standard will use a few of parameters ：improved BLEU parameter（recall）,covered rate of effective phrase with original documents,high frequency phrase covered rate.The experiments have indicated this standard can reflect the covered rate of information of summarization system good or bad ,and whether it is near to artificial evaluation results.

作者魏继增孙济洲秦兵

机构地区天津大学计算机系哈尔滨工业大学计算机学院

出处《计算机工程与应用》 CSCD 北大核心 2007年第2期180-183,共4页 Computer Engineering and Applications

关键词 BLEU 高频词覆盖度有效词覆盖度召回率 BLEU high frequency phrase covered rate covered rate of effective phrase recall

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1Papineni K,Roukos S,Ward T,et al.BLEU:a method for automatic evaluation of machine translation[C]//Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL),Philadelphia.IBM T J Watson Research Center Yorktown Heights,NY 10598,USA,2002-07.
2秦兵刘挺李生.基于文本集合物理特征及逻辑结构的多文档文摘技术[J].哈尔滨工业大学学报,2002,.
3于海滨.多文档自动文摘的研究[D].哈尔滨:哈尔滨工业大学,2003.
4俞士汶段慧明.自动文摘评测报告[N].计算机世界报,1996-03-25．183.

共引文献1

1傅间莲,陈群秀.基于连续段落相似度的主题划分算法[J].计算机应用,2005,25(9):2022-2024. 被引量：10

同被引文献29

1刘德荣 ,王永成 ,刘传汉 .基于主题概念的多文档自动摘要研究[J].情报学报,2005,24(1):69-74. 被引量：7
2郭庆琳,樊孝忠,柳长安.文本聚类在自动文摘中的应用研究[J].计算机应用,2005,25(5):1036-1038. 被引量：4
3郭庆琳,樊孝忠,柳长安.基于文本聚类的自动文摘系统的研究与实现[J].计算机工程,2006,32(4):30-32. 被引量：8
4秦兵,刘挺,陈尚林,李生.多文档文摘中句子优化选择方法研究[J].计算机研究与发展,2006,43(6):1129-1134. 被引量：13
5傅间莲,陈群秀.一种新的自动文摘系统评价方法[J].计算机工程与应用,2006,42(18):176-177. 被引量：9
6索红光,刘玉树,曹淑英.一种基于词汇链的关键词抽取方法[J].中文信息学报,2006,20(6):25-30. 被引量：88
7张其文,李明.多文档文摘提取方法的研究[J].兰州理工大学学报,2007,33(1):96-99. 被引量：4
8Lncy HE. From single to multi-document summarization: a prototype system and its evaluation. Proc. of the 40th Annual Metting of the Association for Computational Linguistics. Philadelphia: ACL, 2002: 457-464.
9Dragomir RR, Kathleen RM. Generation Natual Languages Summaries from Multiple Online Sources. Computational Linguistics, 1998,24(3):21-29.
10Radev R. Hongyan J, Malgorzata B. Centroid-based summarizaiton of multiple documents: sentence extraction, utility-based evaluation, and user studies. ANLP/NAACL 2000 Workshop C. 2000:21 -29.

引证文献3

1徐晓丹.基于子主题和用户查询的多文档摘要系统[J].计算机系统应用,2011,20(3):112-115. 被引量：5
2邓箴,包宏.基于词汇链的多文档自动文摘研究[J].计算机与应用化学,2012,29(11):1384-1386.
3刘美玲,王慧强,陈广胜,于洋.中文文本挖掘的动态文摘建模方法[J].哈尔滨工程大学学报,2019,40(4):820-826. 被引量：1

二级引证文献6

1王凯祥.面向查询的自动文本摘要技术研究综述[J].计算机科学,2018,45(B11):12-16. 被引量：5
2朱军涛,苗蕾,胡晓红,邓仁.文本挖掘在期刊评价中的应用研究[J].企业技术开发,2018,37(12):125-127. 被引量：1
3王凯祥,任明.基于查询的新闻多文档自动摘要技术研究[J].中文信息学报,2019,33(4):93-100. 被引量：6
4唐晓波,顾娜,谭明亮.基于句子主题发现的中文多文档自动摘要研究[J].情报科学,2020,38(3):11-16. 被引量：8
5孟旭阳,陈阳,白海燕.面向检索结果集的结构化综述智能生成研究[J].图书情报工作,2024,68(6):129-141. 被引量：2
6于佳.基于hLDA主题模型的多文档摘要句子打分算法研究[J].河南科技,2013,32(11X):273-274. 被引量：1

1杨清泉,李卫疆.基于文摘的SLDA主题模型[J].价值工程,2016,35(19):231-234.
2于海滨,秦兵,刘挺,郎君.命名实体识别和指代消解在文摘系统中的应用[J].计算机应用研究,2006,23(4):180-182. 被引量：7
3廖金辉,李景福.Access数据库中OLE对象的巧妙插入[J].电脑开发与应用,2004,17(4). 被引量：7
4王文欣,黄萱菁,吴立德.基于统计方法的汉语自动文摘系统研究[J].计算机应用与软件,2000,17(9):28-33. 被引量：12
5孙春葵,李蕾,杨晓兰,钟义信.基于知识的文本摘要系统研究与实现[J].计算机研究与发展,2000,37(7):874-881. 被引量：19
6岳大鹏,饶岚,王挺.一种针对新闻话题的多文档文摘技术[J].中文信息学报,2012,26(6):79-84. 被引量：3
7吴晓锋,宗成庆.一种基于LDA的CRF自动文摘方法[J].中文信息学报,2009,23(6):39-45. 被引量：13
8龚书,瞿有利,田盛丰.多文档文摘语义单元自动去噪器的监督学习方法[J].计算机研究与发展,2013,50(4):873-882.
9《含能材料》被美国剑桥科学文摘收录[J].含能材料,2006,14(5):322-322.
10蒋勇铭,陈微熙,张仲贵.基于句子相似度的自动文摘评价方法[J].中国西部科技,2011,10(29):22-23. 被引量：4

计算机工程与应用

2007年第2期

浏览历史

内容加载中请稍等...

多文档文摘评价标准的研究被引量：3

参考文献4

共引文献1

同被引文献29

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

多文档文摘评价标准的研究 被引量：3

参考文献4

共引文献1

同被引文献29

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

多文档文摘评价标准的研究被引量：3