基于加权AMR图的语义子图预测摘要算法被引量：4

Semantic Subgraph Predictive Summary Algorithm Based on Weighted AMR Graph

下载PDF

导出

摘要方法多数停留在挖掘词与词之间的浅层语义关系,没有很好地利用词句之间的完整语义信息,为此,提出一种改进的语义子图预测摘要的算法。将原始文本转化为相应的抽象语义表示(AMR)图,融合成一个AMR总图,基于WordNet语义词典对其进行冗余信息的过滤。在此基础上利用综合统计特征对不具有权值的AMR图节点赋予权值,通过筛选重要性程度高的部分构成语义摘要子图,并基于ROUGE指标和Smatch指标综合衡量生成摘要的质量。实验结果表明,与仅挖掘浅层语义关系的文本摘要基准算法相比,该算法ROUGE值和Smatch值明显提高。 Most of the existing text abstract methods stay in the shallow semantic relationship between words and words,and do not make good use of the complete semantic information between words.Therefore,an improved algorithm for semantic subgraph predictive summary is proposed.The algorithm transforms the original text into corresponding Abstract Meaning Representation(AMR)graphs,merges them into an AMR total graph,and filters the redundant information based on the WordNet semantic dictionary.On this basis,using the comprehensive statistical features assigns weights to the AMR graph nodes that do not have weights,and constructs the semantic summary subgraphs by filtering the parts with high importance,and comprehensively measures the quality of the abstracts based on the ROUGE index and the Smatch index.Experimental results show that compared with the text abstraction benchmark algorithm which only mines shallow semantic relations,the ROUGE value and Smatch value of the algorithm are significantly improved.

作者明拓思宇陈鸿昶黄瑞阳柳杨 MING Tuosiyu;CHEN Hongchang;HUANG Ruiyang;LIU Yang(National Digital Switching System Engineering and Technological R&D Center,Zhengzhou 450002,China)

机构地区国家数字交换系统工程技术研究中心

出处《计算机工程》 CAS CSCD 北大核心 2018年第10期292-297,302,共7页 Computer Engineering

基金国家自然科学基金(61601513)

关键词抽象语义表示图语义摘要子图语义信息冗余信息摘要评价指标 Abstarct Meaning Representation(AMR)graph semantic abstract subgraph semantic information redundant information summary evaluation index

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献8

1王萌,何婷婷,姬东鸿,王晓荣.基于HowNet概念获取的中文自动文摘系统[J].中文信息学报,2005,19(3):87-93. 被引量：22
2吴晓锋,宗成庆.一种基于LDA的CRF自动文摘方法[J].中文信息学报,2009,23(6):39-45. 被引量：13
3罗森林,白建敏,潘丽敏,韩磊,孟强.融合句义特征的多文档自动摘要算法研究[J].北京理工大学学报,2016,36(10):1059-1064. 被引量：3
4曲维光,周俊生,吴晓东,戴茹冰,顾敏,顾彦慧.自然语言句子抽象语义表示AMR研究综述[J].数据采集与处理,2017,32(1):26-36. 被引量：18
5李斌,闻媛,宋丽,卜丽君,曲维光,薛念文.融合概念对齐信息的中文AMR语料库的构建[J].中文信息学报,2017,31(6):93-102. 被引量：21
6杜秀英.基于聚类与语义相似分析的多文本自动摘要方法[J].情报杂志,2017,36(6):167-172. 被引量：7
7宁可,孙同晶,徐洁洁.面向海量数据的改进最近邻优先吸收聚类算法[J].计算机工程,2018,44(4):35-40. 被引量：5
8孟令阁,马建芬,张雪英.基于主题的SVM与MMR融合的会议摘要技术[J].计算机工程与设计,2016,37(10):2695-2699. 被引量：7

二级参考文献62

1胡建军,唐常杰,李川,彭京,元昌安,陈安龙,蒋永光.基于最近邻优先的高效聚类算法[J].四川大学学报（工程科学版）,2004,36(6):93-99. 被引量：24
2秦兵,刘挺,李生.多文档自动文摘综述[J].中文信息学报,2005,19(6):13-20. 被引量：51
3王鑫,王洪国,张建喜,谷建军.基于数据分区的最近邻优先聚类算法[J].计算机科学,2005,32(12):188-190. 被引量：4
4HP Luhn. The Automatic Creation of Literature Abstracts[J]. IBM Journal of Research and Development, 1958, 2(2): 159-165.
5D.R. Radev, E. Hovy and K. McKeown. Introduction to the Special Issue on Summarization[J]. Computational Linguistics, 2002, 28(4): 399-408.
6Xiaofeng Wu, Chengqing Zong. A New Approach to Automatic Document Summarization[C]//International Joint Conference of Natural Language Processing, 2008: 126-132.
7J.Y. Yeh, H.R. Ke, W.P. Yang, andI. H. Meng. Text summarization using trainable summarizer and latent semantic analysis[J]. IPM, 2005, 41(1): 75-95.
8Hal Daum'e III, and D. Marcu. Bayesian Query- Focused Summarization[C]//ACL, 2006.
9P.B. Baxendale. Man-made Index for Technical Literature -An Experiment[J]. IBM Journal of Research and Development, 1958, 2(4): 354-361.
10Y. H. Gong and X. Liu. Generic text summarization using relevance measure and latent semantic analysis [C]//SIGIR, 2001:19-25.

共引文献78

1梁媛,王东波,黄水清.面向人民日报语料的新闻自动摘要生成[J].知识管理论坛,2022(4):452-464. 被引量：1
2戴玉玲,戴茹冰,冯敏萱,李斌,曲维光.基于关系对齐的汉语虚词抽象语义表示与分析[J].中文信息学报,2020(4):21-29. 被引量：3
3廖莎莎,江铭虎.中文文本分类中基于概念屏蔽层的特征提取方法[J].中文信息学报,2006,20(3):22-28. 被引量：12
4刘德喜,何炎祥,姬东鸿,杨华.一种基于演化算法进行句子抽取的多文档自动摘要系统SBGA[J].中文信息学报,2006,20(6):46-53. 被引量：10
5马慧芳,祁云平,杨小东.一种基于文本关系图的多文档自动摘要技术[J].情报杂志,2007,26(3):67-69. 被引量：7
6林鸿飞,卢冶,王剑峰,宋锐.基于概念扩充和综合评价的文本综述[J].郑州大学学报（理学版）,2007,39(2):104-109. 被引量：2
7黄丽琼,何中市,张杰慧.基于文本相似度的自动文摘评价方法[J].计算机应用研究,2007,24(8):97-99. 被引量：9
8聂卉,龙朝晖.基于本体概念的矢量检索模型研究[J].图书情报工作,2007,51(9):121-123. 被引量：2
9杨思春,陈家骏.中文自动问答中句子相似度计算研究[J].情报学报,2008,27(1):35-41. 被引量：5
10叶星火,胡珀,张小鹏.基于特征信息提取的中文自动文摘方法[J].计算机应用与软件,2008,25(5):31-32. 被引量：3

同被引文献10

1江开忠,李子成,顾君忠.自动文本摘要方法[J].计算机工程,2008,34(1):221-223. 被引量：13
2胡侠,林晔,王灿,林立.自动文本摘要技术综述[J].情报杂志,2010,29(8):144-147. 被引量：23
3李亚超,熊德意,张民.神经机器翻译综述[J].计算机学报,2018,41(12):2734-2755. 被引量：106
4刘洋.神经机器翻译前沿进展[J].计算机研究与发展,2017,54(6):1144-1149. 被引量：105
5徐馨韬,柴小丽,谢彬,沈晨,王敬平.基于改进TextRank算法的中文文本摘要提取[J].计算机工程,2019,45(3):273-277. 被引量：24
6吴仁守,王红玲,王中卿,周国栋.全局自匹配机制的短文本摘要生成方法[J].软件学报,2019,30(9):2705-2717. 被引量：13
7蒋亚芳,严馨,徐广义,周枫,邓忠莹.融合多信息句子图模型的多文档摘要抽取[J].计算机工程与科学,2020,42(3):535-542. 被引量：2
8王青松,张衡,李菲.基于文本多维度特征的自动摘要生成方法[J].计算机工程,2020,46(9):110-116. 被引量：6
9杨朝举,葛唯益,王羽,徐建.基于关键词密度的多文档抽取式摘要算法[J].指挥信息系统与技术,2021,12(5):48-53. 被引量：1
10田媛,郝文宁,陈刚,靳大尉,邹傲.基于多粒度语义交互的抽取式多文档摘要[J].计算机系统应用,2022,31(7):186-193. 被引量：1

引证文献4

1陈鸿昶,明拓思宇,刘树新,高超.基于整数线性规划重构抽象语义图结构的语义摘要算法[J].电子与信息学报,2019,41(7):1674-1681. 被引量：3
2殷明明,史小静,俞鸿飞,段湘煜.基于对比注意力机制的跨语言句子摘要系统[J].计算机工程,2020,46(5):86-93. 被引量：8
3许柏炎,蔡瑞初,梁智豪.一种用于代码注释自动生成的语法辅助复制机制[J].计算机工程,2021,47(4):92-99. 被引量：3
4翁裕源,许柏炎,蔡瑞初.基于异构图分层学习的细粒度多文档摘要抽取[J].计算机工程,2024,50(3):336-344.

二级引证文献14

1袁金萍.基于Swap-Based转移的语义分析方法研究[J].电子设计工程,2020,28(16):39-42.
2霍丽春,张丽萍.代码注释演化及分类研究综述[J].内蒙古师范大学学报（自然科学汉文版）,2020,49(5):423-432. 被引量：1
3陶媛媛,陶丹.智能模糊决策树算法在英语机器翻译中的应用[J].计算机测量与控制,2020,28(10):177-180. 被引量：5
4张慧,许大炜.基于集成学习的英文语义识别方法研究与实现[J].电子设计工程,2020,28(24):43-47.
5毛琳,陈思宇,杨大伟,张汝波.动作分类卷积神经网络特征的时域属性校正方法[J].大连民族大学学报,2021,23(1):24-30.
6王惠.基于短语译文组合的智能化自动翻译设计研究[J].自动化与仪器仪表,2022(2):163-166. 被引量：1
7梁栋.基于互联网数据的公共英语自动翻译系统设计[J].信息技术,2022,46(6):139-144.
8陈玮,张锐,尹钟.BERT模型结合实体向量的知识图谱实体抽取方法[J].小型微型计算机系统,2022,43(8):1577-1582. 被引量：3
9牛立保,王振辉.基于深度学习的外语翻译机器人自动问答检索研究[J].自动化与仪器仪表,2022(9):186-191. 被引量：2
10蔡瑞初,张盛强,许柏炎.基于结构感知混合编码模型的代码注释生成方法[J].计算机工程,2023,49(2):61-69. 被引量：2

1Dr. Lorenz Egli,Sherry Tong,童雪萍.一种去除铁丹红的创新方法[J].流程工业,2018,0(15):44-46.
2罗帷,习斌.MVD术中神经电生理监测采用穴位刺激个案分析[J].中国老年保健医学,2018,16(5):126-126.
3金易.欣欣向荣的江苏省税务学校[J].中国税务,1992,0(2):56-56.
4荀静,杨玉珍.基于TextRank的文本情感摘要提取方法[J].计算机应用与软件,2018,35(10):80-84. 被引量：8
5彭丽丽,奚雪峰.人物关系网络在包装产品精准营销中的应用[J].苏州科技大学学报（自然科学版）,2018,35(3):70-73. 被引量：2
6张诗琦.妥协与坚持——西方文化语境下《金锁记》的改写与自译[J].新疆财经大学学报,2018(3):72-80. 被引量：1
7黄芳,徐剑,张微,文全,陆路,李仲洋,黄业宁.ABO血型不合肝移植术前脱敏治疗方案的网状荟萃分析[J].中华移植杂志（电子版）,2018,12(3):131-138. 被引量：1
8《党课》推介[J].紫光阁,2018,0(9):53-53.
9徐建委.文本的衍变:《毛诗草木鸟兽虫鱼疏》辨证[J].上海大学学报（社会科学版）,2018,35(5):67-78. 被引量：4
10是斌贝,何现波,胡宸铭,李宸轩.基于负压波法的成品油输送管道泄漏检测及其改进[J].内蒙古石油化工,2018,44(8):69-71. 被引量：4

计算机工程

2018年第10期

浏览历史

内容加载中请稍等...

基于加权AMR图的语义子图预测摘要算法被引量：4

参考文献8

二级参考文献62

共引文献78

同被引文献10

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于加权AMR图的语义子图预测摘要算法 被引量：4

参考文献8

二级参考文献62

共引文献78

同被引文献10

引证文献4

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于加权AMR图的语义子图预测摘要算法被引量：4