基于多特征融合模型的自动摘要被引量：3

Multi-feature combination based automatic summarization

下载PDF

导出

摘要为解决文本自动摘要任务中特征挖掘不充分的问题,选取句子的词汇、相对位置、长度和句间相似度4个特征,提出一种基于多特征融合模型的摘要系统。基于句法树的词汇特征充分利用语法信息,消除传统方法获取关键词的局限性,相对位置特征通过获取位置的高阶信息对句子进行赋值,长度特征过滤掉过长的句子,基于平滑逆向频率句嵌入方法构造句向量,有效计算句子间的相似度。实验结果表明,该系统提高了文本自动摘要的准确度。 To solve the problem of inadequate feature mining in automatic text summarization task,a summarization system based on multi-feature fusion model was proposed by selecting four features of sentence vocabulary,relative position,length and similarity between sentences.Among them,the lexical features based on syntactic tree made full use of the grammatical information and eliminated the limitation of the traditional method of obtaining keywords.The relative position feature assigned the sentence by obtaining the higher order information of the position.The length feature was used filter the rather long sentences.Based on the smoothing inverse frequency sentence embedding method,the sentence vector was constructed and the similarity between sentences was calculated effectively.Experimental results show that the system improves the accuracy of automatic text summarization.

作者吴世鑫黄德根张云霞 WU Shi-xin;HUANG De-gen;ZHANG Yun-xia(College of Computer Science and Technology,Dalian University of Technology,Dalian 116000,China)

机构地区大连理工大学计算机科学与技术学院

出处《计算机工程与设计》北大核心 2020年第3期650-655,共6页 Computer Engineering and Design

关键词文本摘要多特征融合句法树平滑逆向频率句嵌入语义相似度 text summarization multi-feature combination syntactic tree smooth inverse frequency(SIF)sentence embedding semantic similarity

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1张聪,裴家欢,黄锴宇,黄德根,殷章志.基于语义图优化算法的中文微博观点摘要研究[J].山东大学学报（理学版）,2017,52(7):59-65. 被引量：2
2程园,吾守尔.斯拉木,买买提依明.哈斯木.基于综合的句子特征的文本自动摘要[J].计算机科学,2015,42(4):226-229. 被引量：11
3余珊珊,苏锦钿,李鹏飞.基于改进的TextRank的自动摘要提取方法[J].计算机科学,2016,43(6):240-247. 被引量：41
4庞超,尹传环.基于分类的中文文本摘要方法[J].计算机科学,2018,45(1):144-147. 被引量：9

二级参考文献22

1张奇,黄萱菁,吴立德.一种新的句子相似度度量及其在文本自动摘要中的应用[J].中文信息学报,2005,19(2):93-99. 被引量：34
2刘功中,李建华,李生红.基于类信息的特征选择和加权方法[C]//第一届全国信息检索与内容安全学术会议.上海:上海交通大学出版社,2004.
3Luhn H P.The automatic creation of literature abstract[J].IBM Journal of Research and Development,1958,2(2):159-165.
4Edmundson H P.New methods in automatic extracting[J].Journal of the ACM (JACM),1969,6(2):264-285.
5Erkan G,Radev D R.LexRank:Graph-based lexical centrality as salience in text summarization[J].J.Artif.Intell.Res.(JAIR),2004,22(1):457-479.
6Antiqueira L,Oliveira Jr O N,Costa L F,et al.A complex net-work approach to text summarization[J].Information Sciences,2009,179(5):584-599.
7Salton G,Lesk M E.Computer evaluation of indexing and text processing [J].Journal of the ACM,1968,15(1):8-36.
8Machine B E.Made index for technical literature an experiment[J].IBM Journal of Research and Development,1958,12(4):354-361.
9Ozsoy M G,Alpaslan F N,Cicekli I.Text summarization using latent semantic analysis[J].Journal of Information Science,2011,37(4):405-417.
10王永成,许慧敏.OA中文文献自动摘要系统[J].情报学报,1997,16(2):128-132. 被引量：26

共引文献57

1黄波,刘传才.基于加权TextRank的中文自动文本摘要[J].计算机应用研究,2020,37(2):407-410. 被引量：21
2杜秀英.基于聚类与语义相似分析的多文本自动摘要方法[J].情报杂志,2017,36(6):167-172. 被引量：7
3王子璇,乐小虬,何远标.基于WMD语义相似度的TextRank改进算法识别论文核心主题句研究[J].数据分析与知识发现,2017,1(4):1-8. 被引量：12
4关浩华.基于语音分析的智能质检关键词提取方法设计[J].自动化与仪器仪表,2017(7):106-108. 被引量：5
5杨毅.基于句子聚类的中文文本自动摘要算法的研究[J].微型电脑应用,2017,33(8):54-56. 被引量：1
6高永兵,杨贵朋,张娣,马占飞.基于突显词博文聚类的官微事件检测方法[J].数据分析与知识发现,2017,1(9):57-64. 被引量：2
7高永兵,杨贵朋,张娣.官方微博关键词提取与摘要技术研究[J].内蒙古科技大学学报,2017,36(3):273-279. 被引量：1
8王玮,欧阳纯萍,阳小华,罗凌云,刘志明.融合句子情感和主题相似性的中文新闻文本情感摘要[J].计算机应用研究,2017,34(12):3543-3546. 被引量：4
9何春辉,李云翔,王孟然,王梦贤.改进的TextRank双层单文档摘要提取算法[J].湖南城市学院学报（自然科学版）,2017,26(6):55-60. 被引量：3
10贾晓婷,王名扬,曹宇.结合Doc2Vec与改进聚类算法的中文单文档自动摘要方法研究[J].数据分析与知识发现,2018,2(2):86-95. 被引量：20

同被引文献18

1黄波,刘传才.基于加权TextRank的中文自动文本摘要[J].计算机应用研究,2020,37(2):407-410. 被引量：21
2秦兵,刘挺,李生.多文档自动文摘综述[J].中文信息学报,2005,19(6):13-20. 被引量：51
3仇丽青,刘瑞,张辉.基于词频统计的多文档自动摘要生成方案[J].微计算机信息,2009,25(6):181-182. 被引量：4
4张明慧,王红玲,周国栋.基于LDA主题特征的自动文摘方法[J].计算机应用与软件,2011,28(10):20-22. 被引量：24
5迟晨阳,孟海滨,秦栋梁,钱诚,赵东升,毛华坚.军人电子健康档案大数据即席查询统计子系统的设计与实现[J].军事医学,2017,41(12):1009-1012. 被引量：2
6张博,李鸿,李会超.基于多类别特征融合的疲劳检测系统研究[J].现代电子技术,2019,42(1):152-156. 被引量：5
7米捷,刘道华.基于语义关联性特征融合的大数据挖掘方法[J].信阳师范学院学报（自然科学版）,2019,32(1):141-145. 被引量：21
8王玮.基于C-R神经网络的生成式自动摘要方法[J].计算机与数字工程,2020,48(1):112-118. 被引量：3
9全球新闻业人工智能应用调查报告发布[J].中国报业,2020(5):112-112. 被引量：1
10吕国俊,曹建军,郑奇斌,翁年凤.基于SIF文本特征的跨模态相似性度量[J].计算机仿真,2020,37(9):382-385. 被引量：2

引证文献3

1吴阳波,熊儒煜.基于多特征融合的大数据精准即席查询系统设计[J].IT经理世界,2020(3):63-63.
2王楠,曾曼玲.一种改进的TextRank多文档文摘自动抽取模型[J].软件导刊,2023,22(5):1-6.
3李宝安,佘鑫鹏,常振宁,吕学强,游新冬.中文新闻文本多文档摘要生成[J].计算机工程与设计,2023,44(9):2867-2873.

1刘明童,张玉洁,徐金安,陈钰枫.基于句法结构的神经网络复述识别模型[J].北京大学学报（自然科学版）,2020,56(1):45-52. 被引量：3
2王玮.基于C-R神经网络的生成式自动摘要方法[J].计算机与数字工程,2020,48(1):112-118. 被引量：3
3付健,孔芳.融入结构信息的指代消解[J].计算机科学,2020,47(3):231-236. 被引量：1
4徐如阳,曾碧卿,韩旭丽,周武.卷积自注意力编码过滤的强化自动摘要模型[J].小型微型计算机系统,2020,41(2):271-277. 被引量：3
5王舒洋,慕晓冬,杨东方,贺浩,郑玉航.融合高阶信息的遥感影像建筑物自动提取[J].光学精密工程,2019,27(11):2474-2483. 被引量：11
6高楠,李利娟,李伟,祝建明.融合语义特征的关键词提取方法[J].计算机科学,2020,47(3):110-115. 被引量：8
7张瑞红,杨青,王浩勇,郭海波.基于语料库的农业科技论文英文摘要的语体对比研究[J].宜春学院学报,2020,42(2):86-91.
8蔚鹏航,陈贤.埋件在幕墙工程施工中的问题及改善措施[J].新材料·新装饰,2019,1(5):47-47.
9崔维兰.浅析电子商务专业英语的词汇特征[J].校园英语,2020,0(4):9-9.
10王翔,任佳.基于多注意力机制的深度神经网络故障诊断算法[J].浙江理工大学学报（自然科学版）,2020,43(2):224-231. 被引量：3

计算机工程与设计

2020年第3期

浏览历史

内容加载中请稍等...

基于多特征融合模型的自动摘要被引量：3

参考文献4

二级参考文献22

共引文献57

同被引文献18

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于多特征融合模型的自动摘要 被引量：3

参考文献4

二级参考文献22

共引文献57

同被引文献18

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于多特征融合模型的自动摘要被引量：3