BERT的图模型文本摘要生成方法研究被引量：1

Research on Text Summarization Generation Method of Graph Model Based on BERT

下载PDF

导出

摘要基于图模型的TextRank方法形成的摘要不会脱离文档本身,但在抽取文本特征的时候,传统的词向量获取方法存在一词多义的问题,而基于BERT的词向量获取方式,充分挖掘了文本语义信息,缓解了一词多义问题。对不同词嵌入方法进行了实验对比,验证了BERT模型的有效性。基于词频统计的相似度计算方法也忽略了句子的语义信息,文中选择了向量形式的相似度的计算方法用于文本摘要生成。最后在TTNews数据集上做实验,效果有了明显的提升。 The abstract formed by TextRank method based on graph model will not be separated from the document itself,but when extracting text features,the traditional word vector acquisition method has the problem of polysemy,while the word vector acquisition method based on BERT fully excavates the semantic information of the text and alleviates the problem of polysemy.The experimental comparison of different word embedding methods verifies the effectiveness of the BERT model.The similarity calculation method based on word frequency statistics also ignores the semantic information of sentences.In this paper,the similarity calculation method in vector form is selected for text abstract generation.Finally,the experiment on TTNews data set shows that the effect is obviously improved.

作者黄菲菲 HUANG Feifei(Henan University of Economics and Law,Zhengzhou 450046,China)

机构地区河南财经政法大学

出处《现代信息科技》 2022年第2期91-95,100,共6页 Modern Information Technology

基金青年科学基金项目(61806073) 河南省科技攻关项目(222102210339)。

关键词中文文本摘要 BERT TextRank 相似度 abstract of Chinese text BERT TextRank similarity

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1胡侠,林晔,王灿,林立.自动文本摘要技术综述[J].情报杂志,2010,29(8):144-147. 被引量：24
2王侃,曹开臣,徐畅,潘袁湘,牛新征.基于改进Transformer模型的文本摘要生成方法[J].电讯技术,2019,59(10):1175-1181. 被引量：11

二级参考文献31

1刘德荣 ,王永成 ,刘传汉 .基于主题概念的多文档自动摘要研究[J].情报学报,2005,24(1):69-74. 被引量：7
2耿焕同,蔡庆生,赵鹏,于琨.一种基于词共现图的文档自动摘要研究[J].情报学报,2005,24(6):651-656. 被引量：15
3马慧芳,祁云平,杨小东.一种基于文本关系图的多文档自动摘要技术[J].情报杂志,2007,26(3):67-69. 被引量：7
4Kupiec J,Pedersen J,Chen F.A Trainable Document Summarizer[C].ACM SIGIR.New York,USA,1995.
5Conroy J M,O'leary D P.Text Summarization Via Hidden Markov Models[C].ACM SIGIR,New Orleans,Louisiana,USA,2001.
6Luhn H P.The Automatic Creation of Literature Abstracts[J].IBM Journal of Research Development,1958,2(2):159.
7Text Summarization[EB/OL].http://www.summarization.com/sigirtutorial2001.ppt.
8Baxendale P.Machine-made Index for Technical Literature-an Experiment[J].IBM Journal of Research Development,1958,2(4):354.
9Edmundson,H P.New Methods in Automatic Extracting[J].Journal of the ACM,1969,16(2):264.
10C Aone M E.Okurowaki,J Gorlinsky,and B.Larsen.A Trainable Summarizer With Knowledge Acquired from Robust NLP Techniques//I.Mani and M.Maybury(eds.).Advances in Automated Text Summarization.adl:MIT Press,1999:71.

共引文献33

1胡朝明.基于分词技术提升虚拟参考咨询系统智能服务[J].图书情报工作,2012,56(9):110-113. 被引量：5
2曾哲军.基于连续LexRank的多文本自动摘要优化算法研究[J].计算机应用与软件,2013,30(10):209-212. 被引量：4
3罗毅辉,熊曙初.一种集成框架下的分布式多文档自动摘要方法[J].情报杂志,2013,32(11):133-136. 被引量：3
4王善平,张静波,朱水林,刘丹,曹宇.蒙太古语义学在文献信息组织和检索中应用的探讨[J].华东师范大学学报（自然科学版）,2014(3):144-151.
5刘静,肖璐.基于依存句法分析的多主题文本摘要研究[J].情报杂志,2014,33(6):167-171. 被引量：3
6王连喜.自动摘要研究中的若干问题[J].图书情报工作,2014,58(20):13-22. 被引量：7
7杨竣辉,刘宗田,刘炜,苏小英.基于文本事件网络自动摘要的抽取方法[J].计算机科学,2015,42(3):210-213. 被引量：4
8陈杨,周枫,周兰江,严馨.融合多特征的越南语新闻文本词汇链构建方法[J].计算机工程与设计,2017,38(6):1536-1540.
9刘海燕,张钰.基于LexRank的中文单文档摘要方法[J].兵器装备工程学报,2017,38(6):85-89. 被引量：5
10王玮,欧阳纯萍,阳小华,罗凌云,刘志明.融合句子情感和主题相似性的中文新闻文本情感摘要[J].计算机应用研究,2017,34(12):3543-3546. 被引量：4

同被引文献4

1周健,田萱,崔晓晖.基于改进Sequence-to-Sequence模型的文本摘要生成方法[J].计算机工程与应用,2019,55(1):128-134. 被引量：13
2党宏社,陶亚凡,张选德.基于混合注意力与强化学习的文本摘要生成[J].计算机工程与应用,2020,56(1):185-190. 被引量：7
3朱玉佳,祝永志,董兆安.基于TextRank算法的联合打分文本摘要生成[J].通信技术,2021,54(2):323-326. 被引量：9
4邹傲,郝文宁,靳大尉,陈刚.基于语句融合和自监督训练的文本摘要生成模型[J].模式识别与人工智能,2022,35(5):401-411. 被引量：3

引证文献1

1郭利荣,梁玉琪,廖文亦.基于Agent-Chain的统计摘要生成研究[J].信息技术与信息化,2024(2):204-207.

1段钗曼.文化有韵,古诗添香——小学语文古诗词教学[J].陕西教育（教学）,2022(6):58-59. 被引量：1
2《电化教育研究》英文摘要写作要求[J].电化教育研究,2022,43(6):76-76.
3医学名词规范使用的注意事项[J].内科急危重症杂志,2022,28(2):107-107.
4胡定兴,杜建强,石强,罗计根,刘勇.面向中医电子病历的症状实体及属性抽取[J].现代信息科技,2022,6(3):70-75. 被引量：2
5樊海玮,秦佳杰,孙欢,张丽苗,鲁芯丝雨.基于BERT与BiGRU-CRF的交通事故文本信息提取模型[J].计算机与现代化,2022(5):10-15. 被引量：3
6王郢,方癸椒.基于词云分析技术的课程思政评价探索[J].教育信息化论坛,2022,6(7):99-101. 被引量：3

现代信息科技

2022年第2期

浏览历史

内容加载中请稍等...

BERT的图模型文本摘要生成方法研究被引量：1

参考文献2

二级参考文献31

共引文献33

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

BERT的图模型文本摘要生成方法研究 被引量：1

参考文献2

二级参考文献31

共引文献33

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

BERT的图模型文本摘要生成方法研究被引量：1