期刊文献+

BERT的图模型文本摘要生成方法研究 被引量:1

Research on Text Summarization Generation Method of Graph Model Based on BERT
下载PDF
导出
摘要 基于图模型的TextRank方法形成的摘要不会脱离文档本身,但在抽取文本特征的时候,传统的词向量获取方法存在一词多义的问题,而基于BERT的词向量获取方式,充分挖掘了文本语义信息,缓解了一词多义问题。对不同词嵌入方法进行了实验对比,验证了BERT模型的有效性。基于词频统计的相似度计算方法也忽略了句子的语义信息,文中选择了向量形式的相似度的计算方法用于文本摘要生成。最后在TTNews数据集上做实验,效果有了明显的提升。 The abstract formed by TextRank method based on graph model will not be separated from the document itself,but when extracting text features,the traditional word vector acquisition method has the problem of polysemy,while the word vector acquisition method based on BERT fully excavates the semantic information of the text and alleviates the problem of polysemy.The experimental comparison of different word embedding methods verifies the effectiveness of the BERT model.The similarity calculation method based on word frequency statistics also ignores the semantic information of sentences.In this paper,the similarity calculation method in vector form is selected for text abstract generation.Finally,the experiment on TTNews data set shows that the effect is obviously improved.
作者 黄菲菲 HUANG Feifei(Henan University of Economics and Law,Zhengzhou 450046,China)
出处 《现代信息科技》 2022年第2期91-95,100,共6页 Modern Information Technology
基金 青年科学基金项目(61806073) 河南省科技攻关项目(222102210339)。
关键词 中文文本摘要 BERT TextRank 相似度 abstract of Chinese text BERT TextRank similarity
  • 相关文献

参考文献2

二级参考文献31

  • 1刘德荣 ,王永成 ,刘传汉 .基于主题概念的多文档自动摘要研究[J].情报学报,2005,24(1):69-74. 被引量:7
  • 2耿焕同,蔡庆生,赵鹏,于琨.一种基于词共现图的文档自动摘要研究[J].情报学报,2005,24(6):651-656. 被引量:15
  • 3马慧芳,祁云平,杨小东.一种基于文本关系图的多文档自动摘要技术[J].情报杂志,2007,26(3):67-69. 被引量:7
  • 4Kupiec J,Pedersen J,Chen F.A Trainable Document Summarizer[C].ACM SIGIR.New York,USA,1995.
  • 5Conroy J M,O'leary D P.Text Summarization Via Hidden Markov Models[C].ACM SIGIR,New Orleans,Louisiana,USA,2001.
  • 6Luhn H P.The Automatic Creation of Literature Abstracts[J].IBM Journal of Research Development,1958,2(2):159.
  • 7Text Summarization[EB/OL].http://www.summarization.com/sigirtutorial2001.ppt.
  • 8Baxendale P.Machine-made Index for Technical Literature-an Experiment[J].IBM Journal of Research Development,1958,2(4):354.
  • 9Edmundson,H P.New Methods in Automatic Extracting[J].Journal of the ACM,1969,16(2):264.
  • 10C Aone M E.Okurowaki,J Gorlinsky,and B.Larsen.A Trainable Summarizer With Knowledge Acquired from Robust NLP Techniques//I.Mani and M.Maybury(eds.).Advances in Automated Text Summarization.adl:MIT Press,1999:71.

共引文献33

同被引文献4

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部