-
题名基于TextRank的自动摘要优化算法
被引量:17
- 1
-
-
作者
李娜娜
刘培玉
刘文锋
刘伟童
-
机构
山东师范大学信息科学与工程学院
山东省分布式计算机软件新技术重点实验室
菏泽学院计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2019年第4期1045-1050,共6页
-
基金
国家自然科学基金资助项目(61373148)
国家青年自然科学基金资助项目(61502151)
+4 种基金
山东省社科规划项目(17CHLJ18
17CHLJ33
17CHLJ30)
山东省自然科学基金资助项目(ZR2014FL010)
山东省教育厅基金资助项目(J15LN34)
-
文摘
在对中文文本进行摘要提取时,传统的TextRank算法只考虑节点间的相似性,忽略了文本的其他重要信息。针对中文单文档,在现有研究的基础上,使用TextRank算法并考虑句子间的相似性,使TextRank算法与文本的整体结构信息、句子的上下文信息等相结合,如文档句子或者段落的物理位置、特征句子、核心句子等有可能提升权重的句子来生成文本的摘要候选句群。对得到的摘要候选句群作冗余处理,以除去候选句群中相似度较高的句子,得到最终的文本摘要。最后通过实验验证,该算法能够提高生成摘要的准确性,表明了该算法的有效性。
-
关键词
摘要提取
TextRank
结构信息
候选摘要句群
冗余处理
-
Keywords
abstract extraction
TextRank
structure information
digest candidate sentence group
redundancy processing
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-