-
题名基于改进TextRank的关键句提取方法
被引量:2
- 1
-
-
作者
陈梦彤
谷晓燕
刘甜甜
-
机构
北京信息科技大学信息管理学院
-
出处
《郑州大学学报(理学版)》
CAS
北大核心
2023年第1期15-20,共6页
-
基金
国家自然科学基金项目(71701020)
国家重点研发计划项目(2019YFB1405003)
北京市社科项目(19YJB015)。
-
文摘
在进行文本挖掘时,通常根据关键词分析文本,这种方式容易忽略词语之间的关联性,影响文本挖掘的准确性。TextRank算法是提取关键词或者摘要的主要方法,该算法基于网络图考虑了句子间相似性,但是忽略了词语的特征。基于此,提出了一种改进TextRank算法,将相似语句合并后,考虑多种词特征进行关键句选取。首先,计算语句相似度,并且去除文中相似性较高的语句;然后,根据词频、词义、词位置对词语打分,构建有向图;最后,计算语句平均得分进行排序,选出关键句。实验结果表明,改进后的算法准确性优于其他算法,算法的时间复杂度降低,并且解决了关键词对文本描述片面和摘要烦琐的问题。
-
关键词
关键句提取
改进TextRank算法
相似句合并
词特征
-
Keywords
key sentence extraction
improved TextRank algorithm
similar sentences merging
word feature
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-