-
题名基于PageRank算法的文本关键词权重计算研究
- 1
-
-
作者
王庆福
-
机构
辽宁行政学院
-
出处
《网络新媒体技术》
2015年第3期37-41,共5页
-
文摘
关键词的权值计算绝大多数都是将关键词当作独立的部分,忽略关键词间关联性。试图从关键词间关联性出发,提出关键词的权值受到其他关键词的相互贡献作用,以PageRank算法中对于网页权值的迭代计算为理论基础,提出一种基于关键词间相互投票的权值迭代计算模型,将关键词抽象为模型中各个节点,关键词的初始权值采用经典的TF-IDF方法。将改进的关键词权值计算方法应用于Reuters21578 Top10和20Newsgroup数据集上,实验结果表明,新的算法能够较为明显地差异化关键词之间权值,达到区分文本中关键词重要程度的作用。
-
关键词
词项权重
投票模型
迭代收敛
权值差异化
特征项区分
-
Keywords
term' s weight, vote model, iteratively convergence, weight differentiation, feature distinguish
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-