-
题名基于中文图书评论的特征挖掘算法的研究
被引量:2
- 1
-
-
作者
何丽
郝文静
-
机构
北方工业大学计算机学院
-
出处
《北方工业大学学报》
2016年第3期34-39,71,共7页
-
基金
北京市科委科技计划项目(Z131100006813021)
-
文摘
针对中文图书评论中的产品特征提取问题,本文基于FP-Growth算法进行图书评论特征提取,并在此基础上对挖掘过程进行了适应性改进.首先利用冗余词典减少冗余度以解决挖掘结果冗余度大的问题;然后根据评论长度赋予不同支持度的权重改进FP-Growth算法;最后根据独立支持度和各特征词的置信度对候选特征词进行过滤筛选.本文采用亚马逊网站上的真实图书评论数据进行实验验证,实验结果证明,该算法与传统FP-Growth算法、Apriori算法和TF-IDF算法挖掘结果相比,查全率显著提高,综合值也有所提高.
-
关键词
中文图书评论
产品特征
数据挖掘
FP-GROWTH算法
-
Keywords
Chinese book review
product characteristics
data mining
FP-Growth algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名面向中文图书评论的情感词典构建方法研究
被引量:24
- 2
-
-
作者
郭顺利
张向先
-
机构
吉林大学管理学院
-
出处
《现代图书情报技术》
CSSCI
2016年第2期67-74,共8页
-
文摘
【目的】探讨中文图书评论情感词典构建方法,以便进行用户图书评论的情感分析。【方法】参照相关研究将用户情感分为7类,对采集到的语料库进行分词,结合基础情感词典得到中文图书评论的情感词集,选取各类情感种子词;利用改进的SO-PMI算法和同义词词林扩展方法判别词语的情感类别;以实际的图书评论作为语料进行实验验证。【结果】提出一种中文图书评论的情感词典构建方法,其平均准确率、平均召回率及F1的均值分别为0.90、0.83和0.85。【局限】语料库小,样本范围具有一定的局限性。【结论】实验结果表明本文方法具有较高的有效性和可靠性,能够有效地进行用户图书评论的情感分析。
-
关键词
中文图书评论
情感词典
种子词
情感分类
SO-PMI算法
-
Keywords
Chinese book reviews
Sentiment analysis dictionary
Seed word
Sentiment classification
SO-PMI
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-