-
题名PSO-GP中文文本情感分类方法研究
被引量:4
- 1
-
-
作者
黄熠
王娟
-
机构
解放军特种作战学院
国网信息通信产业集团有限公司
-
出处
《计算机科学》
CSCD
北大核心
2017年第S1期446-450,共5页
-
文摘
中文文本的情感倾向分析是网络舆情信息挖掘和分析的关键技术之一。提出了一种粒子群-高斯过程算法(PSO-GP)的中文文本情感倾向分类方法,采用粒子群优化算法(Particle Swarm optimization,PSO)进行高斯过程(Gaussian Process)超参数的最优搜索,解决了传统高斯过程中共轭梯度法迭代次数难确定、对初值依赖性强和易陷入局部极小值等问题。首先采用多线程网络爬虫技术采集文本数据组成语料库,构建特定领域情感词典,然后通过情感词匹配选择最有效的特征,降低数据维度,并利用TF-IDF算法计算特征词的权重以生成特征向量。最终,将测试样本输入PSO-GP分类模型。实验结果表明,与传统GP方法相比,提出的改进高斯过程分类模型的分类准确率提高了近15%。
-
关键词
中文文本情感分类
网络爬虫
情感词典
粒子群优化算法
高斯过程
-
Keywords
Chinese texts sentiment classification
Web crawlers
Semantic lexicon
Particle swarm optimization
Gaussian process
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-