摘要
针对文本的分析研究中,根据分析目标的不同可归纳为文本分类和情感分析两种类型,在某些情况下,情感分析也可以被看作是一种特殊的文本分类问题。文本分类的一大特征是过高的向量维数,因此特征降维是文本分类的一大核心问题,而特征选择是特征降维的核心技术之一。归纳总结了中文文本分类和情感分析中常见的特征选择方法,分析各种方法的原理,指出其优缺点,并总结近年来相应算法改进情况。
This paper summarizes common feature selection methods in text classification and sentiment analysis of Chinese version,and analysis the principle of various methods,points out its advantages and disadvantages,and the improved algorithm in recent years are conclude.
出处
《工业控制计算机》
2017年第11期80-81,共2页
Industrial Control Computer
关键词
文本分类
情感分析
特征选择
text categorization
sentiment analysis
feature selection