-
题名改进互联网电商评论特征词典的舆情观点分类
- 1
-
-
作者
房满林
董超俊
-
机构
五邑大学
-
出处
《科技创新与应用》
2017年第13期21-22,共2页
-
文摘
电商评论数据往往都是以短文本(在电商领域这种用户的声音称为源声)形式存在,它在一定程度上会影响商家的知名度,因此对源声的舆情分析尤为重要。源声分类技术的出现正是为了满足商家的这种需求,针对源声特征稀疏以及观点多样性特征点,而且舆情观点错误识别的问题,提出一种改进互信息的方法实现特征约简,从而创建一个特征词典集合,对源声进行观点分类,并作了大量实验验证该思想的可靠性。
-
关键词
特征提取
源声
词典集合
互信息
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
-
-
题名改进组合算法在中文短文本分类中的应用
- 2
-
-
作者
房满林
-
机构
五邑大学信息工程学院
-
出处
《现代工业经济和信息化》
2017年第3期95-97,99,共4页
-
文摘
采用最大熵模型与情感分类词典组合的方式对这种短文本用户声音来生成观点。源声的领域通过最大熵模型识别,评价的好坏通过情感模型识别,最后通过领域和评价的组合来得出最终的分类。值得注意的是分类对象具有特征多和类别多等特点,对于源声有多个观点的,可以将源声以分隔符进行拆分,短文本通过分隔符由内向外的文本层次嵌套的分类方法来进行识别源声观点,防止错误输出。结果表明针对中文短文本观点分类,分类器融合是一种高效的分类组合算法。
-
关键词
文本层次分类
最大熵模型
情感词典
-
Keywords
text hierarchical classification
maximum entropy model
emotional dictionary
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-