-
题名基于情感本体和kNN算法的在线评论情感分类研究
被引量:22
- 1
-
-
作者
唐晓波
朱娟
杨丰华
-
机构
武汉大学信息系统研究中心
武汉大学信息管理学院
九江学院教务处
-
出处
《情报理论与实践》
CSSCI
北大核心
2016年第6期110-114,共5页
-
基金
国家自然科学基金项目"社会化媒体集成检索与语义分析方法研究"的成果之一
项目编号:71273194
-
文摘
[目的/意义]构建针对网络在线评论的情感分析模型,一方面可以为用户决策提供支持;另一方面又可以帮助产品或服务提供商了解用户情感倾向,提升用户体验。[方法/过程]提出了基于情感本体和k NN算法的在线评论情感分类模型。该模型基于情感本体,通过对情感词数量和情感程度进行加权,提出了褒义量和贬义量的概念,并以此作为k NN算法的特征向量。通过爬取豆瓣网电影评论进行训练和测试,并分别从褒性评论和贬性评论的角度对分类效果进行评价。[结果/结论]结果表明,本算法在分类准确率和召回率方面都具有不错的水平,但同时对贬性评论分类效果优于褒性评论,为未来研究提供了新的思路。
-
关键词
在线评论
情感分类
k最近邻分类法
本体
-
Keywords
online review
sentiment classification
kNN classification algorithm
ontology
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名文档相似矩阵在提高KNN分类效率中的应用
被引量:2
- 2
-
-
作者
路永和
何新宇
-
机构
中山大学资讯管理学院
-
出处
《情报理论与实践》
CSSCI
北大核心
2014年第1期141-144,共4页
-
基金
国家高技术研究发展计划("863"计划)资助项目"农产品全供应链多源信息感知技术与产品开发"的成果
项目编号:2012AA101701
-
文摘
针对传统KNN分类算法在样本数量大、维度高的情况下相似度计算量大的问题,提出了基于相似矩阵的改进KNN分类算法。该算法通过计算样本两两之间的相似度,建立相似矩阵加速KNN算法中寻找K近邻;以搜狗自然语言实验室的文本分类语料库中的新闻文档作为实验对象,采用宏平均F测度值作为分类效果评价标准,用改进KNN方法和传统KNN方法进行对比实验。实验结果表明:通过调节参数,本方法能在不损失精度的情况下减少寻找K近邻时相似度计算的次数。
-
关键词
文本分类
k最近邻分类法
相似矩阵
算法
-
Keywords
text classification
kNN classification algorithm
similarity matrix
algorithm
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-