-
题名面向情感聚类的文本相似度计算方法研究
被引量:8
- 1
-
-
作者
李欣
李旸
王素格
-
机构
山西职工医学院信息中心
山西大学计算机与信息技术学院
山西大学计算智能与中文信息处理教育部重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2018年第5期97-104,共8页
-
基金
国家自然科学基金(61573231
61632011
+2 种基金
61672331
61432011)
山西省科技基础条件平台计划项目(2015091001-0102)
-
文摘
在文本情感分析时,使用无监督的聚类方法,可以有效节省人力和数据资源,但同时也面临聚类精度不高的问题。相似性是文本聚类的主要依据,该文从文本相似度计算的角度,针对情感聚类中文本—特征向量的高维和稀疏问题,以及对评论文本潜在情感因素的表示问题,提出一种基于子空间的文本语义相似度计算方法(RESS)。实验结果表明,基于RESS的文本相似度计算方法,有效解决了文本向量的高维问题,更好地表达了文本间情感相似性,并获得较好的聚类结果。
-
关键词
文本情感聚类
文本相似度计算
文本语义子空间
-
Keywords
sentiment-based text clustering
text similarity calculation
text semantic subspace
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-