期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
面向文本情感聚类的维度判别方法 被引量:4
1
作者 李欣 王素格 李德玉 《计算机工程与应用》 CSCD 北大核心 2015年第7期124-130,共7页
在文本情感分析时,使用有监督的机器学习方法的不足是需要大量的带标签的文本数据,而无监督的文本聚类方法可以克服这一问题。对于文本情感聚类,在节省数据资源的同时,也存在聚类结果的不确定性问题。给出了情感维度的形式化描述,并将... 在文本情感分析时,使用有监督的机器学习方法的不足是需要大量的带标签的文本数据,而无监督的文本聚类方法可以克服这一问题。对于文本情感聚类,在节省数据资源的同时,也存在聚类结果的不确定性问题。给出了情感维度的形式化描述,并将观点词识别技术应用于情感维度的判别中。在此基础上,利用获得的情感维度,对评论文本进行情感聚类,有效地解决情感聚类结果的不确定性问题。在4个领域的英文产品评论数据上进行实验,结果表明该方法在自动识别情感聚类维度中是有效的,并得到了满意的情感聚类结果。 展开更多
关键词 观点词识别 维度判别 文本情感聚类
下载PDF
面向情感聚类的文本相似度计算方法研究 被引量:8
2
作者 李欣 李旸 王素格 《中文信息学报》 CSCD 北大核心 2018年第5期97-104,共8页
在文本情感分析时,使用无监督的聚类方法,可以有效节省人力和数据资源,但同时也面临聚类精度不高的问题。相似性是文本聚类的主要依据,该文从文本相似度计算的角度,针对情感聚类中文本—特征向量的高维和稀疏问题,以及对评论文本潜在情... 在文本情感分析时,使用无监督的聚类方法,可以有效节省人力和数据资源,但同时也面临聚类精度不高的问题。相似性是文本聚类的主要依据,该文从文本相似度计算的角度,针对情感聚类中文本—特征向量的高维和稀疏问题,以及对评论文本潜在情感因素的表示问题,提出一种基于子空间的文本语义相似度计算方法(RESS)。实验结果表明,基于RESS的文本相似度计算方法,有效解决了文本向量的高维问题,更好地表达了文本间情感相似性,并获得较好的聚类结果。 展开更多
关键词 文本情感聚类 文本相似度计算 文本语义子空间
下载PDF
基于情感特征聚类的半监督情感分类 被引量:23
3
作者 李素科 蒋严冰 《计算机研究与发展》 EI CSCD 北大核心 2013年第12期2570-2577,共8页
情感分类是观点挖掘的一个重要的方面.提出了一种基于情感特征聚类的半监督式情感分类方法,该方法只需要对少量训练数据实例进行情感类别标注.首先从消费者评论中提取普通分类特征和情感特征,普通分类特征可以用来训练一个情感分类器.... 情感分类是观点挖掘的一个重要的方面.提出了一种基于情感特征聚类的半监督式情感分类方法,该方法只需要对少量训练数据实例进行情感类别标注.首先从消费者评论中提取普通分类特征和情感特征,普通分类特征可以用来训练一个情感分类器.然后使用spectral聚类算法把这些情感特征映射成扩展特征.普通分类特征和扩展特征一起通过训练得到另一个情感分类器.2个分类器再从未标签数据集中选择实例放入到训练集合中,并通过训练得到最终的情感分类器.实验结果表明,在同样的数据集上该方法的情感分类准确度比基于self-learning SVM的方法和基于co-training SVM的方法的情感分类准确度要高. 展开更多
关键词 半监督式学习 情感特征 情感 观点挖掘 WEB挖掘 数据挖掘
下载PDF
K-means和SOM在商品评论中的情感词聚类对比 被引量:6
4
作者 赵翠翠 尹春华 《北京信息科技大学学报(自然科学版)》 2020年第1期23-26,共4页
为了选取适合商品评论中情感词聚类的方法,利用K-means和SOM两种算法分别进行聚类分析;以商品评论为研究对象,通过对商品评论文本进行分词、向量化表示等步骤得到情感词向量,采用欧氏距离进行相似度聚类计算;经过对两种算法可视化结果... 为了选取适合商品评论中情感词聚类的方法,利用K-means和SOM两种算法分别进行聚类分析;以商品评论为研究对象,通过对商品评论文本进行分词、向量化表示等步骤得到情感词向量,采用欧氏距离进行相似度聚类计算;经过对两种算法可视化结果和准确率的对比分析,发现SOM算法的聚类结果更均匀,准确率更高;实验表明,SOM算法的情感词聚类效果优于Kmeans算法,更适合于商品评论情感词聚类。 展开更多
关键词 K-MEANS SOM 商品评论 情感
下载PDF
基于感兴趣区域特征提取技术的情感语义研究 被引量:1
5
作者 吕进来 相洁 +1 位作者 陈俊杰 成琳 《计算机工程与设计》 CSCD 北大核心 2010年第3期660-662,666,共4页
提出一种基于感兴趣区域特征提取技术的图像情感语义识别模型。着重论述了感兴趣区域的获取、感兴趣区域与非感兴趣区域权重的确定、从RGB颜色空间到HSV颜色空间的转换算法、加权颜色直方图的统计算法以及最终情感聚类的方法。仿真实验... 提出一种基于感兴趣区域特征提取技术的图像情感语义识别模型。着重论述了感兴趣区域的获取、感兴趣区域与非感兴趣区域权重的确定、从RGB颜色空间到HSV颜色空间的转换算法、加权颜色直方图的统计算法以及最终情感聚类的方法。仿真实验结果表明,该模型所实现的底层特征到高层情感语义映射准确率比传统的颜色特征提取技术的图像情感语义识别模型有很大的提高。 展开更多
关键词 感兴趣区域 情感语义 颜色特征提取 颜色直方图 自组织映射 情感聚类
下载PDF
基于基频的情感语音聚类的说话人识别方法 被引量:2
6
作者 李冬冬 吴朝晖 杨莹春 《模式识别与人工智能》 EI CSCD 北大核心 2009年第1期136-141,共6页
针对存在情感差异性语音情况下说话人识别系统性能急剧下降以及缺乏充足情感语音训练说话人模型的问题,提出一种基于基频的情感语音聚类的说话人识别方法,能有效利用系统可获取的少量情感语音.该方法通过对男女说话人设定不同的基频阈值... 针对存在情感差异性语音情况下说话人识别系统性能急剧下降以及缺乏充足情感语音训练说话人模型的问题,提出一种基于基频的情感语音聚类的说话人识别方法,能有效利用系统可获取的少量情感语音.该方法通过对男女说话人设定不同的基频阈值,根据阈值,对倒谱特征进行聚类,为每个说话人建立不同基频区间的模型.在特征匹配时,选用最大似然度的基频区间模型的得分作为该说话人的得分.在中文情感语音库上的测试结果表明,与传统的基于中性训练语音的高斯混合模型说话人识别方法和结构化训练方法相比,该方法具有更高的识别率. 展开更多
关键词 情感语音 基频 情感聚类 说话人识别
原文传递
基于在线评论的用户需求挖掘模型研究 被引量:38
7
作者 涂海丽 唐晓波 谢力 《情报学报》 CSSCI 北大核心 2015年第10期1088-1097,共10页
用户需求挖掘是产品/服务质量提升的重要前提,在线评论真实反映了用户对产品/服务的满意与否。本文针对在线评论数据构建了一个用户需求挖掘模型。该模型首先获取关于某产品/服务的评论数据,经预处理后提取评论文本的主观句;结合... 用户需求挖掘是产品/服务质量提升的重要前提,在线评论真实反映了用户对产品/服务的满意与否。本文针对在线评论数据构建了一个用户需求挖掘模型。该模型首先获取关于某产品/服务的评论数据,经预处理后提取评论文本的主观句;结合构建的领域本体和依存句法分析确定该产品主题属性和相应的主观评论,按产品/服务主题属性对评论内容进行正负向分类;并运用LDA模型对用户评论进行聚类分析,展示用户重点关注主题属性的评价向量及其情感;同时运用KANO模型对分类结果进行KANO转换与评价,对评价结果进行分析,得出用户关于该产品/服务各主题属性特征需求满足情况;在此基础上提出该产品/服务改进的方向。本文以庐山旅游为例,验证了模型的可行性。 展开更多
关键词 在线评论情感LDA需求挖掘 KANO模型
下载PDF
基于SOM-K-means算法的商品评论研究 被引量:3
8
作者 顾亦然 陈禹洲 《软件导刊》 2021年第10期68-72,共5页
为了更有效率地对商品评论聚类出相应的评价标签,运用SOM-K-means算法,对商品评论中的情感词进行聚类分析。该算法综合了SOM算法和K-means算法的优点,在聚类过程中减少了人工干预,具有较强的自适应性。实验结果显示,在数据量小于10000条... 为了更有效率地对商品评论聚类出相应的评价标签,运用SOM-K-means算法,对商品评论中的情感词进行聚类分析。该算法综合了SOM算法和K-means算法的优点,在聚类过程中减少了人工干预,具有较强的自适应性。实验结果显示,在数据量小于10000条时,SOM-K-means算法的平均运行时间为0.3s,而市场上主流的LDA算法平均运行时间为3.5s,SOM-K-means算法的平均运行效率是其12倍左右,这为追求效率和性能最佳的电商平台提供了一种新的聚类思路。 展开更多
关键词 SOM K-MEANS 商品评论 情感
下载PDF
情感视域下社交媒体平台舆论分层与社群挖掘研究 被引量:1
9
作者 刘昊 《中国网络传播研究》 CSSCI 2018年第2期-,共16页
网络舆论热点事件中,用户的情感信息和意见是影响事件发展方向的重要因素。社会的情感往往是社会结构和文化的产物。特定公众群体情感种类及强度的差异可以反映宏观的社会生产,进而反映社会的阶层分布。研究舆论分化现象及其情感特征,... 网络舆论热点事件中,用户的情感信息和意见是影响事件发展方向的重要因素。社会的情感往往是社会结构和文化的产物。特定公众群体情感种类及强度的差异可以反映宏观的社会生产,进而反映社会的阶层分布。研究舆论分化现象及其情感特征,使用情感分类及强度去识别网络社群具有重要的学术意义,但目前该领域的实证研究仍待开拓。本研究以"假疫苗"事件为个案,使用情感词典评价社交媒体用户的情感类型及强度,并进行聚类分析;基于聚类的结果,结合社交媒体用户账号标签、讨论文本、行为数据,对聚类结果进行社群画像,评价聚类的效果。研究发现,基于情感的社群识别结果具备阶层差异的典型特征,群际差异明显,群内成员聚合性高。不同社群在公共事件中会呈现情感表露的差异,这种情感差异在经过社交媒体平台信息及情感的流动后,会在群体内部形成情感趋同。更细粒度的情感分类考察,能让社群的边界更加清晰,提升聚类结果的可解释性。 展开更多
关键词 情感聚类 情感词典 社会阶层 社群画像 “假疫苗”
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部