-
题名基于词性标注序列特征提取的微博情感分类
被引量:7
- 1
-
-
作者
卢伟胜
郭躬德
陈黎飞
-
机构
福建师范大学数学与计算机科学学院
-
出处
《计算机应用》
CSCD
北大核心
2014年第10期2869-2873,共5页
-
基金
国家自然科学基金资助项目(61175123)
-
文摘
传统的n-gram文本特征提取方法会产生高维度的特征向量,高维数据不但增大了分类的难度,同时也会增加分类的时间。针对这一问题,提出了一种基于词性(POS)标注序列的特征提取方法,根据词性序列能够代表一类文本的这一个特点,利用词性序列组作为文本的特征以达到降低特征维度的效果。在实验中,词性序列特征提取方法比n-gram特征提取方法至少提高了9%的分类精度,降低4816个维度。实验结果表明,该方法能够适用于微博情感分类。
-
关键词
特征提取
词性
标注序列
微博情感分类
极性分类
-
Keywords
feature extraction
Part-Of-Speech (POS)
tagging sequence
microblog emotion classification
polarity classification
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于词汇的微博情感分类分析新方法
- 2
-
-
作者
王晰墨
-
机构
沈阳化工大学
-
出处
《电子技术与软件工程》
2020年第11期158-159,共2页
-
文摘
本文从情感分析技术的研究意义出发,研究了常规微博情感分析方法,并对神经网络技术进行相关介绍,提出了微博情感分析创新性新方法。
-
关键词
情感词汇
微博情感分类
神经网络技术
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP393.092
[自动化与计算机技术—计算机应用技术]
-
-
题名基于二元搭配词的微博情感特征选择
被引量:6
- 3
-
-
作者
周剑峰
阳爱民
周咏梅
王璇璇
-
机构
广东外语外贸大学图书馆
广东外语外贸大学思科信息学院
广东外语外贸大学西方语言文化学院
-
出处
《计算机工程》
CAS
CSCD
2014年第6期162-165,共4页
-
基金
国家社科基金资助项目(12BYY045)
教育部人文社会科学研究青年基金资助项目(10YJCZH247)
+4 种基金
教育部人文社会科学基金资助一般项目(09YJCZH019)
教育部新世纪优秀人才支持计划基金资助项目(NCET-12-0939)
广东省科技计划基金资助项目(2010B031000014)
广东外语外贸大学校级基金资助项目(12Q22)
广东外语外贸大学研究生科研创新基金资助项目
-
文摘
分析和监测微博文本中所包含的情感信息,能够挖掘用户行为,为微博舆情监管提供借鉴。但微博文本具有长度较短、不规范、存在大量变形词和新词等特点,仅以情感词为特征对微博进行分类的方法准确率较低,难以满足实际使用。为此,基于微博语料构建二元搭配词库,并根据PMI-IR算法结合语料库统计信息,提出搭配词组情感权值的计算方法PMI-IR-P。结合情感词典,采用统计方法生成微博情感特征向量,利用机器学习中的C4.5算法构建分类模型,对微博文本进行情感倾向分类。分别使用不同的数据集用于构建搭配词库及分类模型,并与基于情感词典的分类方法以及朴素贝叶斯分类方法进行对比。实验结果表明,提出的情感特征通过运用C4.5算法对微博文本情感分类的准确率达到87%,具有较好的效果。
-
关键词
搭配词库
微博情感特征
微博情感分类
机器学习
C4
5算法
-
Keywords
collocation dictionary
micro-blog sentimental feature
micro-blog sentimental classification
machine learning
C4.5 algorithm
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于粒子群聚类的KNN微博舆情分类研究
被引量:1
- 4
-
-
作者
林伟
-
机构
福建警察学院侦查系
-
出处
《中国刑警学院学报》
2017年第5期121-124,共4页
-
基金
2017年福建省高校杰出青年科研人才培育计划资助项目
福建省教育厅基金(编号:JAT160561)
-
文摘
基于数据挖掘的微博情感分类是网络舆情监控的重要方法,其中KNN算法具有简单有效、无需估计参数等优点,适用于微博舆情分类。微博舆情分类实质上是对微博上的负面情感及时监控,KNN会因在情感分类时处理大量的计算影响算法效率。因此,采用粒子群聚类算法在情感分类前裁剪微博训练样本空间,以减少分类时的计算量。实验结果表明,基于粒子群聚类的KNN算法能够有效提高微博情感分类的性能。
-
关键词
KNN
微博情感分类
特征选择
粒子群聚类
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
TP393.092
[自动化与计算机技术—计算机应用技术]
-