-
题名一种改进的商品评价情感极性分析算法
被引量:1
- 1
-
-
作者
邵其武
缪裕青
谢益均
高韩
蔡国永
-
机构
桂林电子科技大学计算机科学与工程学院
桂林电子科技大学广西可信软件重点实验室
-
出处
《桂林电子科技大学学报》
2015年第2期156-161,共6页
-
基金
广西自然科学基金(2014GXNSFAA118395)
广西教育厅科研项目(2013YB094)
+1 种基金
广西可信软件重点实验室基金(kx201116)
桂林电子科技大学研究生教育创新计划(GDYCSZ201466)
-
文摘
针对商品评价信息的褒贬分析问题,提出PMI_HRV算法。算法在基于语料库的PMI算法基础上,采用最新的基于知网词典算法,解决基于语料库算法中低频词准确率差的问题;建立评价领域词语相关的基准词表,并增加否定属性表和网络用语表以扩充知网词典,使结果更为准确。实验结果表明,PMI_HRV算法具有较高的准确率和召回率。
-
关键词
情感分析
商品评价
点互信息
知网词典
基准词表
-
Keywords
sentiment analysis
product review
point mutual information
Hownet
reference vocabulary
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名概念漂移数据流中可探测新颖类别的分类算法
被引量:2
- 2
-
-
作者
谢益均
缪裕青
邵其武
高韩
文益民
-
机构
桂林电子科技大学计算机科学与工程学院
桂林电子科技大学广西可信软件重点实验室
-
出处
《桂林电子科技大学学报》
2015年第6期459-465,共7页
-
基金
广西自然科学基金(2014GXNSFAA118395)
广西教育厅科研项目(2013YB094)
+1 种基金
广西可信软件重点实验室基金(KX201116)
桂林电子科技大学研究生教育创新计划(GDYCSZ201466)
-
文摘
针对可探测新颖类别的框架将数据流分成固定大小的数据块,导致新颖类别探测的准确率较低和处理速率较慢,且均假定数据对象所有属性具有相同的权重不符合实际情况的问题,提出一种在概念漂移数据流中探测新颖类别的分类算法(DNCS)。该算法通过周期检测滑动窗口中的数据分布,依据其变化动态调整数据块大小,以此更新分类模型,以适应新的数据变化。该算法框架使用基于属性权重的聚类算法作为探测新颖类别的基本步骤。实验结果表明,该算法具有更高的新颖类别探测精度和处理速率。
-
关键词
数据流
集成分类器
概念漂移
新颖类别探测
-
Keywords
data stream
ensemble classifier
concept-drift
novel class detection
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-