-
题名基于情感词识别的BBS情感分类研究
被引量:9
- 1
-
-
作者
陈锦禾
范新
沈闻
沈洁
-
机构
扬州大学信息工程学院计算机科学系
-
出处
《计算机技术与发展》
2009年第7期120-123,共4页
-
基金
国家自然科学基金资助(60673060)
-
文摘
针对目前BBS网络信息杂乱的现象,提出了一种BBS情感分类方法,能够方便用户准确定位所需信息,辨识评论的极性(肯定还是否定)。根据词语具有语义倾向的概率大小,利用最大熵的特征模型识别文本中具有语义倾向的词语,选择具有一定倾向值的词作为文档的特征表示。通过这些类型特征构造支持向量机分类模型,对BBS文本所表达的情感等主观内容进行分类,判断其是正面还是负面。实验表明,在BBS情感分类中,基于该特征表示的分类精度较好。
-
关键词
文本分类
情感分类
特征词识别
最大熵
支持向量机
-
Keywords
text classification
sentiment classification
feature recognition
maximum entropy
SVM
-
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
-
-
题名多用途汉语方言语音数据库的设计
被引量:7
- 2
-
-
作者
高原
顾明亮
孙平
王侠
张长水
-
机构
徐州师范大学语言科学学院
徐州师范大学物理与电子工程学院
清华大学自动化系
-
出处
《计算机工程与应用》
CSCD
2012年第5期118-120,共3页
-
基金
国家自然科学基金(No.61040053)
徐州师范大学科研创新计划资助课题(No.2010YLB019)
-
文摘
建立了一个多用途汉语方言语音数据库,用于说话人信息处理、方言特征词识别、语音识别等领域的研究。以多通道的方式采集时长106小时的语音数据,包括七种主要的汉语方言区语音,对数据进行预处理。在此基础上提出了汉语方言数据库的设计标准以及实施方案,有助于推动汉语语音库特别是方言语音库的建立。
-
关键词
汉语方言数据库
说话人信息处理
方言特征词识别
-
Keywords
Chinese dialect speech database
speaker information analysis
character-words recognition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-