-
题名中文产品评论中属性词抽取方法研究
被引量:12
- 1
-
-
作者
栗春亮
朱艳辉
徐叶强
-
机构
湖南工业大学计算机与通信学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第12期26-28,32,共4页
-
基金
教育部人文社会科学研究青年基金资助项目(09YJCZH019)
湖南省自然科学基金资助项目(10JJ3002)
中国包装总公司科研基金资助项目(2008-XK13)
-
文摘
针对现有属性词抽取方法的准确率和覆盖率偏低问题,利用百度百科和分词后相邻词语同现比例识别专业领域生词,降低分词错误对属性词识别的影响,在中文产品评论语料中通过设计词性序列模板获得候选属性词集,该词性序列模板包含名词和名词短语模板、动词和动词短语模板,采用统计技术和自然语言处理技术筛选候选属性词。实验结果表明,对于3 623篇手机评论文章,利用该方法可获得1 732个属性词,准确率为0.565、召回率为0.726、调和平均值为0.636,具有较好的抽取性能。
-
关键词
产品评论
生词识别
序列模板
属性词
-
Keywords
product comment
new word recognition
sequence template
attribute word
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名中文基础情感词词典构建方法研究
被引量:86
- 2
-
-
作者
柳位平
朱艳辉
栗春亮
向华政
文志强
-
机构
湖南工业大学计算机与通信学院
-
出处
《计算机应用》
CSCD
北大核心
2009年第10期2875-2877,共3页
-
基金
湖南省自然科学基金资助项目(05JJ30122)
中国包装总公司科研资助项目(2008-XK13)
+1 种基金
湖南省教育厅科研资助项目(07B014)
湖南工业大学研究生创新基金资助项目(CX0812)
-
文摘
词语的情感倾向判别是文章语义情感倾向研究的基础工作。利用中文情感词建立一个基础情感词典,为专一领域情感词识别提供一个核心子集,能够有效地在语料库中识别及扩展情感词集,并提高分类效果。在中文词语相似度计算方法的基础上,提出了一种中文情感词语的情感权值的计算方法,并以HOWNET情感词语集为基准,构建了中文基础情感词典。利用该词典结合TF-IDF特征权值计算方法,对中文文本情感倾向进行判别,实验结果表明,该方法取得了不错的分类效果。
-
关键词
基础情感词词典
倾向性分析
情感权值
种子词
-
Keywords
basic semantic lexicon
orientation analysis
semantic weight
seed word
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种基于多重词典的中文文本情感特征抽取方法
被引量:10
- 3
-
-
作者
朱艳辉
栗春亮
徐叶强
柳位平
-
机构
湖南工业大学计算机与通信学院
-
出处
《湖南工业大学学报》
2011年第2期42-46,共5页
-
基金
湖南省自然科学基金资助项目(10JJ3002)
中国包装总公司科研基金资助项目(2008-XK13)
-
文摘
情感特征抽取是文本情感分类的重要步骤,正确的选择情感特征并赋予合理的情感权重是保障分类精度的前提。利用基础情感词词典、连词词典及词语距离,提出了一种基于多重词典的中文文本情感特征抽取算法,实验证明该方法优于HM,SO-PMI和词语语义距离等经典的特征抽取算法。
-
关键词
情感特征
情感权重
多重词典
情感特征抽取算法
-
Keywords
emotional feature
sentiment weight
multiple lexicons
emotional feature extraction algorithm
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于Lucene的海量数据库全文检索的设计与实现
被引量:4
- 4
-
-
作者
徐叶强
朱艳辉
栗春亮
王文华
-
机构
湖南工业大学计算机与通信学院
-
出处
《湖南工业大学学报》
2011年第2期81-84,103,共5页
-
基金
湖南省自然科学基金资助项目(10JJ3002)
教育部人文社会科学研究青年基金资助项目(09YJCZH019)
中国包装总公司科研基金资助项目(2008-XK13)
-
文摘
基于Lucene实现了一个海量数据库全文检索的原型。把关系数据库引入了本系统,可针对不同类型的源数据库灵活配置,比采用配置文件更加灵活;采用多线程,通过动态机制来实现不同类型源数据库中记录的抽取、转换、建立索引;提供定时自动更新索引的功能;提供多种检索方式。
-
关键词
LUCENE
关系数据库
全文检索
-
Keywords
Lucene
relational database
full-text retrieval
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-