期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
中文产品评论中属性词抽取方法研究 被引量:12
1
作者 栗春亮 朱艳辉 徐叶强 《计算机工程》 CAS CSCD 北大核心 2011年第12期26-28,32,共4页
针对现有属性词抽取方法的准确率和覆盖率偏低问题,利用百度百科和分词后相邻词语同现比例识别专业领域生词,降低分词错误对属性词识别的影响,在中文产品评论语料中通过设计词性序列模板获得候选属性词集,该词性序列模板包含名词和名词... 针对现有属性词抽取方法的准确率和覆盖率偏低问题,利用百度百科和分词后相邻词语同现比例识别专业领域生词,降低分词错误对属性词识别的影响,在中文产品评论语料中通过设计词性序列模板获得候选属性词集,该词性序列模板包含名词和名词短语模板、动词和动词短语模板,采用统计技术和自然语言处理技术筛选候选属性词。实验结果表明,对于3 623篇手机评论文章,利用该方法可获得1 732个属性词,准确率为0.565、召回率为0.726、调和平均值为0.636,具有较好的抽取性能。 展开更多
关键词 产品评论 生词识别 序列模板 属性词
下载PDF
中文基础情感词词典构建方法研究 被引量:86
2
作者 柳位平 朱艳辉 +2 位作者 栗春亮 向华政 文志强 《计算机应用》 CSCD 北大核心 2009年第10期2875-2877,共3页
词语的情感倾向判别是文章语义情感倾向研究的基础工作。利用中文情感词建立一个基础情感词典,为专一领域情感词识别提供一个核心子集,能够有效地在语料库中识别及扩展情感词集,并提高分类效果。在中文词语相似度计算方法的基础上,提出... 词语的情感倾向判别是文章语义情感倾向研究的基础工作。利用中文情感词建立一个基础情感词典,为专一领域情感词识别提供一个核心子集,能够有效地在语料库中识别及扩展情感词集,并提高分类效果。在中文词语相似度计算方法的基础上,提出了一种中文情感词语的情感权值的计算方法,并以HOWNET情感词语集为基准,构建了中文基础情感词典。利用该词典结合TF-IDF特征权值计算方法,对中文文本情感倾向进行判别,实验结果表明,该方法取得了不错的分类效果。 展开更多
关键词 基础情感词词典 倾向性分析 情感权值 种子词
下载PDF
一种基于多重词典的中文文本情感特征抽取方法 被引量:10
3
作者 朱艳辉 栗春亮 +1 位作者 徐叶强 柳位平 《湖南工业大学学报》 2011年第2期42-46,共5页
情感特征抽取是文本情感分类的重要步骤,正确的选择情感特征并赋予合理的情感权重是保障分类精度的前提。利用基础情感词词典、连词词典及词语距离,提出了一种基于多重词典的中文文本情感特征抽取算法,实验证明该方法优于HM,SO-PMI和词... 情感特征抽取是文本情感分类的重要步骤,正确的选择情感特征并赋予合理的情感权重是保障分类精度的前提。利用基础情感词词典、连词词典及词语距离,提出了一种基于多重词典的中文文本情感特征抽取算法,实验证明该方法优于HM,SO-PMI和词语语义距离等经典的特征抽取算法。 展开更多
关键词 情感特征 情感权重 多重词典 情感特征抽取算法
下载PDF
基于Lucene的海量数据库全文检索的设计与实现 被引量:4
4
作者 徐叶强 朱艳辉 +1 位作者 栗春亮 王文华 《湖南工业大学学报》 2011年第2期81-84,103,共5页
基于Lucene实现了一个海量数据库全文检索的原型。把关系数据库引入了本系统,可针对不同类型的源数据库灵活配置,比采用配置文件更加灵活;采用多线程,通过动态机制来实现不同类型源数据库中记录的抽取、转换、建立索引;提供定时自动更... 基于Lucene实现了一个海量数据库全文检索的原型。把关系数据库引入了本系统,可针对不同类型的源数据库灵活配置,比采用配置文件更加灵活;采用多线程,通过动态机制来实现不同类型源数据库中记录的抽取、转换、建立索引;提供定时自动更新索引的功能;提供多种检索方式。 展开更多
关键词 LUCENE 关系数据库 全文检索
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部