期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
词典与机器学习方法相结合的维吾尔语文本情感分析 被引量:11
1
作者 热西旦木.吐尔洪太 吾守尔.斯拉 伊尔夏提.吐尔贡 《中文信息学报》 CSCD 北大核心 2017年第1期177-183,191,共8页
随着互联网整体水平的提高,大量基于维吾尔文的网络信息不断建立,引起了对不同领域的信息进行情感倾向性分析的迫切需要。该文考虑到维吾尔文没有足够的情感训练语料和完整的情感词典,结合机器学习方法和词典方法的优点,构建一个分类器... 随着互联网整体水平的提高,大量基于维吾尔文的网络信息不断建立,引起了对不同领域的信息进行情感倾向性分析的迫切需要。该文考虑到维吾尔文没有足够的情感训练语料和完整的情感词典,结合机器学习方法和词典方法的优点,构建一个分类器模型LCUSCM(Lexicon-based and Corpus-based Uyghur Text Sentiment Classification Model),先用自己构建的维吾尔文情感词典对语料进行高质量的情感分类,分类过程中对词典进行递归扩充,再根据每条句子的情感得分,从词典分类的结果中选择一部分语料来训练一个分类器并改进第一步的分类结果。此方法的正确率比单独使用机器学习方法提高了9.13%,比词典方法提高了1.82%。 展开更多
关键词 维吾尔文 情感词典 情感分析 机器学习
下载PDF
基于Bi-tagged特征的维吾尔文情感分类方法研究 被引量:1
2
作者 热西旦木.吐尔洪太 吾守尔.斯拉 《中文信息学报》 CSCD 北大核心 2018年第8期80-90,共11页
现有的维吾尔文文本情感分类方法以从空格分词中得到的unigram特征作为文本表示,因而无法挖掘与情感表达相关的深层语言现象。该文从维吾尔文词汇之间的顺序依赖关系入手,总结若干个词性组合规则,提取能够表达丰富情感信息的Bi-tagged特... 现有的维吾尔文文本情感分类方法以从空格分词中得到的unigram特征作为文本表示,因而无法挖掘与情感表达相关的深层语言现象。该文从维吾尔文词汇之间的顺序依赖关系入手,总结若干个词性组合规则,提取能够表达丰富情感信息的Bi-tagged特征,并基于支持向量机(SVM)分类器对维吾尔文情感语料库进行了正负情感分类。实验结果表明,在维吾尔文文本情感分类中:(1)当包含该文提出的各项词性规则时,Bi-tagged特征的性能最优;(2)Bi-tagged特征不仅能够提取情感丰富的信息,而且可以提取否定信息;(3)与常用的unigram、bigram特征以及unigram和bigram的组合特征在该文数据集上的分类效果相比,该文所提取的Bi-tagged与unigram的组合特征分类效果更佳,比该文的Baseline的分类准确率提高了4.225%。该研究成果不但可以进一步提高维吾尔文文本情感分类效率,也可为哈萨克语、柯尔克孜语等亲属语言的情感分类提供借鉴。 展开更多
关键词 情感分类 Bi-tagged特征 组合特征 维吾尔文
下载PDF
维吾尔文情感语料库的构建与分析 被引量:6
3
作者 伊尔夏提.吐尔贡 吾守尔.斯拉 +1 位作者 热西旦木.吐尔洪太 于清 《计算机与现代化》 2017年第4期67-72,共6页
针对维吾尔文情感语料库标注体系不规范、语料库规模小、没有合适的标注平台等问题,分析英文和中文比较著名情感语料库的优点,结合维吾尔语文本的特点,建立维吾尔文情感语料标注规范,利用Python语言构建集数据采集与标注为一体的情感标... 针对维吾尔文情感语料库标注体系不规范、语料库规模小、没有合适的标注平台等问题,分析英文和中文比较著名情感语料库的优点,结合维吾尔语文本的特点,建立维吾尔文情感语料标注规范,利用Python语言构建集数据采集与标注为一体的情感标注平台,最后构建在舆情分析和舆情监控中可以应用的维吾尔文情感语料库。实验结果表明,该标注规范具有可扩展性和实用性,标注平台可以有效地减轻标注人员的工作量,提高情感语料库的质量,情感语料库可以用于舆情分析任务。 展开更多
关键词 计算机应用 自然语言处理 情感分析 维吾尔文 情感语料库
下载PDF
基于有监督分词方法的维吾尔文情感分析 被引量:3
4
作者 伊尔夏提.吐尔贡 吾守尔.斯拉 热西旦木.吐尔洪太 《计算机工程与设计》 北大核心 2017年第11期3143-3146,3178,共5页
为提高维吾尔文情感分析的准确率,提出一种基于信息增益的有监督维吾尔文分词方法,并将其用在情感分析中,避免传统空格分词方法造成的维数灾难和特征项语义不完整等问题。实验结果表明,用该分词方法得到的特征空间规模更小,在此特征空... 为提高维吾尔文情感分析的准确率,提出一种基于信息增益的有监督维吾尔文分词方法,并将其用在情感分析中,避免传统空格分词方法造成的维数灾难和特征项语义不完整等问题。实验结果表明,用该分词方法得到的特征空间规模更小,在此特征空间上训练出来的模型性能更好,能够有效提高维吾尔文情感分析的准确率。 展开更多
关键词 分词 维吾尔文 情感分析 信息增益 特征提取
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部