-
题名一种多方法融合的藏语情感词典构建方法
- 1
-
-
作者
才让东知
尼玛扎西
达瓦追玛
道吉扎西
-
机构
西藏大学信息科学技术学院
西藏大学西藏自治区藏文信息技术人工智能重点实验室
西藏大学藏文信息技术教育部工程研究中心
西藏大学西藏信息化省部共建协同创新中心
-
出处
《高原科学研究》
CSCD
2024年第2期96-105,共10页
-
基金
科技创新2030——新一代人工智能重大项目(2022ZD0116101)
西藏大学研究生高水平人才培养计划项目(2021-GSP-S129)。
-
文摘
深度学习在藏语情感分析领域备受关注,相较于传统机器学习方法其表现更出色。然而,构建藏语情感词典仍面临着挑战,如词汇量不足、过度依赖机器翻译系统、词典匹配源单一、缺少口语情感词典等。为解决上述问题,文章提出了一种多方法融合的藏语情感词典构建方法。首先,统计并分析已有情感词标注规则后提出了一种藏语情感词的标注规则作为情感词分类的主要依据;其次,提出了一种多词典匹配的藏语情感词典构建方法构建了藏语基准情感词典,为了扩大基准情感词典的规模,利用SO-PMI和基于word2vec词向量相似度扩充方法对基准词典进行词汇扩充,并且利用藏语3大方言的口语词典经人工筛选后构建了藏语口语情感词典;然后,将基准词典和扩充词典合并去重后得到了《藏语书面语与口语情感词典》;最后,为了证明本文方法的可行性和所构建词典的可用性而进行了藏语情感词典性能评估实验;实验中准确率、召回率、F值分别为60.80%、90.31%、72.67%,达到了较好的应用水平,验证了多方法融合的藏语情感词典构建方法的可行性。
-
关键词
藏语
SO-PMI
情感词典
多词典匹配
扩充词典
-
Keywords
Tibetan language
SO-PMI
emotional dictionary
multi-dictionary matching
extended dictionary
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于词典扩充的电力客服工单情感倾向性分析
被引量:6
- 2
-
-
作者
顾斌
彭涛
车伟
-
机构
国网江苏省电力公司
-
出处
《现代电子技术》
北大核心
2017年第11期163-166,171,共5页
-
文摘
为了有效提高电力企业客户满意度及主动服务意识,结合电力客服工单文本特征,构建了电力客服工单情感分析模型。先通过TF-IDF思想进行工单关键词提取,采用word2vec训练得出每个词语的词向量,通过计算余弦相似度将高相似领域词汇扩充到情感词典,再进行工单倾向性分析及文本分类。通过实验分析验证该方法的有效性,实验结果表明,相较于原始情感词典,进行词典扩充及工单情感倾向性分析方法更具优势,准确率更高,可为电力企业客户关系管理提供一定的参考。
-
关键词
情感分析
情感倾向性
词典扩充
电力客服工单
主动服务
-
Keywords
sentiment analysis
sentiment tendency
dictionary expansion
power customer service order
active service
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
V249
[航空宇航科学与技术—飞行器设计]
-
-
题名基于词向量的藏文情感词典的构建方法研究
被引量:7
- 3
-
-
作者
巴桑卓玛
李苗苗
高定国
-
机构
西藏大学信息科学技术学院
-
出处
《电子技术与软件工程》
2017年第20期132-134,共3页
-
基金
国家自然基金项目"跨语言社会舆情分析基础理论与关键技术研究"(61331013)
西藏大学研究生高水平人才培养项目(2015-GSP-002)
西藏大学珠峰学者人才发展支持计划的资助
-
文摘
随着藏文信息技术的发展,藏文文本情感分析是近年来迅速兴起的一个研究课题,而藏文情感词典的构建是藏文文本情感分析与文本挖掘领域中重要的基础性工作。情感类别手工标注不但费时费力,且容易受到主观性的影响,同时对领域性的过分关注也大大限制了情感词典的适用性。因此,本文在分析国内外情感词典扩充方法的基础上,结合藏文本身的特点,提出了"基于词向量的藏文情感词典的构建方法",其核心思想是在人工标注的基础上定义基准词;然后基于词向量来扩充情感词典,并实践和验证了几种不同的扩充情感词典的方法,并选取最优的KNN扩充法从语料中自动扩充藏文情感词,建立了一部比较实用的藏文情感词典。
-
关键词
词向量
藏文情感词典
情感词典扩充
K近邻方法
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名大宗商品交易领域词典构建
- 4
-
-
作者
黄金源
孙若莹
-
机构
北京信息科技大学信息管理学院
-
出处
《北京信息科技大学学报(自然科学版)》
2022年第1期71-75,共5页
-
基金
国家重点研发计划课题(2019YFB1405003)。
-
文摘
为了高效地对大宗商品交易领域的文本数据进行挖掘,基于书籍文本面向大宗商品交易领域构建了领域词典。通过关键词提取以及融合现有基础词典,构建大宗商品交易领域词典。为了使得领域词典更加完善,利用分布式表示方法中的Word2vec算法进行词典扩充。实验结果表明,所构建的领域词典在文本分类任务中具有良好的性能表现。
-
关键词
领域词典
大宗商品交易
书籍文本
关键词提取
Word2vec
领域词典扩充
-
Keywords
domain dictionary
commodity trading
book text
keywords extraction
Word2vec
domain dictionary expansion
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
F724.6
[经济管理—产业经济]
-
-
题名多民族语言本体知识库构建技术
被引量:15
- 5
-
-
作者
赵小兵
邱莉榕
赵铁军
-
机构
中央民族大学信息工程学院
国家语言资源监测与研究中心少数民族分中心
哈尔滨工业大学教育部-微软语言语音重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2011年第4期71-74,共4页
-
基金
国家科技支撑计划资助项目(2009BAH41B04)
教育部资助项目(MZ115-94)
-
文摘
语义本体是共享概念模型的显示的形式化规范说明,其目标是将杂乱无章的信息源转变为有序易用的知识源。语义本体知识库的构建是文本自动处理的一个重要环节,跨语言信息检索、信息抽取、自动翻译等领域中都有广泛的应用。该文旨在描述统一标准、统一接口的多民族语言本体知识库的创建思路,以及包含的若干问题,例如:多民族语言中共有概念的一般表示与各民族语言特有的事物表达方式的规律,基于词汇语义的、包括汉语、英语及少数民族语言在内的多民族语言语义本体的表示理论与方法等。
-
关键词
知识库
语义本体
词典扩充
本体学习
-
Keywords
knowledge base
semantic ontology
dictionary enrichment
ontology learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-