-
题名基于深度学习的韩国语影评情感词典构建
被引量:2
- 1
-
-
作者
赵天锐
刘晨阳
-
机构
战略支援部队信息工程大学
-
出处
《信息技术与信息化》
2021年第1期250-253,共4页
-
文摘
当前国内对韩国语领域情感词典的研究较少,本文借助深度学习技术,提出了一种将韩国语通用情感词典拓展为影评领域情感词典的方法。利用网络电影评论构建语料库,然后在语料库基础上训练词向量,将语料库和现存通用情感词典中共同出现的词汇作为语料训练神经网络,最后使用神经网络分类器对备选情感词汇进行判断,得到其情感倾向后与通用情感词典进行合并,得到领域情感词典。实验结果表明:使用该方法得到的情感词典在影评文本情感分析中得到了较好的结果。
-
关键词
深度学习
韩国语
情感词典
影评
-
分类号
H55
[语言文字]
-
-
题名基于深度学习的韩国语文本情感分类
- 2
-
-
作者
赵天锐
-
机构
战略支援部队信息工程大学洛阳校区
-
出处
《智能计算机与应用》
2021年第5期82-87,共6页
-
文摘
文本情感分析(又称意见挖掘),是对带有情感倾向的文本进行分析、处理、归纳和推理的过程。本文提出将卷积神经网络(CNN)和双向长短时记忆网络(Bi-LSTM)相结合,作为提取文本特征的方式,而后添加自注意力(Self-Attention)机制形成情感分析模型。通过在自建的NAVER电影评论数据库中进行比较实验,证明本文模型的分类准确率可达90.32%,较SVM、CNN、LSTM、Bi-LSTM等模型有较大的性能提升。该方法不仅可以较好地完成韩语短文本情感分析,对其它非通用语种和领域的情感分析任务也具备参考和借鉴意义。
-
关键词
韩语
情感分析
FastText
CNN
Bi-LSTM
Self-Attention
-
Keywords
Korean
sentiment analysis
FastText
CNN
Bi-LSTM
Self-Attention
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于机器学习的韩国语新造词透明度探究
- 3
-
-
作者
赵天锐
-
机构
战略支援部队信息工程大学洛阳校区
-
出处
《电脑知识与技术》
2021年第4期204-206,共3页
-
文摘
机器学习在诸多学科领域的定量分析中都已经显现出了巨大价值。本文借助sklearn机器学习库,以韩国国立国语院2015年发布的《新词调查报告书》中收录的新造词为对象,根据报告中出现的分类标准为词汇建立特征矩阵。而后运用多种机器学习算法进行特征选择,最终筛选出对韩国语新造词词义理解影响较强的因素。实验结果表明:如果该词为派生词或外来词,该词呈现低透明度的概率更高。
-
关键词
韩国语
机器学习
新词
逻辑回归
随机森林
-
Keywords
Korean
machine learning
new words
logistic regression
random forest
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融入双语词向量的韩汉名词短语对齐方法研究
- 4
-
-
作者
刘晨阳
赵天锐
-
机构
信息工程大学洛阳校区
-
出处
《智能计算机与应用》
2021年第9期42-47,共6页
-
文摘
针对传统短语对齐方法依赖外部资源,且较少涉及平行句对内在特征的问题,提出了融入双语词向量的韩汉名词短语对齐方法。利用平行语料,分别训练单语词向量再进行跨语言映射得到双语词向量,并构建了基于短语构成规律的短语抽取和融入双语词向量、短语长度和词性相似度的短语对齐模型。实验结果证明,融入韩汉双语词向量,能更有效地提取短语特征从而实现短语对齐。
-
关键词
韩语-汉语
名词短语对齐
双语词向量
平行语料库
-
Keywords
Korean-Chinese
noun phrase alignment
bilingual word embedding
parallel corpus
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-