-
题名多注意力层次神经网络文本情感分析
被引量:11
- 1
-
-
作者
韩虎
刘国利
孙天岳
赵启涛
-
机构
兰州交通大学电子与信息工程学院
甘肃省人工智能与图形图像工程研究中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2020年第10期100-105,共6页
-
基金
国家社会科学基金(No.17BXW071)
国家自然科学基金(No.61562057)
甘肃省科技计划项目(No.18JR3RA104)。
-
文摘
在文本情感分析研究中,一条评论分别包含了篇章级、句子级和词语级等不同粒度的语义信息,而不同的词和句子在情感分类中所起的作用也是不同的,直接使用整条评论进行建模的情感分析方法则过于粗糙,同时也忽略了表达情感的用户信息和被评价的产品信息。针对该问题,提出一种基于多注意力机制的层次神经网络模型。该模型分别从词语级别、句子级别和篇章级别获取语义信息,并分别在句子级和篇章级引入基于用户和商品的注意力机制来计算不同句子和词的重要性。最后通过三个公开数据集进行测试验证,实验结果表明,基于多注意力层次神经网络的文本情感分析方法较其他模型性能有显著的提升。
-
关键词
情感分析
神经网络
粒度
注意力机制
-
Keywords
sentiment analysis
neural network
granularity
attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向社交媒体评论的上下文语境讽刺检测模型
被引量:5
- 2
-
-
作者
韩虎
赵启涛
孙天岳
刘国利
-
机构
兰州交通大学电子与信息工程学院
甘肃省人工智能与图形图像工程研究中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第1期66-71,共6页
-
基金
国家自然科学基金(61562057)
国家社会科学基金(17BXW071)
甘肃省科技计划项目(18JR3RA104)。
-
文摘
讽刺是日常交际中一种常见的语用现象,能够丰富说话者的观点并间接地表达说话者的深层含义。讽刺检测任务的研究目标是挖掘目标语句的讽刺倾向。针对讽刺语境表达变化多样以及不同用户、不同主题下的讽刺含义各不相同等特征,构建融合用户嵌入与论坛主题嵌入的上下文语境讽刺检测模型。该模型借助ParagraphVector方法的序列学习能力对用户评论文档与论坛主题文档进行编码,从而获取目标分类句的用户讽刺特征与主题特征,并利用一个双向门控循环单元神经网络得到目标句的语句编码。在标准讽刺检测数据集上进行的实验结果表明,与传统Bag-of-Words、CNN等模型相比,该模型能够有效提取语句的上下文语境信息,具有较高的讽刺检测分类准确率。
-
关键词
自然语言处理
上下文语境讽刺检测
深度学习
ParagraphVector模型
双向门控循环单元模型
-
Keywords
Natural Language Processing(NLP)
contextual sarcasm detection
deep learning
ParagraphVector model
Bi-directional-Gated Recurrent Unit(Bi-GRU)model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名引入自编码机制对抗网络的文本生成模型
被引量:2
- 3
-
-
作者
韩虎
孙天岳
赵启涛
-
机构
兰州交通大学电子与信息工程学院
甘肃省人工智能与图形图像工程研究中心
-
出处
《计算机工程与科学》
CSCD
北大核心
2020年第9期1704-1710,共7页
-
基金
国家社会科学基金(17BXW071)
国家自然科学基金(61562057)
甘肃省科技计划(18JR3RA104)。
-
文摘
自编码模型是一种无监督的学习算法,主要用于数据的降维和特征提取。在对抗神经网络模型基础上引入自编码模型,旨在提高输入数据的特征表示。主要使用前馈神经网络和Seq2seq模型学习原文本特征,将随机数据变为具有特征的数据作为输入,加快训练的速度,提高模型的准确率。同时使用强化学习模型解决反向传播中离散化数据梯度难以下降的问题。模型的鉴别器使用CNN网络和交叉熵模型,使生成的文本具有新颖性。使用BELU评价指标和主观评价的实验结果均表明了该模型的有效性。
-
关键词
生成对抗神经网络
自编码模块
强化学习
交叉熵
-
Keywords
generative adversarial neural network
autoencoder
reinforcement learning
cross entropy
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-