-
题名融合多特征和表情情感词典的性别对立言论识别方法
- 1
-
-
作者
马子晨
张顺香
刘云朵
朱广丽
-
机构
安徽理工大学计算机科学与工程学院
合肥综合性国家科学中心人工智能研究院
-
出处
《数据采集与处理》
CSCD
北大核心
2024年第3期699-709,共11页
-
基金
国家自然科学基金面上项目(62076006)
安徽省高校协同创新项目(GXXT⁃2021⁃008)。
-
文摘
为识别相关极端言论,提出了一种融合多特征和表情情感词典的性别对立言论识别方法。首先,使用BERT(Bidirectional encoder representation from transformer)提取输入文本的字符特征,并使用Word2Vec提取输入文本中五笔、郑码以及拼音3个方面的特征;然后,将这4个方面的特征进行融合,再输入到Bi-GRU(Bi-directional gated recurrent unit)网络中学习更深层次的语义信息;最后,通过全连接层加SoftMax函数计算出情感极性概率,并融合表情情感词典判别输入文本是否为性别对立言论。通过在自行收集的中文性别对立数据集上进行实验,与未加入特征和表情情感词典的方法相比,在F1值上有5.19%的提升。同时,在公开中文情感分析数据集Weibo_senti_100k上进行验证,证明了本方法的泛化性。
-
关键词
性别对立
表情情感词典
多特征
BERT
Bi-GRU
Word2Vec
-
Keywords
gender opposition
emoji sentiment lexicon
multi-feature
BERT
Bi⁃GRU
Word2Vec
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-