基于Bert-Condition-CNN的中文微博立场检测被引量：11

Stance Detection in Chinese Microblogs via Bert-Condition-CNN Model

下载PDF

导出

摘要微博立场检测是判断一段微博文本针对某一目标话题所表达的观点态度是支持、中立或反对.随着社交媒体的发展,从海量的微博数据中挖掘其蕴含的立场信息成为一项重要的研究课题.但是现有的方法往往将其视作情感分类任务,没有对目标话题和微博文本之间的关系特征进行分析,在基于深度学习的分类框架上,扩展并提出了基于Bert-Condition-CNN的立场检测模型,首先为提高话题在文本中的覆盖率,对微博文本进行了主题短语的提取构成话题集;然后使用Bert预训练模型获取文本的句向量,并通过构建话题集和微博文本句向量之间的关系矩阵Condition层来体现两个文本序列的关系特征;最后使用CNN对Condition层进行特征提取,分析不同话题对立场信息的影响并实现对立场标签的预测.该模型在自然语言处理与中文计算会议(NLPCC2016)的数据集中取得了较好的效果,通过主题短语扩展后的Condition层有效地提升了立场检测的准确度. Stance detection task aims to automatically determine whether a Weibo text is in favor of the given target,against the given target, or neither. Mining the stance information about a given target is an emerging problem. Based on the success of deep learning in classifying, this study proposed a Bert-Condition-CNN model to predict the stance label.Firstly, noted that the given target may not be present in the Weibo text, so we extracted the topic phrases from Weibo corpus as the given target supplement. Then, we used Bert language model to accept the text representation vector and calculated a Condition matrix whose entries represent the relationship between Weibo text and topic phrases. Finally, a convolutional neural network was utilized to capture the stance features from Condition matrix. Experimental results on NLPCC2016 datasets demonstrate the model has achieved a sound effect of stance detection.

作者王安君黄凯凯陆黎明 WANG An-Jun;HUANG Kai-Kai;LU Li-Ming(College of Information,Mechanical and Electrical Engineering,Shanghai Normal University,Shanghai 201400,China)

机构地区上海师范大学信息与机电工程学院

出处《计算机系统应用》 2019年第11期45-53,共9页 Computer Systems & Applications

关键词立场检测主题短语关系矩阵句向量 stance detection topic phrase condition matrix text representation

分类号 G63 [文化科学—教育学]

引文网络
相关文献

参考文献4

1白静,李霏,姬东鸿.基于注意力的BiLSTM-CNN中文微博立场检测模型[J].计算机应用与软件,2018,35(3):266-274. 被引量：33
2岳天驰,张绍武,杨亮,林鸿飞,于凯.基于两阶段注意力机制的立场检测方法[J].广西师范大学学报（自然科学版）,2019,37(1):42-49. 被引量：10
3郑海洋,高俊波,邱杰,焦凤.基于词向量技术与主题词特征的微博立场检测[J].计算机系统应用,2018,27(9):118-123. 被引量：7
4奠雨洁,金琴,吴慧敏.基于多文本特征融合的中文微博的立场检测[J].计算机工程与应用,2017,53(21):77-84. 被引量：23

二级参考文献17

1郭丽娟,孙世宇,段修生.支持向量机及核函数研究[J].科学技术与工程,2008,8(2):487-490. 被引量：43
2周立柱,贺宇凯,王建勇.情感分析研究综述[J].计算机应用,2008,28(11):2725-2728. 被引量：73
3赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：543
4魏韡,向阳,陈千.中文文本情感分析综述[J].计算机应用,2011,31(12):3321-3323. 被引量：70
5刘志明,刘鲁.基于机器学习的中文微博情感分类实证研究[J].计算机工程与应用,2012,48(1):1-4. 被引量：124
6傅向华,刘国,郭岩岩,郭武彪.中文博客多方面话题情感分析研究[J].中文信息学报,2013,27(1):47-55. 被引量：17
7周胜臣,瞿文婷,石英子,施询之,孙韵辰.中文微博情感分析研究综述[J].计算机应用与软件,2013,30(3):161-164. 被引量：81
8顾益军,夏天.融合LDA与TextRank的关键词抽取研究[J].现代图书情报技术,2014(7):41-47. 被引量：70
9刘全超,黄河燕,冯冲.基于多特征微博话题情感倾向性判定算法研究[J].中文信息学报,2014,28(4):123-131. 被引量：17
10刘继,李磊.暴恐主题下微博用户特征及情感倾向性分析[J].情报杂志,2014,33(12):109-113. 被引量：14

共引文献52

1杨一璞,朱永华,高海燕,高文靖.一种结合文章信息的新闻评论情感分析方法[J].上海大学学报（自然科学版）,2022,28(1):170-178. 被引量：1
2杨利君,滕冲.基于增强的双向树表示的推特谣言立场检测模型[J].中文信息学报,2021,35(10):119-127.
3陈孜卓,林夕,王中卿.基于论据边界识别的立场分类研究[J].计算机科学,2022,49(S02):132-136. 被引量：1
4郑海洋,高俊波,邱杰,焦凤.基于词向量技术与主题词特征的微博立场检测[J].计算机系统应用,2018,27(9):118-123. 被引量：7
5岳天驰,张绍武,杨亮,林鸿飞,于凯.基于两阶段注意力机制的立场检测方法[J].广西师范大学学报（自然科学版）,2019,37(1):42-49. 被引量：10
6胡召亚,张顺香.基于关键句提取的中文微博情感计算[J].阜阳师范学院学报（自然科学版）,2019,36(3):92-96. 被引量：1
7李润川,张行进,王旭,陈刚,冀沙沙,王宗敏.基于单心搏活动特征与BiLSTM-Attention模型的心律失常检测[J].计算机应用与软件,2019,36(10):145-150. 被引量：3
8王伟,孙玉霞,齐庆杰,孟祥福.基于BiGRU-attention神经网络的文本情感分类模型[J].计算机应用研究,2019,36(12):3558-3564. 被引量：65
9罗计根,杜建强,聂斌,熊旺平,刘蕾,贺佳.基于双向LSTM和GBDT的中医文本关系抽取模型[J].计算机应用研究,2019,36(12):3744-3747. 被引量：11
10王立荣.Word2vec-CNN-Bilstm短文本情感分类[J].福建电脑,2020,36(1):11-16. 被引量：1

同被引文献73

1孙凯丽,邓沌华,李源,李妙,李洋.基于句内注意力机制多路CNN的汉语复句关系识别方法[J].中文信息学报,2020(6):9-17. 被引量：10
2徐琳宏,林鸿飞,潘宇,任惠,陈建美.情感词汇本体的构造[J].情报学报,2008,27(2):180-185. 被引量：384
3周立柱,贺宇凯,王建勇.情感分析研究综述[J].计算机应用,2008,28(11):2725-2728. 被引量：73
4赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：543
5Qingying SUN,Zhongqing WANG,Shoushan LI,Qiaoming ZHU,Guodong ZHOU.Stance detection via sentiment information and neural network model[J].Frontiers of Computer Science,2019,13(1):127-138. 被引量：5
6周耘立,李珊珊.微博立场检测研究综述[J].现代计算机（中旬刊）,2017(1):32-34. 被引量：2
7祖坤琳,赵铭伟,郭凯,林鸿飞.新浪微博谣言检测研究[J].中文信息学报,2017,31(3):198-204. 被引量：19
8奠雨洁,金琴,吴慧敏.基于多文本特征融合的中文微博的立场检测[J].计算机工程与应用,2017,53(21):77-84. 被引量：23
9张仰森,郑佳,黄改娟,蒋玉茹.基于双重注意力模型的微博情感分析方法[J].清华大学学报（自然科学版）,2018,58(2):122-130. 被引量：49
10郑海洋,高俊波,邱杰,焦凤.基于词向量技术与主题词特征的微博立场检测[J].计算机系统应用,2018,27(9):118-123. 被引量：7

引证文献11

1杨利君,滕冲.基于增强的双向树表示的推特谣言立场检测模型[J].中文信息学报,2021,35(10):119-127.
2张苑,祝小兰,杨东晓.基于深度学习的疫情情感分析[J].智能计算机与应用,2022,12(3):40-45. 被引量：1
3赵圆丽,梁志剑.基于异核卷积双注意机制的立场检测研究[J].计算机工程与应用,2021,57(8):119-125. 被引量：1
4赵姝颖,肖宁,曾华圣,王海兮,常明芳.基于RoBerta的立场检测与趋势预测模型设计[J].应用科技,2021,48(3):27-33. 被引量：4
5李俊,杨频.单目标立场检测研究综述[J].信息与电脑,2022,34(4):70-72.
6耿源羚,张绍武,张益嘉,林鸿飞,杨亮.基于卷积注意力的情感增强微博立场检测[J].山西大学学报（自然科学版）,2022,45(2):302-312. 被引量：2
7陈珂,周浩轩,王国权.基于预训练模型与记忆卷积网络的立场检测研究[J].计算机技术与发展,2023,33(8):180-185.
8林玩聪,韩明杰,靳婷.基于数据增强的多层次论点立场分类方法[J].广西师范大学学报（自然科学版）,2023,41(6):62-69.
9王正佳,李霏,姬东鸿,滕冲.基于多掩码与提示句向量融合分类的立场检测[J].计算机技术与发展,2023,33(12):156-162.
10王天雨,袁嘉伟,齐芮,李洋.多类型知识增强的微博立场检测模型[J].广西师范大学学报（自然科学版）,2024,42(1):79-90.

二级引证文献7

1李俊,杨频.单目标立场检测研究综述[J].信息与电脑,2022,34(4):70-72.
2周原.基于自然语言处理的纠错系统架构设计[J].太原师范学院学报（自然科学版）,2022,21(3):37-41. 被引量：3
3杨万灵.基于RoBERTa的数据增强与代码词嵌入代码补全模型[J].软件,2022,43(11):111-116.
4汤洁仪,李大军,刘波.基于BERT-BiLSTM-CRF模型的地理实体命名实体识别[J].北京测绘,2023,37(2):143-147. 被引量：7
5鲜于波,黄伟鑫.论辩文本立场检测——基于提示模型的小样本研究[J].逻辑学研究,2023,16(2):49-65.
6王正佳,李霏,姬东鸿,滕冲.基于多掩码与提示句向量融合分类的立场检测[J].计算机技术与发展,2023,33(12):156-162.
7王天雨,袁嘉伟,齐芮,李洋.多类型知识增强的微博立场检测模型[J].广西师范大学学报（自然科学版）,2024,42(1):79-90.

1刘辉,付会龙.基于课程目标评价的毕业要求指标点达成度评价[J].教育教学论坛,2019(50):59-60. 被引量：17
2杨世勤,王磊,杨雅婷,米成刚.基于短语汉维机器翻译解码的研究及实现[J].计算机工程与设计,2019,40(4):1183-1189. 被引量：3
3赵媛媛.中国制造，难以替代[J].纺织服装周刊,2019,0(31):4-4.
4王凯.主应力及其方向余弦计算的进一步研究[J].重庆交通大学学报（自然科学版）,2019,38(11):58-62. 被引量：2
5云科,石锋,穆润清,康辉.基于病案首页的心血管病种间共病关系分析[J].中国病案,2019,20(10):66-69. 被引量：2
6毕晓君,周泽宇.基于双通道GAN的高光谱图像分类算法[J].光学学报,2019,39(10):289-300. 被引量：15
7刘凤,张春玲,杨海燕.浅谈水泥基复合材料[J].区域治理,2018,0(3):283-283.
8周炜翔,张仰森,张良.面向微博热点事件的话题检测及表述方法研究[J].计算机应用研究,2019,36(12):3565-3569. 被引量：15
9刘莉,刘文云,刘建.基于DEMATEL的科研数据共享关键影响因素识别与分析[J].图书馆学研究,2019,0(18):54-62. 被引量：21
10胡静,陶洋,郭坦,孙雨浩,胡昊,王进.基于低秩矩阵恢复的群稀疏表示人脸识别方法[J].计算机工程与设计,2019,40(12):3588-3593. 被引量：4

计算机系统应用

2019年第11期

浏览历史

内容加载中请稍等...

基于Bert-Condition-CNN的中文微博立场检测被引量：11

参考文献4

二级参考文献17

共引文献52

同被引文献73

引证文献11

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于Bert-Condition-CNN的中文微博立场检测 被引量：11

参考文献4

二级参考文献17

共引文献52

同被引文献73

引证文献11

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于Bert-Condition-CNN的中文微博立场检测被引量：11