融合多元用户特征和内容特征的微博谣言实时检测模型被引量：6

Weibo Rumors Real-time Detection Model Based on Fusion of Multi User Features and Content Features

下载PDF

导出

摘要针对目前基于单文本语义特征深度学习的微博谣言实时检测模型泛化能力不足的问题,提出一种融合多元用户特征和内容特征的实时检测模型.首先,在传统用户基本特征和内容统计特征的基础上,利用用户的历史行为数据,挖掘用户理性值和用户专业度两个深层次特征;然后,基于词向量和带有注意力机制的双向GRU神经网络构建文本语义特征学习模型;最后,采用分层特征级联和全连接的方式进行特征融合,把融合特征输入分类模型进行训练.实验结果表明,该模型的检测准确率达到了91.74%,相比其他只关注文本语义特征的深度学习实时检测模型具有更好的识别效果,相比于其他改进型的实时检测模型F1-Measure值也提高了2.19%. In order to solve the problem of low generalization ability of Weibo rumor real-time detection model based on deep learning of text semantic features,a real-time detection model fusion of multi user features and content features is proposed.First of all,in addition to the traditional user basic features and content statistical features,two implicit features of user rationality and user professionalism are mined based on user′s historical behavior data;Then,a text semantic feature learning model is constructed based on word vector and bidirectional GRU neural network with attention mechanism;Finally,the hierarchical cascade and full connection are used for feature fusion,and the fused features are input into the classification model for training.The experimental results show that the accuracy of the model is 91.74%,which is better than other deep learning real-time detection models based on text semantic features.Compared with other improved real-time detection models,F1-Measure value also increased by 2.19%.

作者黄学坚王根生罗远胜闵潞吴小芳李志鹏 HUANG Xue-jian;WANG Gen-sheng;LUO Yuan-sheng;MIN Lu;WU Xiao-fang;LI Zhi-peng(School of Humanities,Jiangxi University of Finance and Economic,Nanchang 330013,China;Computer Practice Teaching Center,Jiangxi University of Finance and Economics,Nanchang 330013,China;School of International Trade and Economics,Jiangxi University of Finance and Economic,Nanchang 330013,China)

机构地区江西财经大学人文学院江西财经大学计算机实践教学中心江西财经大学国际经贸学院

出处《小型微型计算机系统》 CSCD 北大核心 2022年第12期2518-2527,共10页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(72061015,61562031)资助江西省教育厅科技项目(GJJ200539)资助。

关键词微博谣言实时检测特征融合深层特征深度学习 Weibo rumors real-time detection feature fusion implied features deep learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1高玉君,梁刚,蒋方婷,许春,杨进,陈俊任,王浩.社会网络谣言检测综述[J].电子学报,2020,48(7):1421-1435. 被引量：28
2陈燕方,李志宇,梁循,齐金山.在线社会网络谣言检测综述[J].计算机学报,2018,41(7):1648-1677. 被引量：38
3贺刚,吕学强,李卓,徐丽萍.微博谣言识别研究[J].图书情报工作,2013,57(23):114-120. 被引量：35
4曾子明,王婧.基于LDA和随机森林的微博谣言识别研究——以2016年雾霾谣言为例[J].情报学报,2019,38(1):89-96. 被引量：53
5谢柏林,蒋盛益,周咏梅,谢逸,李霞.基于把关人行为的微博虚假信息及早检测方法[J].计算机学报,2016,39(4):730-744. 被引量：18
6刘知远,宋长河,杨成.社交媒体平台谣言的早期自动检测[J].全球传媒学刊,2018,5(4):65-80. 被引量：8
7廖祥文,黄知,杨定达,程学旗,陈国龙.基于分层注意力网络的社交媒体谣言检测[J].中国科学：信息科学,2018,48(11):1558-1574. 被引量：17
8李力钊,蔡国永,潘角.基于C-GRU的微博谣言事件检测方法[J].山东大学学报（工学版）,2019,49(2):102-106. 被引量：21
9李奥,但志平,董方敏,刘龙文,冯阳.基于改进生成对抗网络的谣言检测方法[J].中文信息学报,2020,34(9):78-88. 被引量：13
10潘德宇,宋玉蓉,宋波.一种新的考虑注意力机制的微博谣言检测模型[J].小型微型计算机系统,2021,42(2):348-353. 被引量：11

二级参考文献80

1任一奇,王雅蕾,王国华,冯伟.微博谣言的演化机理研究[J].情报杂志,2012,31(5):50-54. 被引量：40
2邓国峰,唐贵伍.网络谣言传播及其社会影响研究[J].求索,2005(10):88-90. 被引量：59
3胡钰.大众传播效果[M]{H}北京:新华出版社,2000120-121.
4Castillo C,Mendoza M,Poblete B. Information credibility on Twitter[A].New York:ACL,2011.675-684.
5Qazvinian V,Rosengren E,Radev D R. Rumor has it:Identifying misinformation in microblogs[A].Edinburgh:ACL,2011.1589-1599.
6Mendoza M,Pdblete B,Castillo C. Twitter under crisis:Can we trust what we RT[A].New York:ACL,2010.71-79.
7Takahashi T,Igata N. Rumor detection on Twitter[A].Kobe:IEEE,2012.452-457.
8Yang Fan,Liu Y,Yu X. Automatic detection of rumor on Sina Weibo[A].Beijing:ACM,2012.1-7.
9Wang A H. Don't follow me:Spam detection in Twitter[A].Athens:SciThePress,2010.142-151.
10Zhang Huaping,Yu Hongkui,Xiong Deyi. HHMM-based Chinese lexical analyzer ICTCLAS[OL].http://www.docin.wm/p-824199.html,2013.

共引文献249

1王建英,张辉.基于社会化媒体的众包灾害医学救援初探[J].灾害医学与救援（电子版）,2014(3):162-164.
2顾秋阳,琚春华,鲍福光.融入用户关系强度的社交网络舆情信源发现方法[J].系统科学与数学,2020(9):1578-1596. 被引量：1
3杨利君,滕冲.基于增强的双向树表示的推特谣言立场检测模型[J].中文信息学报,2021,35(10):119-127.
4万齐斌,胡枫,周马特.面向推特平台的谣言检测综述[J].信息通信,2019,0(12):137-139. 被引量：1
5肖栩豪,李晓军,李少臣,姚俊萍,慕晓冬.虚假信息检测技术研究综述[J].火箭军工程大学学报,2021(2):85-93.
6陈昌凤,师文.智能化新闻核查技术:算法、逻辑与局限[J].新闻大学,2018(6):42-49. 被引量：30
7段大高,王长生,韩忠明,李斌.基于微博评论的虚假消息检测模型[J].计算机仿真,2016,33(1):386-390. 被引量：9
8路同强,石冰,闫中敏,周珮.一种用于微博谣言检测的半监督学习算法[J].计算机应用研究,2016,33(3):744-748. 被引量：3
9陶成.“量身”服务助力老年读者识别社交平台谣言[J].当代图书馆,2016,0(4):4-6. 被引量：2
10王一华.社交媒体信息可信度评估研究综述[J].现代情报,2016,36(12):164-169. 被引量：4

同被引文献52

1贺刚,吕学强,李卓,徐丽萍.微博谣言识别研究[J].图书情报工作,2013,57(23):114-120. 被引量：35
2徐静,杨小平,柳增.基于内容信任的Web信息可信度验证方法研究[J].北京理工大学学报,2014,34(7):710-715. 被引量：6
3刘知远,张乐,涂存超,孙茂松.中文社交媒体谣言统计语义分析[J].中国科学：信息科学,2015,45(12):1536-1546. 被引量：45
4李保珍,王亚.社交媒体环境下网络信息可信度评估研究综述[J].情报学报,2015,34(12):1314-1321. 被引量：12
5谢柏林,蒋盛益,周咏梅,谢逸,李霞.基于把关人行为的微博虚假信息及早检测方法[J].计算机学报,2016,39(4):730-744. 被引量：18
6祖坤琳,赵铭伟,郭凯,林鸿飞.新浪微博谣言检测研究[J].中文信息学报,2017,31(3):198-204. 被引量：19
7首欢容,邓淑卿,徐健.基于情感分析的网络谣言识别方法[J].数据分析与知识发现,2017,1(7):44-51. 被引量：20
8刘雅辉,靳小龙,沈华伟,鲍鹏,程学旗.社交媒体中的谣言识别研究综述[J].计算机学报,2018,41(7):1536-1558. 被引量：37
9陈燕方,李志宇,梁循,齐金山.在线社会网络谣言检测综述[J].计算机学报,2018,41(7):1648-1677. 被引量：38
10曾子明,王婧.基于LDA和随机森林的微博谣言识别研究——以2016年雾霾谣言为例[J].情报学报,2019,38(1):89-96. 被引量：53

引证文献6

1冯兰萍,董陈超,徐绪堪.基于混合神经网络的突发公共卫生事件微博谣言识别研究[J].情报杂志,2022,41(12):81-88. 被引量：6
2黄学坚,马廷淮,王根生.基于分层语义特征学习模型的微博谣言事件检测[J].数据分析与知识发现,2023,7(5):81-91. 被引量：3
3谢宁宁,杨新凯.融合语义特征和统计特征的虚假招聘检测模型[J].计算机与数字工程,2023,51(10):2379-2383.
4钱旦敏,郑建明,王文敬,马野青.基于信息可信度评估的突发公共卫生事件谣言识别研究[J].情报科学,2024,42(2):35-42.
5王根生,朱奕,李胜.一种融合知识图谱的图注意力神经网络谣言实时检测方法[J].数据分析与知识发现,2024,8(6):95-106.
6安全,徐国天.基于领域信息和自定义门控网络的网络谣言实时检测方法[J].情报杂志,2024,43(10):127-133.

二级引证文献9

1刘岩芳,黄燚红.基于Cooc的网络谣言研究知识图谱分析[J].传播与版权,2023(15):81-84.
2安全,徐国天.基于专家混合与领域特征的网络谣言识别模型[J].警察技术,2023(6):68-73.
3冯楠,曹弘毅,李妮.利用AFW BPNN模型实现微博真伪信息识别[J].西安工业大学学报,2023,43(6):605-613.
4贺国秀,任佳渝,李宗耀,林晨曦,蔚海燕.以可解释工具重探基于深度学习的谣言检测[J].数据分析与知识发现,2024,8(4):1-13. 被引量：1
5钱旦敏,郑建明,王文敬,马野青.基于信息可信度评估的突发公共卫生事件谣言识别研究[J].情报科学,2024,42(2):35-42.
6段可霓,周怡洁,俞定国,闫燕勤.我国辟谣领域研究概述——基于CNKI文献的数据可视化分析[J].新媒体研究,2024,10(6):6-11.
7陈果,尹梓涵.信息资源管理视域下的健康信息学研究——国内外研究主题对比分析[J].现代情报,2024,44(8):137-152.
8王根生,朱奕,李胜.一种融合知识图谱的图注意力神经网络谣言实时检测方法[J].数据分析与知识发现,2024,8(6):95-106.
9王梓宁,张国防.考虑多交互关系与情感倾向的微博用户可信度评估算法[J].计算机应用研究,2024,41(10):3000-3007.

1张剑.全媒体时代,探索党媒用户运营的融合路径[J].全媒体探索,2022(5):27-28.
2黄如花,黄雨婷,李雅.国内外开放政府数据利用研究:进展与动向[J].情报资料工作,2022,43(4):5-15. 被引量：11
3钟委钊,陈荟慧.基于群智感知的街景变化检测方法[J].计算机应用研究,2022,39(10):3186-3190. 被引量：1
4帅英杰.一种基于特征融合的医疗病例实体识别方法[J].广西职业技术学院学报,2022,15(2):63-68.
5王永刚,王志愿,吴晨佳.基于交互护理系统的智能医用床设计研究[J].长春师范大学学报,2022,41(8):84-87. 被引量：1
6李港,李莉,林国义,董怡.硬盘故障预测模型的建立与实现[J].控制工程,2022,29(10):1788-1792. 被引量：2
7潘虹锦,高红均,杨艳红,马望,赵银波,刘俊勇.基于主从博弈的售电商多元零售套餐设计与多级市场购电策略[J].中国电机工程学报,2022,42(13):4785-4799. 被引量：23
8Sanjar M. Abrarov,Rehan Siddiqui,Rajinder K. Jagpal,Brendan M. Quine.A Method to Reduce the Lehmer Measure in a Multi-Term Machin-Like Formula for π[J].Open Journal of Applied Sciences,2022,12(8):1477-1493.
9王磊,宦克为,刘小溪,岳丹,韩丰地,张文捷.基于卷积神经网络的近红外光谱全流程分析模型研究[J].分析化学,2022,50(12):1918-1926. 被引量：10
10陈瑜娜.轻叩诗歌之门建构学生古诗词学习新路径[J].成才之路,2022(35):89-92. 被引量：1

小型微型计算机系统

2022年第12期

浏览历史

内容加载中请稍等...

融合多元用户特征和内容特征的微博谣言实时检测模型被引量：6

参考文献15

二级参考文献80

共引文献249

同被引文献52

引证文献6

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

融合多元用户特征和内容特征的微博谣言实时检测模型 被引量：6

参考文献15

二级参考文献80

共引文献249

同被引文献52

引证文献6

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

融合多元用户特征和内容特征的微博谣言实时检测模型被引量：6