传播用户代表性特征学习的谣言检测方法被引量：3

Rumor Detection Based on Representative User Characteristics Learning Through Propagation

下载PDF

导出

摘要谣言的及时发现和有效管控,是互联网+政务服务中公共舆情治理的重要组成部分。互联网和移动互联网的发展,提高了民众沟通交流的便利度,同时也加速了谣言的传播速度和广度,极大地提高了谣言的影响力和危害力,给民众的生产生活带来干扰,也严重影响社会秩序。现有的网络平台辟谣工作大多依赖于人工举报筛查,往往耗费大量的时间和精力。而利用数据挖掘、机器学习技术实现的谣言检测算法大多基于文本信息,常用于追溯性谣言检测,不适用于谣言扩散早期数据量不足的情况。首先收集最新的网络平台数据进行标注构造数据集Weibo2020,对其中用户特征分布进行统计分析并选择具有代表性的用户特征,进而提出了基于传播用户代表性特征学习的早期谣言检测方法(RPPC)。经实验验证,RPPC与同样基于传播路径的算法在同等条件下,在输入数据规模减少50%的同时,将准确率提高了2.57个百分点。此外,该方法能对5 min内发布的消息进行检测,快速发现互联网内容中的疑似谣言且准确率达到近80%。因此可以认为提出的方法在现有的数据集中有较好的表现,能够在一定程度上辅助政府部门的舆情治理工作,从而提高政务服务的时效及质量。 Effective rumor detection and management has become an essential part of Internet plus government services initiative.The Internet era brings great convenience to people's communication as well as speeds up the propagation of rumors,which not only interferes people's normal living but also does harm to the social confidence system.Existing work of rumor debunking on the Internet is mostly based on manual work of public tip-offs and screening,which is time consuming and demanding.Meanwhile,work on algorithm of rumor detection based on data mining and machine learning depends heavily on text content,which is deficient during the early stage of rumor propagation.This paper constructs latest dataset Weibo2020,composed of both rumors and normal information,and extracts representative user characteristics from the perspective of statistics,then proposes an algorithm of early-stage rumor detection based on brief propagation path,named RPPC(representative propagation path classification).The experimental results indicate that the proposed method can improve the prediction accuracy by 2.57 percentage points while reducing the input data scale by 50%.Meanwhile,the proposed method can predict the authenticity of news released in 5 minutes and achieve an accuracy of about 80%.Therefore,the proposed method achieves good results in a limited size of dataset and can to some degree help with network public opinion governance and improve the efficiency and quality of government service.

作者谢欣彤胡悦阳刘譞哲赵耀帅姜海鸥 XIE Xintong;HU Yueyang;LIU Xuanzhe;ZHAO Yaoshuai;JIANG Hai'ou(School of Electronics Engineering and Computer Science,Peking University,Beijing 100871,China;Key Laboratory of High Confidence Software Technologies of Ministry of Education(Peking University),Beijing 100871,China;TravelSky Technology Limited,Beijing 101318,China;Key Laboratory of Intelligent Passenger Service of Civil Aviation,Civil Aviation Administration of China,Beijing 101318,China;School of Software and Microelectronics,Peking University,Beijing 102600,China;Peking University Information Technology Institute(Tianjin Binhai),Tianjin 300452,China)

机构地区北京大学信息科学技术学院高可信软件技术教育部重点实验室(北京大学) 中国民航信息网络股份有限公司中国民用航空局民航旅客服务智能化应用技术重点实验室北京大学软件与微电子学院北京大学(天津滨海)新一代信息技术研究院

出处《计算机科学与探索》 CSCD 北大核心 2022年第6期1334-1342,共9页 Journal of Frontiers of Computer Science and Technology

基金国家重点研发计划(2018YFB1004400) 北京高等学校卓越青年科学家项目(BJJWZYJH01201910001004)。

关键词谣言检测机器学习特征分析传播路径互联网+政务服务舆情治理 rumor detection machine learning characteristic analysis propagation path Internet plus government services initiative public opinion management

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1陈燕方,李志宇,梁循,齐金山.在线社会网络谣言检测综述[J].计算机学报,2018,41(7):1648-1677. 被引量：39
2毛二松,陈刚,刘欣,王波.基于深层特征和集成分类器的微博谣言检测研究[J].计算机应用研究,2016,33(11):3369-3373. 被引量：23

二级参考文献19

1奥尔波特.谣言心理学[M].沈阳:辽宁教育出版社,2003.
2卡普费雷.谣言:世界最古老的传媒[M].郑若麟,译.上海:上海人民出版社,2008.
3拉扎斯菲尔德.人民的选择[M].唐茜,译.北京:中国人民大学出版社,2012:139-150.
4CNNIC.中国互联网络发展状况统计报告(2015年1月)[R].北京:中国互联网信息中心,2015.
5Qazvinian V, Rosengren E, Radev D R, et al. Rumor has it: identi- fying misinformation in microblogs [ C ]//Proc of Conference on Em- pirical Methods in Natural Language Processing. [ S. t. ] : Association for Computational Linguistics, 2011: 1589-1599.
6Castillo C, Mendoza M, Poblete B. Information credibility on twitter [ C]//Proc of the 20th International Conference on World Wide Web. New York:ACM Press, 2011: 675-684.
7Takahashi T, Igata N. Rumor detection on twitter [ C ]//Proc of the 13th Intet~aational Symposium on Advanced Intelligent Systems, and the Joint 6th International Conference on Soft Computing and Intelli- gent Systems. [ S. 1. ] :IEEE Press, 2012: 452-457.
8Yang Fan, Liu Yang, Yu Xiaohui, et al. Automatic detection of ru- mor on Sina Weibo[ C]//Proc of ACM SIGKDD Workshop on Mining Data Semantics. New York:ACM Press, 2012: 13.
9Sun Shengyun, Liu Hongyan, He Jun, et al. Detecting event rumors on Sina Weibo automatically [ M ]//Web Technologies and Applica- tions. Berlin:Springer, 2013.. 120-131.
10Mikolov T, Chen Kai, Con'ado G, et al. Efficient estimation of word representations in vector space [ C ]//Proc of International Conference on Learning Representations. 2013.

共引文献57

1肖栩豪,李晓军,李少臣,姚俊萍,慕晓冬.虚假信息检测技术研究综述[J].火箭军工程大学学报,2021(2):85-93.
2武庆圆,何凌南.基于多标签双词主题模型的短文本谣言分析研究[J].情报杂志,2017,36(3):92-97. 被引量：8
3付明明,余莎莎,应志领.在线社交网络的双谣言模型研究[J].计算机技术与发展,2017,27(9):53-59. 被引量：1
4首欢容,邓淑卿,徐健.基于情感分析的网络谣言识别方法[J].数据分析与知识发现,2017,1(7):44-51. 被引量：20
5廖祥文,黄知,杨定达,程学旗,陈国龙.基于分层注意力网络的社交媒体谣言检测[J].中国科学：信息科学,2018,48(11):1558-1574. 被引量：18
6陈燕方,李志宇,梁循,齐金山.在线社会网络谣言检测综述[J].计算机学报,2018,41(7):1648-1677. 被引量：39
7李力钊,蔡国永,潘角.基于C-GRU的微博谣言事件检测方法[J].山东大学学报（工学版）,2019,49(2):102-106. 被引量：21
8贾硕,张宁,沈洪洲.网络谣言传播与消解的研究进展[J].信息资源管理学报,2019,9(3):62-72. 被引量：15
9王志宏,过弋.微博谣言事件自动检测研究[J].中文信息学报,2019,33(6):132-140. 被引量：10
10黄淼,黄佩.基于知识关联特征的网络内容识别——以健康谣言为重点[J].北京邮电大学学报（社会科学版）,2020,22(1):1-6. 被引量：7

同被引文献26

1梁欣怡,行鸿彦,侯天浩.基于自监督特征增强的CNN-BiLSTM网络入侵检测方法[J].电子测量与仪器学报,2022,36(10):65-73. 被引量：20
2李云红,魏妮娜,张晓丹.基于多方向Gabor滤波器的图像分割[J].国外电子测量技术,2017,36(3):20-23. 被引量：8
3孙晶晶,静大海.基于神经网络复杂背景下车牌识别系统的研究[J].国外电子测量技术,2017,36(8):22-25. 被引量：9
4廖祥文,黄知,杨定达,程学旗,陈国龙.基于分层注意力网络的社交媒体谣言检测[J].中国科学：信息科学,2018,48(11):1558-1574. 被引量：18
5陈燕方,李志宇,梁循,齐金山.在线社会网络谣言检测综述[J].计算机学报,2018,41(7):1648-1677. 被引量：39
6高玉君,梁刚,蒋方婷,许春,杨进,陈俊任,王浩.社会网络谣言检测综述[J].电子学报,2020,48(7):1421-1435. 被引量：29
7刘金硕,冯阔,Jeff Z.Pan,邓娟,王丽娜.MSRD:多模态网络谣言检测方法[J].计算机研究与发展,2020,57(11):2328-2336. 被引量：20
8李奥,但志平,董方敏,刘龙文,冯阳.基于改进生成对抗网络的谣言检测方法[J].中文信息学报,2020,34(9):78-88. 被引量：13
9张少钦,杜圣东,张晓博,李天瑞.融合多模态信息的社交网络谣言检测方法[J].计算机科学,2021,48(5):117-123. 被引量：12
10胡斗,卫玲蔚,周薇,淮晓永,韩冀中,虎嵩林.一种基于多关系传播树的谣言检测方法[J].计算机研究与发展,2021,58(7):1395-1411. 被引量：14

引证文献3

1张岩珂,但志平,董方敏,高准,张洪志.多层次结构与半监督学习的谣言检测研究[J].国外电子测量技术,2024,43(2):84-92.
2陈鑫,荣欢,郭尚斌,杨彬.用于谣言检测的图卷积时空注意力融合与图重构方法[J].计算机科学,2024,51(11):54-64.
3朱奕,王根生,金文文,黄学坚,李胜.基于文本语义增强和评论立场加权的网络谣言检测[J].计算机科学与探索,2024,18(12):3311-3323.

1王沁,丁海昕,李志刚.疫情时期社交媒体舆论导向与对策分析[J].新丝路（中旬）,2022(2):0241-0243.
2孟义南.新媒体时代治安警情公开的价值分析、现实困境与创新路径[J].安徽警官职业学院学报,2021,20(3):47-54.
3刘丽华.档案管理中文本数据的增量多模态聚类方法[J].重庆大学学报,2022,45(5):147-156. 被引量：4
4于红波.以“组合拳”做好网络举报和辟谣工作[J].网络传播,2021(12):76-77.
5贺琛,吴莹,吕斯健.公共卫生事件中网络谣言的传播与治理——以新冠肺炎疫情期间的谣言信息为例[J].科技传播,2021,13(19):152-154. 被引量：3
6陈思媛,林佳议,刘思雅,朱江.突发公共事件中的短视频谣言研究——基于微博辟谣平台的谣言样本分析[J].新闻研究导刊,2021,12(21):58-61. 被引量：2
7梁梦云,吴承昊,唐燚,潘璐.《火品校园播商》课题调研报告[J].前卫,2022(5):143-145.
8刘梦雨.论大数据背景下财务会计向管理会计的转变[J].市场调查信息（综合版）,2022(10):58-60.
9廖圣清,方圆.基于仿真模型的社交网络辟谣效果研究[J].湖南师范大学社会科学学报,2021,50(6):138-148. 被引量：5
10常新功,王金珏.基于图卷积集成的网络表示学习[J].智能系统学报,2022,17(3):547-555.

计算机科学与探索

2022年第6期

浏览历史

内容加载中请稍等...

传播用户代表性特征学习的谣言检测方法被引量：3

参考文献2

二级参考文献19

共引文献57

同被引文献26

引证文献3

相关作者

相关机构

相关主题

浏览历史

传播用户代表性特征学习的谣言检测方法 被引量：3

参考文献2

二级参考文献19

共引文献57

同被引文献26

引证文献3

相关作者

相关机构

相关主题

浏览历史

传播用户代表性特征学习的谣言检测方法被引量：3