基于文本语义增强和评论立场加权的网络谣言检测

Network Rumor Detection Based on Enhanced Textual Semantics and Weighted Comment Stance

下载PDF

导出

摘要社交网络方便人们信息交流的同时也为谣言的传播提供了新的温床。由于社交媒体帖子通常十分精简,大多数基于内容语义特征的谣言检测方法面临着语义信息不足的挑战。同时,目前基于传播特征的谣言检测方法常常忽略了评论用户的个体特征,未能合理分配不同用户评论的权重。因此,提出一种结合文本语义增强和评论立场加权的网络谣言检测方法。通过外部知识图谱获取帖子中的实体和概念的解释,以提供更多上下文信息,从而增强语义理解。借助点互信息将增强后的文本转化为加权图表示,并利用加权图注意力网络学习帖子的增强语义特征。通过预训练的立场检测模型提取帖子中每条评论的立场信息,并根据评论用户的特征来学习立场信息的权重值。将评论立场的时序数据和相应的评论用户序列数据输入跨模态的Transformer,以学习评论立场的时序特征。将增强的语义特征与加权的评论立场时序特征进行自适应融合,并输入多层感知机中进行分类。在PHEME和Weibo两个数据集上的实验结果表明,该方法不仅准确率高于最先进的基线方法1.6个百分点以上,而且在早期谣言检测方面,比最好的基线方法提前12 h。 Social networks,while enabling information exchange among individuals,also serve as fertile grounds for the dissemination of rumors.The succinct nature of social media posts poses a challenge for most rumor detection methods reliant on content semantic features due to the insufficiency of semantic information.Additionally,numerous rumor detection techniques focusing on propagation features often disregard the unique attributes of commenters,leading to inadequate allocation of weights to different user comments.Thus,a network rumor detection approach is proposed,integrating text semantic enhancement and weighted comment stance.Initially,entities and concepts in posts are elucidated via an external knowledge graph to furnish additional contextual information,thereby augmenting semantic comprehension.Subsequently,leveraging pointwise mutual information,the enhanced text is translated into a weighted graph representation,and a weighted graph attention network is employed to assimilate enhanced semantic features of posts.Stance information for each comment within the post is then extracted using a pre-trained stance detection model,with weight values of stance information being learnt based on commenters’characteristics.Furthermore,temporal data of comment stances and corresponding commenter sequences are fed into a cross-modal Transformer to glean the temporal features of comment stances.Ultimately,the enhanced semantic features are adaptively merged with the weighted temporal features of comment stances and fed into a multilayer perceptron for classification.Experimental results on the PHEME and Weibo datasets demonstrate that this method not only achieves an accuracy improvement of over 1.6 percentage points compared with the state-of-the-art baseline method but also outperforms the best baseline method by at least 12 hours in early rumor detection.

作者朱奕王根生金文文黄学坚李胜 ZHU Yi;WANG Gensheng;JIN Wenwen;HUANG Xuejian;LI Sheng(School of Finance,Taxation and Public Administration,Jiangxi University of Finance and Economics,Nanchang 330013,China;School of Information Management,Jiangxi University of Finance and Economics,Nanchang 330013,China;School of Humanities,Jiangxi University of Finance and Economics,Nanchang 330013,China)

机构地区江西财经大学财税与公共管理学院江西财经大学信息管理学院江西财经大学人文学院

出处《计算机科学与探索》 CSCD 北大核心 2024年第12期3311-3323,共13页 Journal of Frontiers of Computer Science and Technology

基金国家自然科学基金(72061015) 江西省自然科学基金(20242BAB20074)。

关键词谣言检测语义增强评论立场图神经网络知识图谱 rumor detection semantic enhancement comment stance graph neural network knowledge graph

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1黄学坚,马廷淮,王根生.基于分层语义特征学习模型的微博谣言事件检测[J].数据分析与知识发现,2023,7(5):81-91. 被引量：4
2谢欣彤,胡悦阳,刘譞哲,赵耀帅,姜海鸥.传播用户代表性特征学习的谣言检测方法[J].计算机科学与探索,2022,16(6):1334-1342. 被引量：3
3刘金硕,冯阔,Jeff Z.Pan,邓娟,王丽娜.MSRD:多模态网络谣言检测方法[J].计算机研究与发展,2020,57(11):2328-2336. 被引量：20
4黄学坚,王根生,罗远胜,闵潞,吴小芳,李志鹏.融合多元用户特征和内容特征的微博谣言实时检测模型[J].小型微型计算机系统,2022,43(12):2518-2527. 被引量：7
5王根生,朱奕,李胜.一种融合知识图谱的图注意力神经网络谣言实时检测方法[J].数据分析与知识发现,2024,8(6):95-106. 被引量：2
6汪建梅,彭云,余晨钰.融合时间序列与卷积神经网络的网络谣言检测[J].小型微型计算机系统,2022,43(5):1020-1026. 被引量：5
7胡斗,卫玲蔚,周薇,淮晓永,韩冀中,虎嵩林.一种基于多关系传播树的谣言检测方法[J].计算机研究与发展,2021,58(7):1395-1411. 被引量：15
8刘华玲,陈尚辉,曹世杰,朱建亮,任青青.基于多模态学习的虚假新闻检测研究[J].计算机科学与探索,2023,17(9):2015-2029. 被引量：3

二级参考文献42

1贺刚,吕学强,李卓,徐丽萍.微博谣言识别研究[J].图书情报工作,2013,57(23):114-120. 被引量：35
2郭崇.基于大数据分析的网购客户忠诚度建模仿真[J].计算机仿真,2015,32(10):239-242. 被引量：8
3刘知远,张乐,涂存超,孙茂松.中文社交媒体谣言统计语义分析[J].中国科学：信息科学,2015,45(12):1536-1546. 被引量：47
4谢柏林,蒋盛益,周咏梅,谢逸,李霞.基于把关人行为的微博虚假信息及早检测方法[J].计算机学报,2016,39(4):730-744. 被引量：18
5刘莉平,刘梦,李绍鹏.基于情感分析的新浪微博争议度分析[J].计算机工程与科学,2016,38(10):2158-2164. 被引量：2
6毛二松,陈刚,刘欣,王波.基于深层特征和集成分类器的微博谣言检测研究[J].计算机应用研究,2016,33(11):3369-3373. 被引量：23
7李明彩,刘凤鸣.谣言信息识别的最大熵模模型研究[J].小型微型计算机系统,2017,38(7):1475-1478. 被引量：4
8祖坤琳,赵铭伟,郭凯,林鸿飞.新浪微博谣言检测研究[J].中文信息学报,2017,31(3):198-204. 被引量：20
9杨文太,梁刚,谢凯,杨进,许春.基于突发话题和领域专家的微博谣言检测方法[J].计算机应用,2017,37(10):2799-2805. 被引量：13
10刘政,卫志华,张韧弦.基于卷积神经网络的谣言检测[J].计算机应用,2017,37(11):3053-3056. 被引量：43

共引文献49

1胡斗,卫玲蔚,周薇,淮晓永,韩冀中,虎嵩林.一种基于多关系传播树的谣言检测方法[J].计算机研究与发展,2021,58(7):1395-1411. 被引量：15
2徐铭达,张子柯,许小可.基于模体度的社交网络虚假信息传播机制研究[J].计算机研究与发展,2021,58(7):1425-1435. 被引量：9
3陈志毅,隋杰.基于DeepFM和卷积神经网络的集成式多模态谣言检测方法[J].计算机科学,2022,49(1):101-107. 被引量：11
4仝鑫,张长琳.互联网发展新背景下的网络谣言发展及防控机制研究[J].河南警察学院学报,2021,30(6):113-117.
5陆恒杨,范晨悠,吴小俊.面向网络社交媒体的少样本新冠谣言检测[J].中文信息学报,2022,36(1):135-144. 被引量：6
6王友卫,童爽,凤丽洲,朱建明,李洋,陈福.基于图卷积网络的归纳式微博谣言检测新方法[J].浙江大学学报（工学版）,2022,56(5):956-966. 被引量：4
7王壮,隋杰.基于多级融合的多模态谣言检测模型[J].计算机工程与设计,2022,43(6):1756-1761. 被引量：1
8唐樾,马静.基于增强对抗网络和多模态融合的谣言检测方法[J].情报科学,2022,40(6):108-114. 被引量：7
9吴诗苑,董庆兴,宋志君,张斌.社交媒体中错误信息的检测方法研究述评[J].情报学报,2022,41(6):651-661. 被引量：6
10范伟,刘勇.基于时空Transformer的社交网络信息传播预测[J].计算机研究与发展,2022,59(8):1757-1769. 被引量：8

1王东升,聂建军.一种基于改进YOLOv8网络模型的安全帽佩戴检测算法[J].中原工学院学报,2024,35(5):1-8.
2蔚莹.基于语义网的“网易云”评论文本分析[J].科技与创新,2024(22):181-184.
3张兆波,张金鹏,杜灿阳,曾庚运,朱传古,李晓春,刘颉.基于图特征学习的泵类设备多组件故障诊断方法[J].水电能源科学,2024,42(11):145-149.
4王国刚,刘一博.基于背景感知与响应自适应融合的相关滤波跟踪算法[J].计算机工程与设计,2024,45(11):3279-3288.
5陈晓佳,申黎明,汪洋.人体工学椅线上消费用户评论分析[J].家具,2024,45(6):47-51.
6赵贵中,黄淼华.基于BERT-BiLSTM-CRF的电力事故信息抽取方法[J].综合智慧能源,2024,46(11):19-28.
7黄冰毅.泛知识短视频评论情感分析:基于抖音和B站的跨平台比较研究[J].新媒体研究,2024,10(18):28-35.
8《领导决策信息》周刊联合课题组.同查同治斩断风腐转换链条[J].领导决策信息,2024(45):10-11.
9迟玉琢,李金灿.基于多维计量权重的学术论文推荐模型[J].山东图书馆学刊,2024(5):39-48.
10张书涛,杨志强,苏建宁,周爱民.用户评论异质情感的主题聚类仿真[J].控制与决策,2024,39(11):3645-3654.

计算机科学与探索

2024年第12期

浏览历史

内容加载中请稍等...

基于文本语义增强和评论立场加权的网络谣言检测

参考文献8

二级参考文献42

共引文献49

相关作者

相关机构

相关主题

浏览历史