-
题名多源异构数据渐进式融合的虚假新闻检测
- 1
-
-
作者
于泳欣
纪科
高源
陈贞翔
马坤
赵晓凡
-
机构
济南大学信息科学与工程学院
山东省网络环境智能计算技术重点实验室
中国人民公安大学信息网络安全学院
安全防范技术与风险评估公安部重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2024年第11期30-38,共9页
-
基金
山东省重点研发计划(2021CXGC010103,2018CXGC0706)
山东省自然科学基金(ZR2022LZH016)。
-
文摘
社交媒体平台上充斥着大量未经验证的信息,这些信息大多为不同来源的异构数据,其传播范围之广、速度之快,对个人和社会造成了严重危害。因此,有效检测和防范虚假新闻至关重要。针对当前虚假新闻检测模型局限于从单一数据来源获取新闻文本及视觉信息,导致新闻报道主观性较强、数据覆盖不全面的问题,提出了一种多源异构数据渐进式融合的虚假新闻检测模型。首先,进行多源异构数据的收集、筛选和清洗,由此构建了一个多源多模态数据集,其中包含关于每个事件的多个不同角度的报道;接着,通过将文本特征提取器和视觉特征提取器获取的特征输入多源融合模块,实现了不同来源特征之间的渐进式融合;同时,引入文本的情感特征和图像的频域特征,以实现多层次的特征提取;最后,采用软注意力机制进行特征集成。实验结果和分析表明,与已有的流行方法相比,所提模型有较好的检测效果,为大数据时代的虚假新闻检测提供了一种有效的解决方案。
-
关键词
虚假新闻检测
数据扩增
多源异构数据
特征融合
情感特征
频域特征
-
Keywords
Fake news detection
Data augmentation
Multi-source heterogeneous data
Feature fusion
Sentiment feature
Frequency domain feature
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-