-
题名面向虚假新闻检测的社交媒体多模态数据集构建
被引量:4
- 1
-
-
作者
高国鹏
房耀东
韩彦芳
钱振兴
秦川
-
机构
上海理工大学光电信息与计算机工程学院
复旦大学计算机科学技术学院
-
出处
《网络与信息安全学报》
2023年第4期144-154,共11页
-
基金
国家自然科学基金(U20B2051,62172280)
上海市自然科学基金(21ZR1444600)。
-
文摘
社交媒体的出现正在改变着人们的生活,通过社交媒体可以便捷地获取和分享新闻,但同时助力了虚假新闻的滋生和传播,从而严重影响社会安全和稳定。因此,虚假新闻检测引起了研究者广泛关注。尽管存在多种基于深度学习的解决方案,但这些方法需要大量的数据作为支撑。现有的虚假新闻数据集,尤其是中文数据集不仅稀缺,而且数据集中的新闻大多属于同一个类别。为了更好地检测虚假新闻,构建了一个新的多模态的虚假新闻数据集(MFND,multi-modal fake news dataset),其中包含政治、经济、娱乐、体育、国际、科技、军事、教育、健康和社会生活这10个类别的中文和英文新闻数据。对提出的虚假新闻数据集的词频和类别进行分析,并与现有的虚假新闻数据集在新闻数量、新闻类别、模态信息和新闻语种等方面进行了对比,结果显示MFND在类别信息和新闻语种方面表现突出。另外,利用现有的典型虚假新闻检测方法在MFND上进行训练和验证,实验结果表明,相较于现有主流的虚假新闻数据集,MFND可以为模型提供10%左右的性能提升。
-
关键词
社交媒体
虚假新闻检测
多模态
多类别
数据集
-
Keywords
social media
fake news detection
multi-modal
multi-category
dataset
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名县级供电企业创一流工作的实践与体会
- 2
-
-
作者
房耀东
-
机构
山东省苍山供电局
-
出处
《农村电工》
2000年第12期8-8,共1页
-
文摘
本文着重就职工心理素质对创一流工作的影响这一具有普遍意义的问题及创一流工作方法作一探讨.
-
关键词
县级供电企业
职工素质
教育培训
-
分类号
F426.61
[经济管理—产业经济]
-
-
题名面向感知哈希的图像数据集
- 3
-
-
作者
周元鼎
房耀东
秦川
-
机构
上海理工大学光电信息与计算机工程学院
-
出处
《中国图象图形学报》
CSCD
北大核心
2024年第2期343-354,共12页
-
基金
国家自然科学基金项目(62172280,U20B2051)
上海市自然科学基金项目(21ZR1444600)。
-
文摘
目的 感知图像哈希又称图像摘要或是图像指纹,是一种有效的图像认证技术,近年来受到了广泛的关注。该技术通过将图像的感知鲁棒特征转化为固定长度的哈希序列,来实现图像版权认证。然而,该领域始终缺乏一个比较通用的数据集,已有数据集所使用的图像内容保留操作和真实场景差异较大,使得训练得到的神经网络架构在应对复杂的图像编辑操作时效果显著下降。方法 针对感知图像哈希任务,面向实际图像内容认证场景构建了一个新的数据集。首先,将现实中常见的图像内容保留操作进行总结和分类,设计了48种单一、复合的图像内容保留操作来生成感知相似图像;然后,根据感知图像哈希的定义,选择与待认证图像语义相似但是感知内容不同的图像作为感知不相似图像,增加了该数据集的辨别难度;最终建立了一个包含116 400幅图像的感知哈希图像数据集。结果 由于本文提出的数据集使用的图像内容保留操作更加复杂,不相似图像也更加难以辨别,使得在该数据集上训练得到的深度神经网络具有较好的泛化能力,即这些神经网络即使不进行重新训练或是微调,也可以在其他数据集上取得较好的认证性能。同时,在该数据集上训练得到的神经网络在不同数据集上性能差别较小,体现了本文数据集具有较好的稳定性。结论 设计了一个针对感知哈希的图像数据集,大量的对比实验表明了该数据集的有效性,该工作可对感知图像哈希领域的发展起到促进作用。
-
关键词
感知图像哈希
图像认证
数据增强
数据集
内容保留操作
-
Keywords
perceptual image hashing
image authentication
data augmentation
dataset
content-preserving manipulation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-