-
题名基于粗糙集的不完备谣言信息系统的知识获取与决策
- 1
-
-
作者
王标
卫红权
王凯
刘树新
江昊聪
-
机构
中国人民解放军战略支援部队信息工程大学
国家数字交换系统工程技术研究中心
-
出处
《信息安全学报》
CSCD
2024年第2期19-35,共17页
-
基金
中原英才计划项目(No.212101510002)资助。
-
文摘
网络谣言可能扰乱人们的思想、心理和行为,引发社会震荡、危害公共安全,而微博等社交平台的广泛应用使得谣言造成的影响与危害变得更大,因此,谣言检测对于网络空间的有序健康发展具有重要的意义。当前谣言的自动检测技术更多关注检测模型的构建和输入数据的表现形式,而在改善数据质量以提高谣言识别效果方面的研究很少。基于此,本文将粗糙集理论应用于不完备谣言信息系统进行知识获取与决策,实质上是通过粗糙集理论解决不完备谣言信息系统的不确定性度量,冗余性以及不完备性等问题,以获得高质量的数据,改善谣言检测效果。首先系统总结了粗糙集理论中不确定性度量的方法,包括香农熵、粗糙熵、Liang熵以及信息粒度等四种不确定度量方法,并整理和推导了这四种不确定度量方法从完备信息系统到不完备信息系统的一致性拓展。基于上述总结的四种不确定度量方法,提出了基于最大相关最小冗余(MCMR,Maximum Correlation Minimum Redundancy)的知识约简算法。该方法基于熵度量方式,能够综合考量决策信息与冗余噪音,在UCI及Weibo等8个数据集上实验验证,结果表明本文算法优于几种基线算法,能够有效解决信息系统的冗余性。另外,提出了一种基于极大相容块的不完备决策树算法,在不同缺失程度数据上实验验证,结果表明本文算法能够有效解决信息系统的不完备性。
-
关键词
谣言检测
粗糙集
不完备信息系统
最大相关最小冗余
极大相容块
-
Keywords
rumor detection
rough set
incomplete information system
maximum correlation minimum redundancy
maximal consistent blocks
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
O236
[理学—运筹学与控制论]
-