基于数据复杂度的投毒数据检测方法被引量：2

Method for detecting poisoning data based on data complexity

下载PDF

导出

摘要针对机器学习模型训练过程中攻击者可以利用修改原始训练数据生成投毒数据的方式对机器学习模型进行投毒攻击的问题,提出一种基于数据复杂度的投毒数据检测方法。该方法在正常数据集的基础上,应用梯度上升策略对正常数据集内的样本实例进行自我投毒,通过挖掘自我投毒产生的投毒数据对正常数据集数据复杂度的影响,训练能够辨别投毒数据的检测模型。该方法在选定应用场景中的检测准确率比现有方法有更好的效果。实验结果表明,投毒数据能够有效降低机器学习模型预测能力,应用基于数据复杂度的检测方法能够有效检测投毒数据,降低投毒数据对模型预测能力的不良影响。 Aiming at the problem that the attacker can modify original training data to generate poisoned data to poison the machine learning model in the process of training the model,this paper proposed a poisoned data detection method based on data complexity.On the basis of the normal data set,the method poisoned the sample instances in the normal data set based on a direct gradient ascent strategy,and exploited the influence of the poisoned data on the data complexity of the normal data set to build a detection model that could identify the poisoned data.The detection accuracy of this method in selected application scenarios was better than the existing method.The experimental results show that the poisoned data can effectively reduce the predictive ability of the machine learning model,and the application of the method based on data complexity can effectively detect the poisoning data and reduce the adverse effects of the poisoned data on the model prediction ability.

作者亢飞李建彬 Kang Fei;Li Jianbin(School of Information Science&Engineering,Central South University,Changsha 410083,China;Information Security&Big Data Research Institute,Central South University,Changsha 410083,China)

机构地区中南大学信息科学与工程学院中南大学信息安全与大数据研究院

出处《计算机应用研究》 CSCD 北大核心 2020年第7期2140-2143,共4页 Application Research of Computers

关键词机器学习投毒攻击梯度上升数据复杂度 machine learning poisoning attack gradient ascent data complexity

分类号 TP309.2 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1国务院印发《新一代人工智能发展规划》[J].广播电视信息,2017,0(8):17-17. 被引量：29

共引文献28

1冯秋燕,朱学芳.基于科学计量的信息技术融合分析[J].情报科学,2020,0(2):142-150. 被引量：4
2<政治学>教研课题组.师专政史专业开设《政治学》课程若干问题[J].六安师专学报,2000,16(1):78-79.
3吴寒天.公立研究型大学在人工智能热潮中的应对策略——以多伦多大学人工智能向量学院为例[J].世界教育信息,2018,31(16):58-63. 被引量：4
4胡建平.医疗健康人工智能发展框架与趋势分析[J].中国卫生信息管理杂志,2018,15(5):485-491. 被引量：21
5张明英,宋俊典,单曙兵,虎媛,尹思遥.中国人工智能开源软件生态探析[J].信息技术与标准化,2018(10):44-49.
6范旋,王芯,张滋艳.浅谈AI“情感化”的重要性[J].东西南北,2019,0(9):184-184.
7杨倩,杨明赵,杨奕.基于开源硬件的人工智能开放实验探索[J].山西电子技术,2019(2):8-10. 被引量：2
8朱磊.人工智能对开放教育的启示——以抖音APP为例[J].江苏科技信息,2019,36(10):62-64. 被引量：2
9熊远武,赵岭忠,翟仲毅.基于差分进化算法多智能体任务分配[J].计算机工程与设计,2019,40(10):3020-3029. 被引量：7
10李晓婷,方旭.高校教师人工智能教学应用现状调查研究[J].中国教育信息化,2019,25(20):78-81. 被引量：10

同被引文献19

1刘紫涵,吴鹏海,吴艳兰.三种谱聚类算法及其应用研究[J].计算机应用研究,2017,34(4):1026-1031. 被引量：14
2张海军,陈映辉.基于类图像处理与向量化的大数据脚本攻击智能检测[J].计算机工程,2020,46(3):129-137. 被引量：8
3宋秀丽,周道洋,文爱君.d维(t,n)门限量子同态加密算法的设计与仿真[J].电子学报,2020,48(5):846-853. 被引量：5
4郭丽峰,李智豪,胡磊.面向云存储的带关键词搜索的公钥加密方案[J].计算机研究与发展,2020,57(7):1404-1414. 被引量：11
5王静宇,刘思睿.大数据风险访问控制研究进展[J].计算机科学,2020,47(7):56-65. 被引量：4
6刘文芬,穆晓东,黄月华.基于多分辨率网格的异常检测方法[J].计算机工程与应用,2020,56(17):78-85. 被引量：4
7周伯阳,郭志民,王延松,阮伟,吴春明,周宁,张伟,程国振.基于多尺度低秩模型的电力无线接入网异常流量检测方法[J].电子学报,2020,48(8):1552-1557. 被引量：27
8魏立斐,陈聪聪,张蕾,李梦思,陈玉娇,王勤.机器学习的安全问题及隐私保护[J].计算机研究与发展,2020,57(10):2066-2085. 被引量：26
9邓宇乔,宋歌,杨波,彭长根,唐春明,温雅敏.基于身份的可验证密钥的公钥内积函数加密算法[J].计算机学报,2021,44(1):209-221. 被引量：10
10李欣姣,吴国伟,姚琳,张伟哲,张宾.机器学习安全攻击与防御机制研究进展和未来挑战[J].软件学报,2021,32(2):406-423. 被引量：22

引证文献2

1龚成清,何文华.面向校园人脸识别的数据投毒攻击检测算法研究[J].菏泽学院学报,2022,44(2):15-20. 被引量：2
2高丽杰,薛丽香,马照瑞,李振峰.大数据RSA公钥加密安全双向检测仿真[J].计算机仿真,2023,40(2):410-414. 被引量：2

二级引证文献4

1赵子晗,段同乐,张冬宁.基于滑动窗口的直升机序列异常检测算法[J].计算机测量与控制,2023,31(2):41-47. 被引量：1
2杨淑贞.基于深度学习的校园安全智能化检测研究[J].信息与电脑,2023,35(6):236-238.
3刘飞飞.基于区块链的超高压变电站大数据存储研究[J].智能城市,2023,9(9):36-38. 被引量：3
4罗雅丽.遗传算法支持下的通信数据安全设计及其仿真验证[J].电脑编程技巧与维护,2024(8):164-166.

1张国双,陈晓,林东岱,刘凤梅.基于Nonce重用的ACORN v3状态恢复攻击[J].通信学报,2020,41(8):11-21.

计算机应用研究

2020年第7期

浏览历史

内容加载中请稍等...

基于数据复杂度的投毒数据检测方法被引量：2

参考文献1

共引文献28

同被引文献19

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于数据复杂度的投毒数据检测方法 被引量：2

参考文献1

共引文献28

同被引文献19

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于数据复杂度的投毒数据检测方法被引量：2