深度学习模型中的公平性研究被引量：1

Research on Fairness in Deep Learning Models

下载PDF

导出

摘要近几年深度神经网络正被广泛应用于现实决策系统,决策系统中的不公平现象会加剧社会不平等,造成社会危害.因此研究者们开始对深度学习系统的公平性展开大量研究,但大部分研究都从群体公平的角度切入,且这些缓解群体偏见的方法无法保证群体内部的公平.针对以上问题,定义两种个体公平率计算方法,分别为基于输出标签的个体公平率(IFRb),即相似样本对在模型预测中标签相同的概率和基于输出分布的个体公平率(IFRp),即相似样本对的预测分布差异在阈值范围内的概率,后者是更严格的个体公平.更进一步,提出一种提高模型个体公平性的算法IIFR,该算法通过余弦相似度计算样本之间的差异程度,利用相似临界值筛选出满足条件的相似训练样本对,最后在训练过程中将相似训练样本对的输出差异作为个体公平损失项添加到目标函数中,惩罚模型输出差异过大的相似训练样本对,以达到提高模型个体公平性的目的.实验结果表明, IIFR算法在个体公平的提升上优于最先进的个体公平提升方法.此外IIFR算法能够在提高模型个体公平性的同时,较好地维持模型的群体公平性. In recent years,deep neural networks have been widely employed in real decision-making systems.Unfairness in decisionmaking systems will exacerbate social inequality and harm society.Therefore,researchers begin to carry out a lot of studies on the fairness of deep learning systems,where as most studies focus on group fairness and cannot guarantee fairness within the group.To this end,this study defines two individual fairness calculation methods.The first one is individual fairness rate IFRb based on labels of output,which is the probability of having the same predicted label for two similar samples.The second is individual fairness rate IFRp based on distributions of output,which is the probability of having similar predicted output distribution for two similar samples respectively,and the latter has stricter individual fairness.In addition,this study proposes an algorithm IIFR to improve the individual fairness of these models.The algorithm employs cosine similarity to measure the similarity between samples and then selects similar sample pairs via the similarity threshold decided by different applications.Finally,the output difference of the similar sample pairs is added to the objective function as an individual fairness loss item during the training,which penalizes the similar training samples with large differences in model output to improve the individual fairness of the model.The experimental results show that the proposed IIFR algorithm outperforms the state-of-the-art methods on individual fairness improvement,and can maintain group fairness of models while improving individual fairness.

作者王昱颖张敏杨晶然徐晟恺陈仪香 WANG Yu-Ying;ZHANG Min;YANG Jing-Ran;XU Sheng-Kai;CHEN Yi-Xiang(Software Engineering Institute,East China Normal University,Shanghai 200062,China;Shanghai Key Laboratory of Trustworthy Computing(East China Normal University),Shanghai 200062,China)

机构地区华东师范大学软件工程学院上海市高可信重点实验室(华东师范大学)

出处《软件学报》 EI CSCD 北大核心 2023年第9期4037-4055,共19页 Journal of Software

基金国家自然科学基金(61672012) 国家自然科学基金中以国际合作项目(62161146001) 科技部重点研发项目(2020AAA0107800)。

关键词深度学习模型偏见个体公平群体公平 deep learning model bias individual fairness group fairness

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1刘文炎,沈楚云,王祥丰,金博,卢兴见,王晓玲,查宏远,何积丰.可信机器学习的公平性综述[J].软件学报,2021,32(5):1404-1426. 被引量：24

二级参考文献5

1孟小峰,王雷霞,刘俊旭.人工智能时代的数据隐私、垄断与公平[J].大数据,2020,6(1):35-46. 被引量：17
2何积丰.安全可信人工智能[J].信息安全与通信保密,2019,0(10):4-8. 被引量：15
3刘睿瑄,陈红,郭若杨,赵丹,梁文娟,李翠平.机器学习中的隐私攻击与防御[J].软件学报,2020,31(3):866-892. 被引量：25
4成科扬,王宁,师文喜,詹永照.深度学习可解释性研究进展[J].计算机研究与发展,2020,57(6):1208-1217. 被引量：68
5谭作文,张连福.机器学习隐私保护研究综述[J].软件学报,2020,31(7):2127-2156. 被引量：63

共引文献23

1王艳,侯哲,黄滟鸿,史建琦,张格林.基于概率模型检查的树模型公平性验证方法[J].软件学报,2022,33(7):2482-2498. 被引量：1
2马舒岑,史建琦,黄滟鸿,秦胜潮,侯哲.基于最小不满足核的随机森林局部解释性分析[J].软件学报,2022,33(7):2447-2463. 被引量：2
3郁建兴,刘宇轩.社会治理中的深度学习算法公平性[J].信息技术与管理应用,2022(1):17-27. 被引量：1
4古天龙,李龙,常亮,罗义琴.公平机器学习:概念、分析与设计[J].计算机学报,2022,45(5):1018-1051. 被引量：18
5杨秀清,彭长根,刘海,丁红发,汤寒林.基于数据质量评估的公平联邦学习方案[J].计算机与数字工程,2022,50(6):1278-1285. 被引量：1
6李阳.机器学习课程教学的规划分析[J].集成电路应用,2022,39(6):90-91. 被引量：1
7刘璇,朝乐门.AI治理中的公平性及其评价方法研究[J].情报资料工作,2022,43(5):24-33. 被引量：5
8王文鑫,张健毅.联邦学习公平性研究综述[J].北京电子科技学院学报,2022,30(2):122-134. 被引量：1
9孔祥维,王子明,王明征,胡祥培.人工智能使能系统的可信决策:进展与挑战[J].管理工程学报,2022,36(6):1-14. 被引量：14
10梁天恺,曾碧,陈光.联邦学习综述:概念、技术、应用与挑战[J].计算机应用,2022,42(12):3651-3662. 被引量：24

同被引文献8

1纪守领,李进锋,杜天宇,李博.机器学习模型可解释性方法、应用与安全研究综述[J].计算机研究与发展,2019,56(10):2071-2096. 被引量：155
2成科扬,王宁,师文喜,詹永照.深度学习可解释性研究进展[J].计算机研究与发展,2020,57(6):1208-1217. 被引量：68
3陈珂锐,孟小峰.机器学习的可解释性[J].计算机研究与发展,2020,57(9):1971-1986. 被引量：47
4刘文炎,沈楚云,王祥丰,金博,卢兴见,王晓玲,查宏远,何积丰.可信机器学习的公平性综述[J].软件学报,2021,32(5):1404-1426. 被引量：24
5Yongxuan Liang,Yinghua Huang,Tingyu Fang.Bian Que,the founder of diagnostics of traditional Chinese medicine[J].Journal of Traditional Chinese Medical Sciences,2022,9(2):93-94. 被引量：2
6杨朋波,桑基韬,张彪,冯耀功,于剑.面向图像分类的深度模型可解释性研究综述[J].软件学报,2023,34(1):230-254. 被引量：18
7梁峥,王宏志,戴加佳,邵心玥,丁小欧,穆添愉.预训练语言模型实体匹配的可解释性[J].软件学报,2023,34(3):1087-1108. 被引量：3
8王冬丽,杨珊,欧阳万里,李抱朴,周彦.人工智能可解释性:发展与应用[J].计算机科学,2023,50(S01):9-15. 被引量：9

引证文献1

1许志伟,李海龙,李博,李涛,王嘉泰,谢学说,董泽辉.AIGC大模型测评综述:使能技术、安全隐患和应对[J].计算机科学与探索,2024,18(9):2293-2325. 被引量：5

二级引证文献5

1李亚玲,蔡京京,柏洁明.生成式大模型引发的隐私风险及治理路径[J].智能科学与技术学报,2024,6(3):394-401.
2宗峻麒,杨天宇.人工智能在企业财务预测与决策支持中的应用——理论与实践[J].国际商务财会,2024(22):16-20.
3李毅,李浩,许骁哲,杨一凡.CFB:金融领域大模型评估方法[J].计算机科学与探索,2024,18(12):3272-3287.
4何莲珍.大语言模型在语言测评中的应用[J].外语教学与研究,2024,56(6):903-912.
5陆盈嘉.基于AIGC的图像艺术创作采集系统设计[J].电视技术,2024,48(11):96-98.

1白海娟.假释犯回归社会的困境与帮扶探析[J].社区矫正理论与实践,2022(4):16-24. 被引量：1
2李尧.为子女教育而参保——随迁子女入学门槛对流动人口社保参保行为的影响[J].财经研究,2022,48(11):109-123. 被引量：7
3李嘉宜,刘鹏,李杰.数字流言与群体偏见的生成、特征与机制——对抖音“农村网红”话题视频评论文本的实证研究[J].海河传媒,2023(2):44-49.
4高玖灵,张维臣.民法典视角下体育运动风险的公平损失分担研究[J].湖北经济学院学报（人文社会科学版）,2023,20(1):74-78. 被引量：1
5袁满,王波.美国《公平住房法》治下的种种不公平现象[J].世界知识,2023(15):65-67.
6黎勇,罗丹,王松华.求解非线性方程组的修正Fletcher-Reeves共轭梯度法[J].应用数学,2023,36(3):703-710. 被引量：1
7刘旭.驻外记者做好突发事件报道的四字诀[J].中国记者,2023(7):117-119.
8吉尔·迪森德鲁克.修正幼儿对“他者”的概念化--根据吉尔·迪森德鲁克教授在婴幼儿发展与托育国际学术会议上的报告整理[J].健康研究,2023,43(4):371-375.
9蔡雨霖,肖佳仪,余超然,宋钊,李静,岳学军.基于UANP-MT的半监督菜心杂草分割方法[J].农业工程学报,2023,39(11):183-191. 被引量：1
10彭知辉.误导性舆情的社会危害及其应对[J].公共治理研究,2023,35(4):48-55. 被引量：3

软件学报

2023年第9期

浏览历史

内容加载中请稍等...

深度学习模型中的公平性研究被引量：1

参考文献1

二级参考文献5

共引文献23

同被引文献8

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

深度学习模型中的公平性研究 被引量：1

参考文献1

二级参考文献5

共引文献23

同被引文献8

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

深度学习模型中的公平性研究被引量：1