公平机器学习:概念、分析与设计被引量：15

Fair Machine Learning:Concepts,Analysis,and Design

下载PDF

导出

摘要随着人工智能的发展,机器学习技术越来越多地应用于社会各个领域,用以辅助或代替人们进行决策,特别是在一些具有重要影响的领域,例如,信用程度评级、学生质量评估、福利资源分配、疾病临床诊断、自然语言处理、个性信息推荐、刑事犯罪判决、无人驾驶等.如何在这些应用中确保决策公平或者无偏见?如何在这些应用中保护弱势群体的利益?这些问题直接影响到社会和公众对机器学习的信任,影响到人工智能技术的应用与系统的部署.通过系统梳理和全面剖析近年来的工作,对机器学习公平性或公平机器学习的定义及度量进行了解释及对比;从机器学习的全生命周期出发,对不同环节中出现的各类偏见及其发现技术进行了归类及阐释;从预处理、中间处理和后处理三个阶段,对公平机器学习的设计技术进行了介绍和分析;从可信赖人工智能全局出发,对公平性与隐私保护、可解释性之间的关系、影响及协同解决方案进行了阐述;最后对公平机器学习领域中亟待解决的主要问题、挑战及进一步研究热点进行了讨论. With the development of artificial intelligence,machine learning techniques is increasingly used in many social domains to assist or replace humankinds in decision-making,especially in some critical areas,such as,credit rating,students’qualification evaluation,welfare resource allocation,clinical diagnosis,natural language processing,personalized information recommendation,criminal judgment,autonomous vehicles and so on.Due to the intrinsic and technical characteristics of machine learning itself,its prediction and decision-making will inevitably produce a certain degree of bias or unfairness,which has gradually attracted the attention of scientific research,industry practitioners and the public.How to ensure fair or unbiased decisions in machine learning?How to protect the interests of disadvantaged groups in these applications?These issues have important impacts on the society and the public’s confidence in machine learning and affect the application of artificial intelligence technology and the deployment of artificial intelligence systems.Fairness has been one of the basic supporting capabilities of trustworthy artificial intelligence,and machine learning with fairness is referred to as fair machine learning.In this paper,the concepts of fairness,the methods of discovering unfair or biased discrimination and the design techniques of fair machine learning are reviewed and discussed.The detailed contents include the followings.Firstly,discrimination and bias are terminologies related to unfairness,and unfair behavior is known as biased behavior or discriminatory behavior.Since the taxonomy of discrimination and biases is helpful to understand and evaluate the fairness,direct discrimination,indirect discrimination,interpretable discrimination,uninterpretable discrimination,statistical discrimination and systematic discrimination are explained.In the framework of statistics,similarity and causal inference,the definitions and quantification of fairness in machine learning are categorized and explained.Secondly,the bias or prejudice is the main source of discrimination and unfairness.The training data and algorithms involved in machine learning can have biases that lead to unfair model predictions.From the perspectives of data,algorithm and human-computer interaction,the biases in the life cycle of machine learning are classified and discussed.The techniques to discover biases in machine learning,such as association rule mining,k-nearest neighbor classification,probabilistic causal network,and privacy attack and deep learning methods,are illustrated.Meanwhile,the design methodologies of fair machine learning have been undertaken roughly in three directions.On the view of specific applicable tasks,fair natural language processing,fair face recognition,fair recommendation system,fair classification,fair regression and fair clustering are elaborated.In light of particular machine learning algorithms,fair representation and fair adversarial learning are discoursed.From the life cycle of machine learning,preprocessing methods,intermediate processing methods and post-processing methods are expounded.Then,for the trustworthy artificial intelligence,the recent studies regarding anonymous protection,secure multi-party computing and security attack and defense for fair machine learning are promising works,which are briefly introduced.The explainability can help to discover algorithmic bias in machine learning models,on which some preliminary attempts are conducted,also being described.Finally,the main problems,challenges and hot topics in the research of fair machine learning,such as evaluation and testing of fair machine learning,novel modes of fair machine learning and ethically aligned machine learning,are presented.

作者古天龙李龙常亮罗义琴 GU Tian-Long;LI Long;CHANG Liang;LUO Yi-Qin(College of Information Science and Technology,Jinan University,Guangzhou 510632;Guangxi Key Laboratory of Trusted Software,Guilin University of Electronic Technology,Guilin,Guangxi 541004)

机构地区暨南大学信息科学技术学院桂林电子科技大学广西可信软件重点实验室

出处《计算机学报》 EI CAS CSCD 北大核心 2022年第5期1018-1051,共34页 Chinese Journal of Computers

基金国家自然科学基金(U1711263,U1811264,61966009)资助。

关键词机器学习公平性隐私保护可解释人工智能伦理 machine learning fairness privacy protection interpretability artificial intelligence ethics

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1陈珂锐,孟小峰.机器学习的可解释性[J].计算机研究与发展,2020,57(9):1971-1986. 被引量：38
2王赞,闫明,刘爽,陈俊洁,张栋迪,吴卓,陈翔.深度神经网络测试研究综述[J].软件学报,2020,31(5):1255-1275. 被引量：31
3刘文炎,沈楚云,王祥丰,金博,卢兴见,王晓玲,查宏远,何积丰.可信机器学习的公平性综述[J].软件学报,2021,32(5):1404-1426. 被引量：19
4陈晋音,陈奕芃,陈一鸣,郑海斌,纪守领,时杰,程瑶.面向深度学习的公平性研究综述[J].计算机研究与发展,2021,58(2):264-280. 被引量：7
5古天龙,李龙.伦理智能体及其设计:现状和展望[J].计算机学报,2021,44(3):632-651. 被引量：9

二级参考文献13

1孟小峰,王雷霞,刘俊旭.人工智能时代的数据隐私、垄断与公平[J].大数据,2020,6(1):35-46. 被引量：16
2董国伟,徐宝文,陈林,聂长海,王璐璐.蜕变测试技术综述[J].计算机科学与探索,2009,3(2):130-143. 被引量：22
3王东浩.人工智能体引发的道德冲突和困境初探[J].伦理学研究,2014(2):68-73. 被引量：38
4辛宇,杨静,汤楚蘅,葛斯乔.基于局部语义聚类的语义重叠社区发现算法[J].计算机研究与发展,2015,52(7):1510-1521. 被引量：35
5张莹,王超,郭文雅,袁晓洁.基于双向分层语义模型的多源新闻评论情绪预测[J].计算机研究与发展,2018,55(5):933-944. 被引量：5
6陈小平.人工智能伦理体系:基础架构与关键问题[J].智能系统学报,2019,14(4):605-610. 被引量：30
7闫宏秀.可信任:人工智能伦理未来图景的一种有效描绘[J].理论探索,2019,0(4):38-42. 被引量：12
8孟小峰,马超红,杨晨.机器学习化数据库系统研究综述[J].计算机研究与发展,2019,56(9):1803-1820. 被引量：31
9纪守领,李进锋,杜天宇,李博.机器学习模型可解释性方法、应用与安全研究综述[J].计算机研究与发展,2019,56(10):2071-2096. 被引量：132
10何积丰.安全可信人工智能[J].信息安全与通信保密,2019,0(10):4-8. 被引量：13

共引文献92

1龚善要.人工智能司法应用的实践审思与完善[J].国家检察官学院学报,2023,31(5):95-108. 被引量：1
2姜婷婷,傅诗婷.人本视角下的数字记忆:“人—记忆—技术”三位一体理论框架构建与启示[J].中国图书馆学报,2022,48(5):103-115. 被引量：7
3王艳,侯哲,黄滟鸿,史建琦,张格林.基于概率模型检查的树模型公平性验证方法[J].软件学报,2022,33(7):2482-2498. 被引量：1
4郑烨,施晓牧,刘嘉祥.基于多路径回溯的神经网络验证方法[J].软件学报,2022,33(7):2464-2481. 被引量：1
5马舒岑,史建琦,黄滟鸿,秦胜潮,侯哲.基于最小不满足核的随机森林局部解释性分析[J].软件学报,2022,33(7):2447-2463. 被引量：1
6郁建兴,刘宇轩.社会治理中的深度学习算法公平性[J].信息技术与管理应用,2022(1):17-27. 被引量：1
7钟文康,葛季栋,陈翔,李传艺,唐泽,骆斌.面向神经机器翻译系统的多粒度蜕变测试[J].软件学报,2021,32(4):1051-1066. 被引量：10
8白林亭,海钰琳.基于梯度分析的卷积神经网络可视化方法[J].信息技术与信息化,2021(4):61-63. 被引量：1
9王锦.基于弹性BP算法的手写数字识别[J].新乡学院学报,2021,38(6):24-27. 被引量：1
10徐良辰,郭崇慧.智慧医院建设背景下的电子病历分析利用框架[J].大数据,2021,7(4):141-156. 被引量：5

同被引文献167

1罗敏,赵天齐,郭王玥蕊.“见微知著”:现代管理中的小数据[J].现代管理科学,2021,9(4):37-44. 被引量：1
2李景,汪滨,于立梅,张明,张利真,李国鹏.国内外蓝莓标准比对研究及相关建议[J].标准科学,2021(1):17-21. 被引量：2
3凯塔琳娜·佛罗斯特尔 ,秘书处 .实质平等和非歧视法[J].环球法律评论,2005,27(1):18-22. 被引量：14
4谢礼珊,申文果,梁晓丹.顾客感知的服务公平性与顾客公民行为关系研究——基于网络服务环境的实证调研[J].管理评论,2008,20(6):17-24. 被引量：47
5李薇薇.平等原则在反歧视法中的适用和发展--兼谈我国的反歧视立法[J].政法论坛,2009,27(1):126-134. 被引量：31
6周伟.从身高到基因:中国反歧视的法律发展[J].清华法学,2012,6(2):15-30. 被引量：35
7贾宗维,崔军.一种发现社团结构的快速凝聚聚类算法[J].湘潭大学自然科学学报,2012,34(4):103-107. 被引量：2
8李成.平等权的司法保护——基于116件反歧视诉讼裁判文书的评析与总结[J].华东政法大学学报,2013,16(4):57-68. 被引量：22
9马茜,谷峪,张天成,于戈.一种基于数据质量的异构多源多模态感知数据获取方法[J].计算机学报,2013,36(10):2120-2131. 被引量：21
10刘小楠,龚新玲.“反歧视的理论与实践问题研讨会”综述[J].妇女研究论丛,2013(6):114-117. 被引量：4

引证文献15

1昌文峰,王霄,杨靖,覃涛.基于CatBoost算法的蓝莓生态适宜性评估模型[J].计算机与数字工程,2023,51(1):206-212.
2张欣,宋雨鑫.人工智能时代算法性别歧视的类型界分与公平治理[J].妇女研究论丛,2022(3):5-19. 被引量：21
3薛永安,邹友峰,张文志,张明媚,柳广春,宋明伟.基于SVM的地下采煤区沉陷灾害发育敏感性分区研究[J].煤田地质与勘探,2022,50(10):108-118.
4陈小平.人工智能伦理治理:一种新型问题的底层逻辑和创新探索[J].生命科学,2022,34(8):983-989. 被引量：5
5刘锦宏,宋明珍.人机协同审核 :概念与模式[J].中国出版,2022(22):11-14. 被引量：6
6侯海薇,丁世飞,徐晓.基于无监督表征学习的深度聚类研究进展[J].模式识别与人工智能,2022,35(11):999-1014.
7朱倩倩,唐志敏,王新哲.人工智能安全框架研究[J].工业信息安全,2022(10):39-46. 被引量：1
8汪浩.煤化工机器学习分类研究[J].当代化工研究,2023(4):28-31.
9张欣,宋雨鑫.人工智能时代算法性别歧视的类型界分与公平治理[J].复印报刊资料（妇女研究）,2022(5):12-25.
10贾诗威,闫慧.社交媒体用户算法偏见感知的批判性话语分析[J].现代情报,2023,43(6):14-23. 被引量：2

二级引证文献37

1仇筠茜,张鸿茹,韩萌.国际传播的零界面:智能音箱Alexa“聊新闻”评估研究[J].中国新闻传播研究,2023(3):115-134. 被引量：1
2侯东德.发展与安全并重:中国人工智能治理之道[J].数字法治,2023(5):15-19.
3刘艳红.理念、逻辑与路径:网络暴力法治化治理研究[J].江淮论坛,2022(6):21-30. 被引量：26
4邓松.算法性别歧视的认定与法律规制——以消费领域为例[J].反歧视评论,2023(1):271-289.
5戴艺晗.预测算法与社会公平——以“机会信息”访问为视角[J].图书情报知识,2022,39(3):116-124. 被引量：2
6兰国帅.指向教育数字化转型的人工智能教育风险审视--UNESCO《人工智能与教育:政策制定者指南》要点与思考[J].阅江学刊,2023,15(1):132-145. 被引量：3
7杜昕怡,肖泽晟.人工智能算法辅助行政决策的法治风险及其化解路径[J].学习论坛,2023(3):122-130. 被引量：8
8黄脂,谭金可.算法就业歧视的法律规制[J].山东工会论坛,2023,29(3):77-84. 被引量：1
9阎静,朱晓颖.数字时代算法性别歧视及其多元化治理[J].江汉大学学报（社会科学版）,2023,40(3):43-52. 被引量：1
10苏丽,张卓玉.人工智能参与行政决策的法治风险探究[J].石家庄学院学报,2023,25(4):155-160. 被引量：1

1马志强,丁思惠.我国养老服务体系建设中的政策风险及其规避对策[J].辽宁行政学院学报,2020(5):39-43. 被引量：1
2田思敏,邹利,钟辉云,邵思颖,赵保胜.“虚拟现实+思维导图”在实用中药学的实践[J].中国中医药现代远程教育,2021,19(19):3-6.
3无.和利时智能城轨云边协同解决方案,全方位赋能智慧城轨建设[J].城市轨道交通,2021(9):56-56. 被引量：1
4马文静,杨林,徐加利,杨志勇.面向露天场景的矿用工业互联网边云协同架构[J].曲阜师范大学学报（自然科学版）,2022,48(1):75-82. 被引量：1
5文晓.阿普奇:打造AI边缘计算一体化解决方案[J].自动化博览,2021,38(11):24-25.
6郭放.我国《民法典》中居住权制度完善研究[J].焦作大学学报,2022,36(1):25-27. 被引量：1
7李光林.公司注册资本认缴制与国有股权管理研究[J].国有资产管理,2022(4):4-9.
8王建华,陈明灿.探析执行中对涉居住利益的保护以周某执行复议案为例[J].中国审判,2022(3):88-91.
9路金望.完全EPC发包模式下公共工程建设项目农民工工资问题审计研究[J].经济研究导刊,2022(9):109-111.

计算机学报

2022年第5期

浏览历史

内容加载中请稍等...

公平机器学习:概念、分析与设计被引量：15

参考文献5

二级参考文献13

共引文献92

同被引文献167

引证文献15

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

公平机器学习:概念、分析与设计 被引量：15

参考文献5

二级参考文献13

共引文献92

同被引文献167

引证文献15

二级引证文献37

相关作者

相关机构

相关主题

浏览历史

公平机器学习:概念、分析与设计被引量：15