针对大语言模型的偏见性研究综述

Review of biased research on large language model

下载PDF

导出

摘要偏见现象普遍存在于人类社会,并通常以自然语言为载体呈现。传统的偏见研究主要针对静态词嵌入模型展开,但随着自然语言处理技术的不断演进,研究对象逐渐转向上下文处理能力更强的预训练模型。而作为预训练模型的进一步发展,尽管大型语言模型凭借惊人的性能和广阔的发展前景在多个应用场景中得到了广泛部署,但其仍可能会从未经处理的训练数据中捕捉到社会偏见,并将偏见传播到下游任务中。含有偏见的大型语言模型系统会产生不良的社会影响和潜在危害,因此针对大型语言模型的偏见研究亟待深入探讨。探讨了自然语言处理中偏见的由来,并对从词嵌入模型到现在大型语言模型的偏见评估和偏见缓解方法进行了分析与总结,旨在为未来相关研究提供有益参考。 The phenomenon of bias existed widely in human society,and typically manifested through natural language.Traditional bias studies have mainly focused on static word embedding models,but with the continuous evolution of natural language processing technology,research has gradually shifted towards pre-trained models with stronger contextual processing capabilities.As a further development of pre-trained models,although large language mo-dels have been widely deployed in multiple applications due to their remarkable performance and broad prospects,they may still capture social biases from unprocessed training data and propagate these biases to downstream tasks.Biased large language model systems can cause adverse social impacts and other potential harm.Therefore,there is an urgent need for further exploration of bias in large language mo-dels.This paper discussed the origins of bias in natural language processing and provided an analysis and summary of the deve-lopment of bias evaluation and mitigation methods from word embedding models to the current large language models,aiming to provide valuable references for future related research.

作者徐磊胡亚豪潘志松 Xu Lei;Hu Yahao;Pan Zhisong(College of Command&Control Engineering,Army Engineering University of PLA,Nanjing 210007,China)

机构地区陆军工程大学指挥与控制工程学院

出处《计算机应用研究》 CSCD 北大核心 2024年第10期2881-2892,共12页 Application Research of Computers

基金国家自然科学基金资助项目(62076251)。

关键词自然语言处理词嵌入预训练模型大型语言模型偏见 natural language processing word embedding pre-trained model large language model bias

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1王培冰,张宁,张春.基于Prompt的两阶段澄清问题生成方法[J].计算机应用研究,2024,41(2):421-425. 被引量：4
2朱述承,苏祺,刘鹏远.基于语料库的我国职业性别无意识偏见共时历时研究[J].中文信息学报,2021,35(5):130-140. 被引量：4
3李昂,韩萌,穆栋梁,高智慧,刘淑娟.多类不平衡数据分类方法综述[J].计算机应用研究,2022,39(12):3534-3545. 被引量：12
4赵继舜,杜冰洁,刘鹏远,朱述承.中文句子级性别无偏数据集构建及预训练语言模型的性别偏度评估[J].中文信息学报,2023,37(9):15-22. 被引量：1

二级参考文献19

1苗兴伟.从标记理论看英语中的性别歧视[J].外国语文,1995,20(3):51-55. 被引量：28
2陆震.妇女就业领域诸问题之我见[J].妇女研究论丛,1994(3):16-20. 被引量：3
3戴炜栋.言语性别差异分析综述[J].外国语,1983,6(6):3-7. 被引量：97
4苏晓玉.谈谈英语词汇中的女性后缀[J].解放军外国语学院学报,2000,23(3):24-25. 被引量：8
5李经伟.西方语言与性别研究述评[J].解放军外国语学院学报,2001,24(1):11-15. 被引量：77
6史耕山,张尚莲.国内语言性别差异研究概述[J].外语教学,2006,27(3):24-27. 被引量：41
7许家金,李潇辰.基于BNC语料库的男性女性家庭角色话语建构研究[J].解放军外国语学院学报,2014,37(1):10-17. 被引量：24
8韩明鸣,郭虎升,王文剑.面向非平衡多分类问题的二次合成QSMOTE方法[J].南京大学学报（自然科学版）,2019,55(1):1-13. 被引量：2
9吴园园,申立勇.基于类重叠度欠采样的不平衡模糊多类支持向量机[J].中国科学院大学学报（中英文）,2018,35(4):536-543. 被引量：27
10张成刚,杨伟国.中国劳动力市场转型阶段职业性别隔离的新测度——基于K-M分解方法[J].人口与经济,2018(6):53-63. 被引量：3

共引文献17

1李川,伍依凡,杨帅.不平衡分布的数据驱动故障诊断的研究进展[J].仪器仪表学报,2023,44(8):181-197. 被引量：2
2叶青,刘宗圣.人工智能场景下算法性别偏见的成因及治理对策[J].贵州师范大学学报（社会科学版）,2023(5):54-63. 被引量：8
3郑森,齐晓轩,柳亿霖.非平衡情感数据背景下基于边界度的过采样方法[J].价值工程,2023,42(31):129-131.
4郭旗.集成数据预处理技术及其在机器学习算法中的应用[J].科技与创新,2023(23):163-165. 被引量：2
5赵继舜,杜冰洁,刘鹏远,朱述承.中文句子级性别无偏数据集构建及预训练语言模型的性别偏度评估[J].中文信息学报,2023,37(9):15-22. 被引量：1
6张海翔,李培培,胡学钢.类不平衡的公共和标签特定特征多标签分类[J].计算机技术与发展,2024,34(2):46-52.
7丁浩晗,谢祯奇,田嘉伟,辛星,王震宇.基于图像分析技术的全脂奶粉品质软测量模型构建[J].食品与发酵工业,2024,50(10):273-281. 被引量：1
8王佳琦,袁野,朱永同,李清都,刘娜.基于自适应重加权和正则化的集成元学习算法[J].计算机应用研究,2024,41(6):1749-1755.
9杨汶静,汪明艳.基于混合模型的开放式创新社区用户生成内容质量预测[J].智能计算机与应用,2024,14(5):179-185.
10崔希亮.语言中的刻板印象及其认知基础[J].语言教学与研究,2024(4):57-67.

1王佑镁,王旦,王海洁,柳晨晨.算法公平:教育人工智能算法偏见的逻辑与治理[J].开放教育研究,2023,29(5):37-46. 被引量：8
2蒋烨,蓝杨.社会符号学视角下高职公共英语教材中文化偏见研究[J].海外英语,2023(19):221-224.
3陈薇.整合威胁研究:学术脉络、理论意涵及其在跨文化传播中的应用[J].国际新闻界,2024,46(2):120-139. 被引量：1
4兰昊.职业教育服务数字乡村建设的现实困境与优化路径[J].江苏商论,2024(10):32-35.
5段承阳.高职院校马克思主义理论教学中的问题与对策[J].中国军转民,2024(18):165-167.
6苗金虎,朱悦熙,杨诗瑶,陈洁,刘泮,许晶晶,靳菲菲,陶群芬.基于Citespace的国内外近10年男护士职业研究热点的可视化分析[J].现代临床护理,2024,23(8):62-70.
7张敏.边缘反抗与身体叙事:《生的代价》中的残护书写[J].外国文学动态研究,2024(5):86-94.

计算机应用研究

2024年第10期

浏览历史

内容加载中请稍等...

针对大语言模型的偏见性研究综述

参考文献4

二级参考文献19

共引文献17

相关作者

相关机构

相关主题

浏览历史