期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
中文句子级性别无偏数据集构建及预训练语言模型的性别偏度评估
1
作者 赵继舜 杜冰洁 +1 位作者 刘鹏远 朱述承 《中文信息学报》 CSCD 北大核心 2023年第9期15-22,共8页
在自然语言处理领域各项任务中,模型广泛存在性别偏见。然而,当前尚无中文性别偏见评估和消偏的相关数据集,因此无法对中文自然语言处理模型中的性别偏见进行评估。首先,该文根据16对性别称谓词,从一个平面媒体语料库中筛选出性别无偏... 在自然语言处理领域各项任务中,模型广泛存在性别偏见。然而,当前尚无中文性别偏见评估和消偏的相关数据集,因此无法对中文自然语言处理模型中的性别偏见进行评估。首先,该文根据16对性别称谓词,从一个平面媒体语料库中筛选出性别无偏的句子,构建了一个含有20000条语句的中文句子级性别无偏数据集SlguSet(Sentence-Level Gender Unbiased Dataset)。随后,该文提出了一个可衡量预训练语言模型性别偏见程度的指标,并对5种流行的预训练语言模型中的性别偏见进行评估。结果表明,中文预训练语言模型中存在不同程度的性别偏见,该文所构建数据集能够很好地对中文预训练语言模型中的性别偏见进行评估。 展开更多
关键词 性别偏见 数据集 预训练语言模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部