-
题名基于语料库的我国职业性别无意识偏见共时历时研究
被引量:2
- 1
-
-
作者
朱述承
苏祺
刘鹏远
-
机构
北京语言大学信息科学学院
北京大学外国语学院
北京大学教育部计算语言学重点实验室
北京语言大学国家语言资源监测与研究平面媒体中心
-
出处
《中文信息学报》
CSCD
北大核心
2021年第5期130-140,共11页
-
基金
教育部人文社会科学研究规划基金(18YJA740030)
北京语言大学院级项目(中央高校基本科研业务费专项资金)(19YJ040003)。
-
文摘
性别偏见是社会学研究的热点。近年来,机器学习算法从数据中学到偏见,使之得到更广泛的关注,但目前尚无基于语料库的方法对文本数据中职业性别偏见的研究。该文基于标记理论,利用BCC和DCC语料库,从共时和历时两个层面考察了63个职业的性别无意识偏见现象。首先,以调查问卷的形式调研了不同性别和不同年龄段的人群对63个职业的性别倾向,发现和BCC语料库中多领域的职业性别偏见度呈显著的正相关关系。然后从共时的角度,利用BCC语料库中不同领域的语料,以及DCC语料库中2018年全国31个省级行政单位(不含港澳台地区)的报纸语料,发现从口语至书面语语体,大部分职业表现出对女性的性别偏见逐渐升高,且不同地区对职业的性别偏见存在差异。最后,从历时的角度,利用DCC语料库2005至2018年的报纸语料进行统计分析,发现职业性别无意识偏见现象随着时间的推移,呈现总体弱化趋势。
-
关键词
语料库
职业
性别
无意识偏见
标记理论
-
Keywords
corpus
occupation
gender
unconscious bias
markedness theory
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于规则的双重否定识别——以“不V1不V2”为例
- 2
-
-
作者
王昱
袁毓林
-
机构
北京大学中文系
澳门大学人文学院中国语言文学系
北京大学中国语言学研究中心
北京大学教育部计算语言学重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2022年第4期12-19,共8页
-
基金
国家科技创新重大项目(2020AAA0106701)
国家社会科学基金(18ZDA295)。
-
文摘
“不V1不V2”是汉语中典型的双重否定结构形式之一,其包括“不+助动词+不+V2”(不得不去)、“不+是+不+V2”(不是不好)、述宾结构“不+V1+……+不+V2”(不认为他不去)等多种双重否定结构,情况复杂。该文以“不V1不V2”为例,结合“元语否定”“动词叙实性”“否定焦点”等概念,对“不V1不V2”进行了考察,制定了“不V1不V2”双重否定结构的识别策略。根据识别策略,该文设计了双重否定自动识别程序,并在此过程中补充了助动词表、非叙实动词表等词库。最终,对28033句语料进行了识别,识别正确率为98.21%,召回率约为93.10%。
-
关键词
双重否定
非叙实动词
语义识别
否定焦点
-
Keywords
double negation
non-factual verb
semantic recognition
negative focus
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-