-
题名多义词词典义项可区分度的度量
- 1
-
-
作者
柏晓鹏
-
机构
华东师范大学中文系
华东师范大学语文教育研究中心
-
出处
《辞书研究》
2020年第4期9-15,47,I0001,共9页
-
基金
华东师范大学语文教育研究基地2020年度研究项目“部编本小学教材韵律词的切分及其分布研究”(项目编号12901-412224-19095/006)资助。
-
文摘
多义词词典义项的可区分度是指,人们根据词典提供的信息在语料中对多义词义项进行辨析的难度。文章探讨如何度量多义词可区分度。以往对这个问题的研究主要使用两种方法:基于义类体系的方法和基于机器学习的词义消歧方法。文章提出利用人工标注词典义项,然后对标注结果计算标注者一致性(inter-annotators agreement)的方法,从而计算多义词义项可区分度。基于对几种方法的讨论和对比,文章发现,通过计算人工标注结果一致性的方法较为有效、直观和省力。文章认为,“多义词词典义项可分区度”是利用人对多义词辨析的结果,对词典义项的评价,并不必然反映词典释义的好坏,它应该被视为一类参考数据,为词典编纂提供指示。
-
关键词
多义词
义项可区分度
标注一致性
词义消歧
-
Keywords
polysemy
sense distinguishability
inter-annotator agreement
word sense disambiguation
-
分类号
H31
[语言文字—英语]
-