期刊文献+

义类标注:必要性和可行性

Lexical Class Annotation:Necessity and Feasibility
原文传递
导出
摘要 本文从语料库词义标注的角度,结合词义自动消歧实验,说明词义义类标注的必要性和可行性.与词语义项相比,义类不仅仅是义项的抽象表示,它是具体词不相关的全局性词义信息,在语料库中保持意义不变,标注了义类的语料库为基于词义信息的统计提供了物质基础.我们使用基于词汇组合特征的词义分类方法,建立了"现代汉语词义分类体系",并对一个百万词规模的语料库进行了义类标注.我们使用有监督的自动分类方法,在这个义类语料库上进行了词义消歧实验并取得很好的结果.说明了我们使用的词义分类体系是一个适用于语料库标注的义类标记集. In this article,we discussed the issue of necessity and feasibility of adding lexical class tag to words in corpus,in terms of corpus annotation and word sense disambiguation(WSD).Compared to word sense annotation using dictionary definition,lexical class is not just a"coarse"version of word sense.It is global lexical information independent from specific word,and the meaning maintains constant across corpus.To justify these notions,we created a set of lexical class tags,called"Mandarin Lexical Taxonomy",and annotated a millionword size corpus with these tags.Then we did WSD experiments using supervised machine learning methods.The results served the purpose of our work properly:with its semantic consistency,lexical class alleviated the"over-fine"problem of corpus annotation with word sense and achieved a desirable WSD outcome.
作者 柏晓鹏 BAI Xiaopeng
出处 《语言学论丛》 2020年第1期116-134,共19页 Essays on Linguistics
基金 “中央高校基本科研业务费项目华东师范大学跨学科工作坊项目(项目号:2017ECNU-KXK010)” “华东师范大学教育学高峰学科建设项目”资助。
关键词 词义义类 语料库标注 词义消歧 自动分类 lexical class corpus annotation word sense disambiguation automatic classification
  • 相关文献

参考文献8

二级参考文献54

共引文献73

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部