摘要
在构建助词知识库、标注大规模语料过程中使用了基于规则的助词用法自动标注的方法;对标注后的语料,发现基于规则的助词用法自动标注方法能够自动发现语料的部分词性、分词错误。这些错误的发现对研制高质量的语料库起到了积极的促进作用,并将语料加工深度向前推进。
During the construction of auxiliary words knowledge base,used rule-based automatic annotation on auxiliary word's usage.After automatic annotation,found words part-of-speech and segmentation errors in annotated corpus.The discovery is benefit for the high quality chinese corpus and the development of the processing depth.
出处
《计算机应用研究》
CSCD
北大核心
2011年第4期1318-1321,共4页
Application Research of Computers
基金
国家自然科学基金资助项目(60970083)
北京大学计算语言学教育部重点实验室开放课题基金资助项目(KLCL-1004)
河南省科技创新人才杰出青年基金资助项目(104100510026)
关键词
助词知识库
用法
规则
自动标注
auxiliary words knowledge base
usage
rules
automatic annotation