期刊文献+

基于大规模语料库的现代汉语动宾搭配知识库构建 被引量:4

Construction of Verb-object Knowledge Base from BCC Corpus
下载PDF
导出
摘要 汉语缺乏词形变化,语法信息需通过词语搭配关系获得,且在生活中词语通常在搭配中发挥交际作用。因此无论是在语言学本体,还是在自然语言处理的各项任务中,词语搭配知识都尤为重要。各种搭配中,动宾搭配能够反映句子轮廓,并在数量和多样性方面具有优势地位,故该文聚焦于构建现代汉语动宾搭配知识库,以期为自然语言处理提供基础知识,同时也为语言本体研究、语言教学等提供大量实例。该文首先从语言本体的角度出发,总结了动宾搭配的知识体系,并根据该体系制定相应形式化检索式140个,从BCC语料库中抽取动宾搭配知识,并对抽取结果进行了初步消歧,最终获得动宾搭配300万对,形成动宾搭配知识库。 The word collocation knowledge is essential to both linguistic ontology and natural language processing tasks, in which verb-object collocation is distinguished by its syntax role, its quantity and its diversity. This paper constructs a Chinese verb-object knowledge base to provide basic knowledge based on a large scale corpus. It first summarizes the knowledge system of verb-object collocation from the perspective of linguistic ontology, and formulates 140 queries to retrieve verb-object instances from the BCC corpus. Finally, three million pairs of verb-object collocation are obtained after disambiguation.
作者 王贵荣 饶高琦 荀恩东 WANG Guirong;RAO Gaoqi;XUN Endong(Institute of International Chinese Language Education,Beijing Language and Culture University,Beijing 100083,China;School of Information Science,Beijing Language and Culture University,Beijing 100083,China)
出处 《中文信息学报》 CSCD 北大核心 2021年第1期34-42,53,共10页 Journal of Chinese Information Processing
基金 国家语委信息化专项项目(ZDI135-114)。
关键词 动宾搭配 知识抽取 知识库 BCC语料库 verb-object collocation knowledge extraction knowledge base BCC corpus
  • 相关文献

参考文献16

二级参考文献50

共引文献806

同被引文献30

引证文献4

二级引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部