摘要
如何高效地自动理解网络上出现的海量文本信息,日益成为了个严峻的考验。美国华盛顿大学图灵中心提出的开放信息抽取,是一个有效的解决方法。它具有领域的独立性,无监督抽取,对大量文本的可伸缩性等特点。该论文首先介绍了开放信息抽取系统的主要功能,然后详细论述了三个主要的开放信息抽取系统的特点、组成部分以及优缺点,接着分析了开放信息抽取系统的改进方法和发展趋势。最后对未来进行展望。
How to efficiently and automatically understand the mass text information appearing on the Web is increasingly becoming a se- vere issue. Introduced by Turing Center of University Washington, Open Information Extraction (OIE} is an effective method with char- acteristics of domain-independent, unsupervised extraction, scalability to large amounts of text. This paper firstly introduces the main functions of OIE system, and then discusses in detail three major open information extraction systems about their features, components, and advantages and disadvantages, and then analyzes the improvement methods and trends of OIE. Finally, the future development of the OIE technologies is explored.
出处
《情报杂志》
CSSCI
北大核心
2013年第11期145-148,186,共5页
Journal of Intelligence
基金
国家自然科学基金"基于语言网络的文本主题中心度计算方法研究"(编号:61075047)
国家"十二五"科技支撑计划项目"面向外文科技文献信息的知识组织体系建设与应用示范"(编号:2011BAH10B00)课题五"信息资源自动处理
智能检索与STKOS应用服务集成"的研究成果之一
关键词
开放信息抽取
无监督抽取
关系短语
论元抽取
语义角色标注
开放语言学习
Open Information Extraction(OIE) unsupervised extraction relation phrase argument extraction semantic role labeling open language learning