摘要
中文信息抽取系统中实体关系模式的自动获取对于整个系统具有重要意义。在bootstrap方法的基础上,根据汉语在形式表达上的多样性特点,使用统计学习技术来自动获取新模式。实验表明,该方法在人工干预很少的情况下,能够快速查找新模式,且新模式的获取不受应用领域限制。因此该方法对于提高信息抽取系统的性能是有效的。
Obtaining Chinese entity relation pattern automatically is very important for entire information extraction system. Based on method of bootstrap and features that Chinese can express same meaning by many forms,using tech- nology of statistical learning to obtain new pattern automatically. Experiment shows the method can find new pattern rapidly and need very small manual work, the process can't be limited by extract region. So the method is effective for promoting the function of information extraction system.
出处
《计算机科学》
CSCD
北大核心
2010年第2期183-185,共3页
Computer Science
基金
国家自然科学基金项目(项目编号70803048)资助
关键词
信息抽取
实体关系
模式匹配
相似度
Information extraction,Entity relation,Pattern match,Similarity