摘要
识别句子中实体关系是信息抽取的重要技术。研究了汉语实体关系模式的自动获取技术。在基于种子方法的思想上,结合汉语在语义表达上的多样性特征,使用机器学习方法来自动发现新模式。实验表明,该方法在人工干预很少的情况下,能较为准确的发现新模式,且可以在不同抽取领域内快速移植。因此该方法对于汉语实体关系识别具有一定价值。
Identifying entity relation of sentence is important technology of information extraction. Study the technology of obtaining Chinese entity relation pattern automatically. Based on the idea of seed method, and combining feature of Chinese expressing, using machine learning to find new patterns. Experiment show the method can find new pattern effectively under very small manual work, and it can be transplanted quickly in different extract region. So it has some value to identifying Chinese entity relation.
出处
《计算机与数字工程》
2009年第9期110-112,132,共4页
Computer & Digital Engineering
基金
国家自然科学基金青年项目"基于句子匹配分析的知识抽取研究与实现"(编号:70803048)资助
关键词
信息抽取
实体关系
模式匹配
相似度
information extraction, entity relation, pattern match, similarity