-
题名基于Web弱指导的本体概念实例及属性的同步提取
被引量:4
- 1
-
-
作者
康为
穗志方
-
机构
北京大学计算语言学研究所
北京大学计算语言学教育部重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2010年第1期54-59,共6页
-
基金
国家自然科学基金资助项目(60873156)
国家社科基金资助项目(09BYY032)
-
文摘
该文提出了一种基于Web弱指导的本体概念实例和属性的同步提取方法,利用小规模的种子实例和属性集,该文从Web上自动获取实例和属性共现的上下文模式,并利用种子实例和属性的关联性来评价这些模式。进一步,根据上下文模式提取候选概念实例和属性后,该文提出两种方法来评价提取的候选实例和属性。第一,利用概念实例和属性的关联性来互相评价对方的准确度;第二,利用候选实例或候选属性与种子实例或属性在上下文模式分布上的相似度来评价准确度。在疾病类实验结果表明,人工确认候选实例的准确率在前500个结果达到94%,前1 000个结果的准确率也高达93%。
-
关键词
计算机应用
中文信息处理
WEB
概念实例提取
属性提取
弱指导
上下文模式
-
Keywords
computer application
Chinese information processing
web
domain concept instance extraction
attributes extraction
weakly-supervised
contextual pattern
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-