-
题名相关实体发现中基于Wikipedia的实体排序
被引量:1
- 1
-
-
作者
张俊三
瞿有利
税仪冬
田盛丰
-
机构
北京交通大学计算机与信息技术学院
中国石油大学计算机与通信工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第6期1359-1372,共14页
-
基金
中央高校基本科研业务费专项科研基金项目(2011JBM231)
-
文摘
针对相关实体发现中基于Wikipedia的实体排序存在的问题:半自动的目标类型获取、粗粒度的目标类型、实体类型相关度二值判断、实体关系相关度计算未考虑停止词作用.设计了一个实体排序框架,从实体相关度、实体类型相关度和实体关系相关度3方面的组合计算来对实体进行排序,通过对比多种组合方法获取了最优的方法.提出了一种新的实体类型相关度计算方法,该方法可以自动获取细粒度的目标实体类型,并通过归纳学习获取其下义Wikipedia类别判别规则集合,通过统计候选实体类别信息中符合目标类型下义类别判别规则的类别数来计算实体类型相关度.提出了一种"去停止词重构关系"方法计算候选实体和源实体的关系相关度.实验表明提出的方法可以有效地提高实体排序效果并且降低计算时间耗费.
-
关键词
相关实体发现
实体排序
实体类型相关度
实体关系相关度
WIKIPEDIA
-
Keywords
related entity finding
entity ranking
entity-type relevancy
entity-relation relevancy
Wikipedia
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名信息检索中相关实体发现综述
被引量:2
- 2
-
-
作者
张俊三
瞿有利
-
机构
北京交通大学计算机与信息技术学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2011年第12期4035-4038,共4页
-
文摘
实体是Web页面中的重要信息载体,用户通过搜索引擎进行信息检索中时一般想得到某个具体的实体,而不是某些文档的列表,因而信息检索中的相关实体发现研究就具有非常重要的意义。对信息检索中的相关实体发现的基本过程进行了综述,重点描述了相关实体发现的重要组成部分:全文检索、实体识别、实体分级,主页查找及其各部分所涉及到的关键问题。
-
关键词
实体
相关实体发现
全文检索
实体识别
实体分级
主页查找
-
Keywords
entity
related entity finding
full text retrieval
entity recognition
entity ranking
homepage finding
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-