摘要
实体是Web页面中的重要信息载体,用户通过搜索引擎进行信息检索中时一般想得到某个具体的实体,而不是某些文档的列表,因而信息检索中的相关实体发现研究就具有非常重要的意义。对信息检索中的相关实体发现的基本过程进行了综述,重点描述了相关实体发现的重要组成部分:全文检索、实体识别、实体分级,主页查找及其各部分所涉及到的关键问题。
Entities are important information carrier in web pages.Users when they use a search engine for information retrieval want a specific entity rather than a list of some documents.So the research of related entity finding in information retrieval is very meaningful.The basic process of related entity finding is surveyed and its most important components including full-text retrieval,entity extractin,entity ranking,homepage finding and the other key isues are decribed in detail.
出处
《计算机工程与设计》
CSCD
北大核心
2011年第12期4035-4038,共4页
Computer Engineering and Design
关键词
实体
相关实体发现
全文检索
实体识别
实体分级
主页查找
entity
related entity finding
full text retrieval
entity recognition
entity ranking
homepage finding