摘要
搜索引擎的本质在于信息聚合,把处于各地的信息通过有限个关键词聚合到一个展示窗口中,而这种信息聚合受到开放式搜索引擎内在制约,难于进行细致的信息处理和深度聚合。在信息发达的当今社会,越来越多的行业、企业需要更加特定的信息聚合方式,了解媒体口碑和普通网民口碑。因此迫切需要一种廉价的领域可移植的信息聚合方法适应这样的要求,然而,核心的难点在于自动获得领域词汇,这成为解决领域可移植的首要难点,也就是说系统能沟通过尽可能少的词汇,获得属于该领域的全部词汇,而且这种领域词汇具有时新性,保持和领域的同步更新。通过对搜狗和百度两家企业的信息聚合实现了低成本,可大规模移植的要求。
The essence of search engine is to integrate information by limited keywords ,while such a kind of infor- mation integration is hard to put together more detailed and special information of an enterprise or a industry circle for there is limited show-window for ordinary search engine.One the same time,more and more enterprise are in great need of a deeply and detailed information of there own,by this way,it is better to know what media focus on and what people like much.The most difficult thing is to get do...
出处
《四川大学学报(工程科学版)》
EI
CAS
CSCD
北大核心
2007年第S1期119-123,共5页
Journal of Sichuan University (Engineering Science Edition)
关键词
信息聚合
信息检索
领域可移植
information integration
information retrieve
domain-transferable