摘要
介绍一个基于Web的信息资源获取系统的设计与实现原理 .该系统改进了信息搜索引擎 ,实现了多线程分布启发式搜索策略 ,并提出了目标文本模糊搜索空间模型 .在源文本与目标样本的匹配采用了带启发式、模糊匹配策略 ,使系统能较好地解决Web上信息自动获取问题 .
A design and implementation of the prototype of Web information resources acquisition system is introduced. A search engine of document information is improved and a heuristic search strategy with multithreading and distributing is implemented. It introduces fuzzy retrieval model on the object documents. A heuristic and fuzzy strategy of the matching between resource and object documents is adopted and issues of the information auto-acquisition on the WWW is solved as well.
出处
《暨南大学学报(自然科学与医学版)》
CAS
CSCD
2002年第1期34-40,共7页
Journal of Jinan University(Natural Science & Medicine Edition)
基金
国务院侨办重点科研项目基金
北京大学视听觉信息处理国家重点实验室以及暨南大学 2 11工程项目基金资助