摘要
针对网络信息资源"迷向"与"过载"的现象,本文通过对遗传算法的分析应用,构建了由基于遗传算法的主题爬虫、信息处理和查询服务三部分组成的主题信息搜索系统。实验结果表明,应用该系统可以获取与主题相关度高的网页信息。
The subject information acquisition system is established by applying the genetic algorithm, according to web information overload and resource puzzle. The testing results showed that the web pages which are strong correlation in subject can be catched, and the accuracy of capturing the subject web pages was improved by using the system.
出处
《现代情报》
2009年第3期176-178,181,共4页
Journal of Modern Information
基金
北京市自然科学基金资助项目(4062013):遗传算法在网页信息搜索技术中的应用研究
关键词
主题
遗传算法
爬虫
搜索系统
subject
genetic algorithm
crawler
search system