-
题名自适应最优搜索算法的网络蜘蛛的设计与实现
被引量:1
- 1
-
-
作者
魏文国
谢桂园
-
机构
广东技术师范学院电子与信息学院
广东技术师范学院培训中心
-
出处
《计算机应用》
CSCD
北大核心
2007年第11期2857-2859,共3页
-
基金
广东省自然科学基金资助项目(06025383)
-
文摘
主题搜索引擎NonHogSearch改进了采用最优搜索算法的网络蜘蛛的搜索过程,控制了搜索的贪婪程度;并引入网页信噪比概念,从而判断网页是否属于所要搜索的主题页面;进一步,NonHogSearch在爬行过程中自动更新链接的权重,当得到主题相关页面时产生回报,将回报沿链接链路逆向反馈,更新链路上所有链接的Q值,这样避免了网络蜘蛛过早陷入Web搜索空间中局部最优子空间的陷阱,并通过并行方式实现多条链路的同时搜索,改进了搜索引擎的性能。实验证实了该算法在查全率与查准率两方面都有一定的优越性。
-
关键词
个性化网络蜘蛛
最优搜索算法
在线增量自学习
网页信噪比
-
Keywords
topic-specific Web spider
best-first search algorithm
online-incremental adaptive learning
signal-to-noise ratio of Web page
-
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
TP181
[自动化与计算机技术—控制理论与控制工程]
-