-
题名一种改进的主题网络蜘蛛搜索算法
被引量:18
- 1
-
-
作者
林海霞
原福永
陈金森
刘俊峰
-
机构
燕山大学信息科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2007年第10期174-176,共3页
-
文摘
主题网络蜘蛛搜索策略是专业搜索引擎的核心技术。但是目前的主题搜索算法往往存在很大贪婪性,难以在全局范围内找到最优解。通过比较分析发现Best-First算法虽然有它的不足,但是它在几种算法中表现的性能最优。故以Best-First算法为基础,提出了BS-BS算法。对BS-BS算法进行性能评价,发现应用此算法搜索不但“召回率”有所提高,还能在一定程度上找到全局范围内的最优解。
-
关键词
主题网络蜘蛛
Best—First算法
召回率
-
Keywords
topic web crawler
Best-First algorithm
recall ratio
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名主题网络蜘蛛搜索策略贪婪性解决方法
被引量:4
- 2
-
-
作者
林海霞
原福永
陈金森
-
机构
燕山大学信息科学与工程学院
-
出处
《微电子学与计算机》
CSCD
北大核心
2006年第z1期278-280,共3页
-
文摘
主题网络蜘蛛搜索策略是专业搜索引擎的核心技术。但是目前的主题搜索算法往往存在很大贪婪性,难以在全局范围内找到最优解。通过比较分析发现Best-First算法虽然有它的不足,但是它在几种算法中表现的性能最优。故以Best-First算法为基础,提出了BS-BS算法。对BS-BS算法进行性能评价,发现应用此算法搜索不但“召回率”有所提高,还能在一定程度上找到全局范围内的最优解。
-
关键词
主题网络蜘蛛
Best-First算法
召回率
-
Keywords
Topic web crawler, Best-first algorithm, Recall ratio
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于主题相似度指导网络蜘蛛穿越隧道的爬行算法
被引量:5
- 3
-
-
作者
陈小海
周娅
-
机构
桂林电子科技大学计算机与控制学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2009年第10期126-128,共3页
-
基金
广西自然科学基金资助项目(桂科青0832101)
-
文摘
隧道穿越一直是主题网络蜘蛛爬行研究的难点,本文在分析了网页主题特征和普通隧道技术爬行算法缺点的基础上,提出了使用主题相似度指导网络蜘蛛穿越隧道的爬行算法,并用朴素贝叶斯分类器方法提高主题相似度计算精度。实验表明,本文提出的隧道穿越技术在查准率和查全率方面都比普通隧道技术有很大提高。
-
关键词
主题网络蜘蛛
隧道穿越
主题相似度
-
Keywords
topical web crawler
tunneling
topical similarity
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名面向教育主题的垂直搜索引擎的设计与实现
被引量:1
- 4
-
-
作者
王树文
郑阔实
陈竟博
-
机构
吉林省计算中心
中共吉林省委党校(吉林省行政学院)
吉林大学计算机科学与技术学院
-
出处
《长春师范学院学报(自然科学版)》
2013年第2期40-44,共5页
-
基金
吉林省科技发展计划项目(20100709)
-
文摘
由于通用搜索引擎具有搜索信息量大、查询不准确、深度不够等缺点,本文在通用搜索引擎技术的基础上,依据专业领域搜索策略,设计并实现了一个面向教育主题的垂直搜索引擎系统,着重研究了专业网络蜘蛛定制、基于VSM的主题相关度算法和倒排索引建立等关键技术及其实现细节。实验结果表明,该系统能够快速地响应用户的查询请求,并且返回结果具有较高的准确性。实现了教育资源的共享,具有较高的应用价值。
-
关键词
垂直搜索引擎
主题网络蜘蛛
主题相关度
-
Keywords
vertical search engine
topic web spider
subject relativity
-
分类号
TG156
[金属学及工艺—热处理]
-