期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于URL定位信息的BBS数据挖掘方法研究 被引量:2
1
作者 赵哲 马晓珺 《科技通报》 北大核心 2014年第4期206-208,共3页
利用Web页面的采集序位和被检索页面的相关信息和主题,使得以主题为分块的网络爬虫算法,能够尽可能多地把整个Web按照主题为依据进行分块整合,可以采用对URL定位信息,提高了页面的高效检索能力。仿真实验中表明,提出的主题相关爬虫算法... 利用Web页面的采集序位和被检索页面的相关信息和主题,使得以主题为分块的网络爬虫算法,能够尽可能多地把整个Web按照主题为依据进行分块整合,可以采用对URL定位信息,提高了页面的高效检索能力。仿真实验中表明,提出的主题相关爬虫算法能够跨越BBS中URL网页中的断裂带,提高了URL网页的召回率,也不至于因为网页的断裂而中止检索。算法精度分析表明,误判点都在等分线附近徘徊,偏差不大,表明算法精度较高。 展开更多
关键词 网络爬虫算法 URL定位信息 bbs信息检索 数据挖掘
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部