期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于特征串的网页去重算法 被引量:3
1
作者 姚新波 马治坤 《科技信息》 2008年第28期411-,430,共2页
用户在互联网中网页检索时,经常会得到大量内容相同的冗余页面,不仅浪费了存储资源,而且给用户带来许多不便。本文对现有的几种重复网页识别技术的优缺点进行了比较,并且重点讨论了基于特征串的网页快速去重算法。
关键词 重复网页识别 特征串 召回率
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部