期刊文献+

互联网上FTP文件的分布特征及启示 被引量:11

FTP Files' Distribution Characteristics and Their Implications
下载PDF
导出
摘要 北京大学网络实验室的“天网”文件搜索引擎是国内自主开发的一个海量(FTP和HTTP)文件搜索引擎系统,它的数据库维护着1千多万的FTP文件与目录信息,索引了国内大部分匿名FTP站点。该文对“天网”的海量FTP文件目录信息的分布特征进行了研究,并分析了其对文件搜索引擎设计以及FTP服务器分类管理等方面的某些重要启示。该文的研究成果将增强人们对互联网上文件分布特征的了解,对于设计和优化一个大规模的文件搜索引擎系统具有积极的指导作用。 Tianwang File Search is a massive high-quality Chinese and English search engine which has crawled and i ndexed millions ftp files.In this paper,we study the distribution characteris tics of ftp files and analyze some important implications to file search engin es.The research results in this paper are very helpful to the design and evalu ation of a massive FTP search engine,and they are useful for manage or classif y ftp sites too.
出处 《计算机工程与应用》 CSCD 北大核心 2004年第1期129-133,178,共6页 Computer Engineering and Applications
基金 国家973重点基础研究发展规划:网络环境下海量信息的理论与方法研究(编号:G1999032706)
关键词 FTP文件与服务器 分布特征 搜索引擎 文件系统 数据挖掘 FTP Files&Servers,Search Engine,Distribution Char acteristic,file system,data mining
  • 相关文献

参考文献4

  • 1王建勇,单松巍,雷鸣,谢正茂,李晓明.海量Web搜索引擎系统中用户行为的分布特征及其启示[J].中国科学(E辑),2001,31(4):372-384. 被引量:45
  • 2陈华 李晓明.文件分类查找方法[P].专利申请号:02100839.6.2002-01.
  • 3Dhand H Mannila等著 张银奎 廖丽等译.数据挖掘原理[M].北京:机械工业出版社,2003..
  • 4陈华 李晓明.高级文件搜索引擎核心功能的实现技术:搜索引擎与Web挖掘进展[M].高等教育出版社,2003..

二级参考文献4

共引文献44

同被引文献47

引证文献11

二级引证文献16

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部