摘要
随着互联网的发展,FTP作为文件共享的主要方式得到了快速的发展.和HTTP相比,FTP具有一些不同的特点,例如区域化、封闭化,这些特点增加了FTP站点的索引与查询工作的难度.目前常见针对FTP文件索引的工作均是围绕文件名开展,用户难以获取到需要的内容信息.iSearch系统作为基于内容的分布式FTP搜索引擎,它能够基于文件内容进行检索,具有增量式索引、可插拔配置、负载均衡、查询分发等特点,同时它通过减少索引过程中的网络传输代价、索引尽可能多的文本信息和充分利用用户的反馈,提供更为准确与稳定的查询服务.
随着互联网的发展,FTP作为文件共享的主要方式得到了快速的发展.和HTTP相比,FTP具有一些不同的特点,例如区域化、封闭化,这些特点增加了FTP站点的索引与查询工作的难度.目前常见针对FTP文件索引的工作均是围绕文件名开展,用户难以获取到需要的内容信息.iSearch系统作为基于内容的分布式FTP搜索引擎,它能够基于文件内容进行检索,具有增量式索引、可插拔配置、负载均衡、查询分发等特点,同时它通过减少索引过程中的网络传输代价、索引尽可能多的文本信息和充分利用用户的反馈,提供更为准确与稳定的查询服务.
出处
《计算机研究与发展》
EI
CSCD
北大核心
2011年第S3期430-434,共5页
Journal of Computer Research and Development
基金
国家自然科学基金项目(60803016
61073005)
清华信息科学与技术国家实验室(筹)学科交叉基金项目
国家核高基科技重大专项基金项目(2010ZX01042-002-002-01)
关键词
分布式计算
FTP检索
基于内容
负载平衡
用户反馈
distribute computing
FTP search engine
content-based
balanced load
user feedback