期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
企业内网文件爬取与检索系统的设计与实现
1
作者 周杨 熊浩 +2 位作者 岳帅 赵杰 朱文韬 《信息与电脑》 2021年第18期149-153,共5页
为了有效满足企业内分布式文件存储的检索需求,本文系统通过FTP、SMB和SSH协议建立到FTP服务器、Windows共享文件夹的连接,利用分布式任务调度中心定期或手动执行文件爬取任务,同时对文件的标题、内容等进行分析,建立整合的文件索引库... 为了有效满足企业内分布式文件存储的检索需求,本文系统通过FTP、SMB和SSH协议建立到FTP服务器、Windows共享文件夹的连接,利用分布式任务调度中心定期或手动执行文件爬取任务,同时对文件的标题、内容等进行分析,建立整合的文件索引库。其中,存储文件的MD5摘要作为文件版本变动的判别依据。在系统前端为用户提供了简洁强大的文件检索入口,用户输入关键字即可获得分布在各处的文件并可以在线浏览或下载。该系统能够显著提高企业用户检索文档的效率和获得信息的能力。 展开更多
关键词 企业内网 文件爬取 文件检索 分布式任务调度 MD5摘要
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部