期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于Python技术的校园网搜索引擎设计 被引量:2
1
作者 闫丽丽 《信息与电脑》 2023年第17期183-185,共3页
传统搜索引擎模式存在新消息获取不及时、无法搜索通用引擎等问题,为此设计基于Python技术的校园网搜索引擎。首先分析搜索引擎的建立流程,其次分析Scrapy爬虫框架的工作原理,再次借助统一资源定位系统(Uniform Resource Locator,URL)... 传统搜索引擎模式存在新消息获取不及时、无法搜索通用引擎等问题,为此设计基于Python技术的校园网搜索引擎。首先分析搜索引擎的建立流程,其次分析Scrapy爬虫框架的工作原理,再次借助统一资源定位系统(Uniform Resource Locator,URL)去重策略优化校园信息查询流程,最后分析Scrapy爬虫框架爬虫防禁止策略。 展开更多
关键词 校园网搜索引擎 Python技术 Scrapy爬虫框架
下载PDF
基于Scrapy和Elasticsearch的校园网搜索引擎的研究与实现 被引量:3
2
作者 庄旭菲 田雪 《科技资讯》 2019年第29期12-15,共4页
针对通用搜索引擎无法及时收录校园网内信息和收录时间滞后的问题,基于Scrapy框架和Elasticsearch全文搜索引擎,提出了一个完善的校园网搜索引擎解决方案。该文主要分析了Scrapy的运行流程,对Elasticsearch的搜索机制进行了研究,在此基... 针对通用搜索引擎无法及时收录校园网内信息和收录时间滞后的问题,基于Scrapy框架和Elasticsearch全文搜索引擎,提出了一个完善的校园网搜索引擎解决方案。该文主要分析了Scrapy的运行流程,对Elasticsearch的搜索机制进行了研究,在此基础上设计了校园网搜索引擎的系统架构,给出了系统的网页抓取模块、索引检索模块、页面展示模块的关键实现技术。最后通过实验验证,相比于传统的通用搜索引擎,该文设计的校园网搜索引擎的搜索结果相关性更好,数量更多,对于校园网内新信息的收录情况更好。 展开更多
关键词 校园网搜索引擎 Scrapy Elasticsearch 中文分词
下载PDF
基于Python技术的校园网搜索引擎的设计与实现 被引量:4
3
作者 熊辉 《科技视界》 2019年第28期173-174,共2页
面对高速发展的经济以及科技新突破给我国带来的翻天覆地变化,互联网已经普及国内外,人们的生活也因科技的作用而便利了很多,但科技是一把“双刃剑”,互联网的高速发展与各种信息的传播也让给我们带来了“信息污染”,一时间很难辨别信... 面对高速发展的经济以及科技新突破给我国带来的翻天覆地变化,互联网已经普及国内外,人们的生活也因科技的作用而便利了很多,但科技是一把“双刃剑”,互联网的高速发展与各种信息的传播也让给我们带来了“信息污染”,一时间很难辨别信息的正确性。对于校园数字化建设来说,也同样不可避免的会受到“信息污染”的干扰,各种无效信息使我们对正确信息的查找与定位变得艰难,而调查发现对于很多学校来说,大多是运用很普通的搜索引擎检索信息,而普通的搜索引擎难以搜集到有效、正确的信息。针对上述问题,为了还学校一个高效、清净的信息环境,笔者将结合Python技术对校园网的搜索引擎进行相关介绍和设计,设计方案仅供参考。 展开更多
关键词 Python技术 校园网搜索引擎 设计 信息化 信息污染
下载PDF
校园网搜索引擎的研究与开发 被引量:1
4
作者 诸葛晴怡 佘静涛 《浙江高校图书情报工作》 2014年第2期9-16,21,共9页
随着高校校园网的建设日趋成熟,校园网内部的数据信息量大幅增长,为了提高信息检索的准确性和效率,本文在研究垂直搜索引擎的相关原理、技术和实现过程的基础上,探讨如何利用开源的Heritrix爬虫工具包、Lucene全文搜索工具包、JE-analy... 随着高校校园网的建设日趋成熟,校园网内部的数据信息量大幅增长,为了提高信息检索的准确性和效率,本文在研究垂直搜索引擎的相关原理、技术和实现过程的基础上,探讨如何利用开源的Heritrix爬虫工具包、Lucene全文搜索工具包、JE-analysis中文分词组件和Htmlparser解析工具包实现校园网搜索引擎系统。 展开更多
关键词 垂直搜索引擎 Heritrix爬虫 Lucene全文搜索工具包 校园网搜索引擎
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部