期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
Weighted PageRank Algorithm Search Engine Ranking Model for Web Pages 被引量:1
1
作者 S.Samsudeen Shaffi I.Muthulakshmi 《Intelligent Automation & Soft Computing》 SCIE 2023年第4期183-192,共10页
As data grows in size,search engines face new challenges in extracting more relevant content for users’searches.As a result,a number of retrieval and ranking algorithms have been employed to ensure that the results a... As data grows in size,search engines face new challenges in extracting more relevant content for users’searches.As a result,a number of retrieval and ranking algorithms have been employed to ensure that the results are relevant to the user’s requirements.Unfortunately,most existing indexes and ranking algo-rithms crawl documents and web pages based on a limited set of criteria designed to meet user expectations,making it impossible to deliver exceptionally accurate results.As a result,this study investigates and analyses how search engines work,as well as the elements that contribute to higher ranks.This paper addresses the issue of bias by proposing a new ranking algorithm based on the PageRank(PR)algorithm,which is one of the most widely used page ranking algorithms We pro-pose weighted PageRank(WPR)algorithms to test the relationship between these various measures.The Weighted Page Rank(WPR)model was used in three dis-tinct trials to compare the rankings of documents and pages based on one or more user preferences criteria.Thefindings of utilizing the Weighted Page Rank model showed that using multiple criteria to rankfinal pages is better than using only one,and that some criteria had a greater impact on ranking results than others. 展开更多
关键词 Weighted pagerank algorithms search engines web pages web crawlers World Wide web
下载PDF
Website Search Engine Optimization: Geographical and Cultural Point of View
2
作者 Osama Rababah Muhannad Al-Shboul +1 位作者 Fawaz Al-Zaghoul Rawan Ghnemat 《Journal of Software Engineering and Applications》 2014年第13期1087-1095,共9页
The concept of Webpage visibility is usually linked to search engine optimization (SEO), and it is based on global in-link metric [1]. SEO is the process of designing Webpages to optimize its potential to rank high on... The concept of Webpage visibility is usually linked to search engine optimization (SEO), and it is based on global in-link metric [1]. SEO is the process of designing Webpages to optimize its potential to rank high on search engines, preferably on the first page of the results page. The purpose of this research study is to analyze the influence of local geographical area, in terms of cultural values, and the effect of local society keywords in increasing Website visibility. Websites were analyzed by accessing the source code of their homepages through Google Chrome browser. Statistical analysis methods were selected to assess and analyze the results of the SEO and search engine visibility (SEV). The results obtained suggest that the development of Web indicators to be included should consider a local idea of visibility, and consider a certain geographical context. The geographical region that the researchers are considering in this research is the Hashemite kingdom of Jordan (HKJ). The results obtained also suggest that the use of social culture keywords leads to increase the Website visibility in search engines as well as localizes the search area such as google.jo, which localizes the search for HKJ. 展开更多
关键词 search engine OPTIMIZATION web crawlers search engine algorithms search engine VISIBILITY JORDAN
下载PDF
Web信息查询优化的遗传算法 被引量:2
3
作者 王自强 冯博琴 《控制与决策》 EI CSCD 北大核心 2005年第2期187-190,共4页
为帮助用户在丰富的网络资源中快速、准确地查询到所需要的信息,提出一种基于增强遗传算法的查询优化算法.其基本思想是:把查询种群组织成多个称为小生境的查询子种群,一个小生境用于查询文档空间的一个区域,规定了相应的基于项权重和... 为帮助用户在丰富的网络资源中快速、准确地查询到所需要的信息,提出一种基于增强遗传算法的查询优化算法.其基本思想是:把查询种群组织成多个称为小生境的查询子种群,一个小生境用于查询文档空间的一个区域,规定了相应的基于项权重和相似项的交叉算子、自适应变异算子,并通过引入局部搜索机制来增强算法的局部搜索能力,最后把查询结果依据相关性次序进行合并,并返回给查询用户.实验结果表明,该算法在查询精度和计算速度上均优于常用的查询优化技术. 展开更多
关键词 信息查询 遗传算法 局部搜索
下载PDF
基于Web页面平均质量的Web搜索模型和优化算法
4
作者 付国瑜 黄贤英 《计算机应用》 CSCD 北大核心 2009年第4期1114-1116,共3页
针对Web搜索引擎的特点,提出了一种基于量子遗传克隆挖掘(QGCMA)的搜索策略。该算法将用户的查询描述为Web页面的平均质量,并通过克隆,变异,交叉的操作获取具有高亲和度的抗体(Web页面)。通过实验结果分析得出,在Web搜索中该方法比标准... 针对Web搜索引擎的特点,提出了一种基于量子遗传克隆挖掘(QGCMA)的搜索策略。该算法将用户的查询描述为Web页面的平均质量,并通过克隆,变异,交叉的操作获取具有高亲和度的抗体(Web页面)。通过实验结果分析得出,在Web搜索中该方法比标准的遗传算法(GA)具有较明显的优势。 展开更多
关键词 搜索引擎 web搜索 遗传算法 克隆选择算法 量子计算
下载PDF
分布式Web信息采集系统的设计与实现 被引量:7
5
作者 金岳富 范剑英 冯扬 《哈尔滨理工大学学报》 CAS 北大核心 2010年第1期116-119,123,共5页
Web信息的急剧增长,给信息的有效使用带来了巨大挑战.作为搜索引擎的重要组成部分,Web信息采集扮演着越来越重要的角色.文中从并行性、负载均衡、体系结构以及可扩展性这4个方面详细讨论了分布式Web信息采集系统的设计与实现.经验证,该... Web信息的急剧增长,给信息的有效使用带来了巨大挑战.作为搜索引擎的重要组成部分,Web信息采集扮演着越来越重要的角色.文中从并行性、负载均衡、体系结构以及可扩展性这4个方面详细讨论了分布式Web信息采集系统的设计与实现.经验证,该分布式Web信息采集系统能够实现负载均衡,并具有良好的可扩展性. 展开更多
关键词 分布式系统 web信息采集 搜索引擎 信息处理
下载PDF
基于Elasticsearch的京津冀水环境搜索引擎的设计与实现 被引量:5
6
作者 张会清 张乐 《自动化技术与应用》 2020年第11期29-36,共8页
针对京津冀水环境信息资源出口不一、范围不同,且不能得到精确检索的问题,本文采用Elasticsearch分布式索引检索技术,将京津冀水环境数据资源进行融合共享,构建了京津冀水环境搜索引擎系统。该系统包括数据采集、数据索引、数据检索、... 针对京津冀水环境信息资源出口不一、范围不同,且不能得到精确检索的问题,本文采用Elasticsearch分布式索引检索技术,将京津冀水环境数据资源进行融合共享,构建了京津冀水环境搜索引擎系统。该系统包括数据采集、数据索引、数据检索、界面展示四个模块。重点对搜索的评分机制做了改进并对检索内容进行重排序。通过实验表明,与通用搜索引擎以及传统数据库相比,所实现的搜索引擎系统可以更加准确、快速地实现用户的检索需求。 展开更多
关键词 搜索引擎 Elasticsearch 排序算法 网络爬虫
下载PDF
基于量子遗传克隆挖掘的Web搜索策略
7
作者 曾长清 王玉皞 +1 位作者 陈绯 黎鹰 《广西师范大学学报(自然科学版)》 CAS 北大核心 2009年第1期197-200,共4页
随着互联网的迅速发展,网络规模不断扩大,信息储量急剧增长,Web搜索引擎技术越来越得到广泛地应用。针对用户越来越难以迅速精确地检索到所需信息的现状,提出一种应用于Web搜索的量子遗传克隆选择算法。该算法通过克隆、高斯变异以及量... 随着互联网的迅速发展,网络规模不断扩大,信息储量急剧增长,Web搜索引擎技术越来越得到广泛地应用。针对用户越来越难以迅速精确地检索到所需信息的现状,提出一种应用于Web搜索的量子遗传克隆选择算法。该算法通过克隆、高斯变异以及量子交叉等操作对可行解进行搜索,提高了算法的全局寻优能力。通过实验结果分析得出,在Web搜索中该算法比传统的搜索方法具有更明显的优势。 展开更多
关键词 搜索引擎 web搜索 遗传算法 量子遗传克隆选择算法
下载PDF
林业主题爬虫的算法研究与设计 被引量:7
8
作者 袁津生 郭艳芬 《计算机工程与设计》 CSCD 北大核心 2011年第6期2003-2006,共4页
针对目前通用搜索引擎对林业主题信息覆盖率和查准率较低的不足,提出了一种基于Shark-Search算法的林业主题爬虫设计方案。详细讨论了该主题爬虫的爬行策略、算法描述及实现,并通过实践构建了林业主题搜索引擎"搜林"。实验结... 针对目前通用搜索引擎对林业主题信息覆盖率和查准率较低的不足,提出了一种基于Shark-Search算法的林业主题爬虫设计方案。详细讨论了该主题爬虫的爬行策略、算法描述及实现,并通过实践构建了林业主题搜索引擎"搜林"。实验结果表明,相对于通用搜索引擎,"搜林"减少了搜索结果的信息量,提高了林业主题信息搜索的准确率。 展开更多
关键词 林业 主题爬虫 搜索引擎 鲨鱼算法 相关性
下载PDF
基于灰度分类的图像搜索引擎 被引量:3
9
作者 魏正曦 邱玲 赵攀 《四川理工学院学报(自然科学版)》 CAS 2014年第1期37-40,共4页
图像搜索是下一代搜索引擎迫切需要解决的课题,在对图像搜索引擎的主要功能和关键技术进行了分析和讨论的基础上,详细剖析了图像搜索引擎设计中任务分析、解决方案、感受哈希算法、实现等关键过程,并实现了一个基于灰度值分类的图像搜... 图像搜索是下一代搜索引擎迫切需要解决的课题,在对图像搜索引擎的主要功能和关键技术进行了分析和讨论的基础上,详细剖析了图像搜索引擎设计中任务分析、解决方案、感受哈希算法、实现等关键过程,并实现了一个基于灰度值分类的图像搜索引擎。实际试验表明,本图像搜索引擎的搜索速度较快、性能稳定,具有较好的搜索效果。 展开更多
关键词 图像搜索引擎 网络爬虫 图像识别 感知哈希算法
下载PDF
精益生产模式下的海洋工程项目托盘配送优化 被引量:2
10
作者 韩端锋 杨博歆 +1 位作者 李敬花 周青骅 《计算机集成制造系统》 EI CSCD 北大核心 2017年第1期44-51,共8页
为有效解决精益生产模式下海洋工程项目中的托盘配送问题,建立以增强配送准时性和降低综合成本为优化目标的配送问题模型。在多维约束条件有效处理的基础上,设计了求解托盘配送问题模型的混合改进的非支配排序遗传算法,融入基于非支配... 为有效解决精益生产模式下海洋工程项目中的托盘配送问题,建立以增强配送准时性和降低综合成本为优化目标的配送问题模型。在多维约束条件有效处理的基础上,设计了求解托盘配送问题模型的混合改进的非支配排序遗传算法,融入基于非支配接受规则的禁忌搜索算法,增强了局部搜索能力并维护了种群的稳定性。为了解决配送时的动态需求,采用了两阶段求解策略。通过算例的对比分析,证明了该混合算法解决托盘配送多目标问题是可行的,不仅收敛速度快而且避免了早熟收敛,搜索效率较高。 展开更多
关键词 海洋工程项目 托盘配送 非支配排序遗传算法 禁忌搜索 精益生产
下载PDF
面向海量植物图像的智能检索系统设计
11
作者 邱金水 庄会富 金涛 《计算机与现代化》 2022年第10期62-67,81,共7页
针对传统软件技术设计的植物图像检索系统中存在无法实现智能检索、植物图像数量增长慢、检索系统难以扩容,以及当植物图像数量达到百万级以上时检索效率低和检索请求高并发时植物图像加载慢等问题,提出利用百度AI技术、Image Sharp图... 针对传统软件技术设计的植物图像检索系统中存在无法实现智能检索、植物图像数量增长慢、检索系统难以扩容,以及当植物图像数量达到百万级以上时检索效率低和检索请求高并发时植物图像加载慢等问题,提出利用百度AI技术、Image Sharp图像分割技术和CV2颜色识别技术实现植物图像的智能检索。利用Fast DFS技术实现检索系统的动态扩容、负载均衡和植物图像的快速加载,利用Solr搜索引擎技术提高海量植物图像的检索效率,利用Python爬虫技术不断丰富检索系统的植物图像从而实现检索系统的可持续化发展。实验结果表明,通过上述技术能够构建一个面向海量植物图像的智能检索系统。 展开更多
关键词 植物图像 检索系统 大数据 人工智能 分布式存储 搜索引擎 网络爬虫
下载PDF
分布式主题爬虫的设计与实现 被引量:3
12
作者 池勇敏 郝泳涛 《计算机应用与软件》 CSCD 2010年第12期135-138,共4页
研究实现了一个分布式网络爬虫系统。系统架构主要分为控制节点和爬行节点两部分,并描述了分布式系统关键技术的解决方案。系统采用二级哈希映射算法进行任务分配以解决基于目标导向、负载均衡的URL分配问题,使用消息通信使节点相互协作... 研究实现了一个分布式网络爬虫系统。系统架构主要分为控制节点和爬行节点两部分,并描述了分布式系统关键技术的解决方案。系统采用二级哈希映射算法进行任务分配以解决基于目标导向、负载均衡的URL分配问题,使用消息通信使节点相互协作,提出利用遗传算法作为该主题爬虫系统的搜索策略,并给出了网页更新策略的改进方法。 展开更多
关键词 主题爬虫 分布式 遗传算法 搜索引擎
下载PDF
不确定环境下多品类共同配送路径优化 被引量:15
13
作者 葛显龙 薛桂琴 《计算机工程与应用》 CSCD 北大核心 2019年第9期264-270,共7页
针对动态事件对配送过程的干扰问题,提出多品类共同配送车辆路径优化问题。基于对不确定环境下动态客户时空特性的分析,提出利用时空泊松分布生成动态客户的方法;并从整体运营成本及车辆固定成本入手,建立不确定环境下多品类共同配送模... 针对动态事件对配送过程的干扰问题,提出多品类共同配送车辆路径优化问题。基于对不确定环境下动态客户时空特性的分析,提出利用时空泊松分布生成动态客户的方法;并从整体运营成本及车辆固定成本入手,建立不确定环境下多品类共同配送模型;鉴于考虑模型的特殊性,设计遗传-禁忌搜索组合优化算法,结合具体算例对模型和算法性能进行验证。结果表明,提出的多品类共同配送方法优于单品类配送方法,且改进后的遗传-禁忌搜索算法具有更强的寻优能力。 展开更多
关键词 物流工程 共同配送 遗传禁忌算法 多品类 车辆路径问题 不确定性
下载PDF
分布式全网职位搜索引擎的研究与实现 被引量:5
14
作者 付剑生 徐林龙 林文斌 《计算机技术与发展》 2015年第5期6-9,共4页
传统招聘网站所查寻的信息仅限于站内搜索,而且每个招聘网站往往都会有重复的招聘信息,导致重复投递,对求职者和招聘者都造成了资源浪费。文中研究和分析了基于Lucene的分布式全文搜索引擎Solrcloud,设计了全网职位搜索引擎系统。该系... 传统招聘网站所查寻的信息仅限于站内搜索,而且每个招聘网站往往都会有重复的招聘信息,导致重复投递,对求职者和招聘者都造成了资源浪费。文中研究和分析了基于Lucene的分布式全文搜索引擎Solrcloud,设计了全网职位搜索引擎系统。该系统采用Bloom Filter进行数据及URL的去重,通过使用Zookeeper提供分布式同步服务,并通过多线程来实现网页并发抓取。通过对系统的测试表明,该系统具有良好的可靠性和应用性,并在大数据量的情况下保证了搜索的效率及准确性。 展开更多
关键词 职位搜索 网络爬虫 分布式搜索引擎
下载PDF
基于遗传算法的聚焦爬虫搜索策略设计与研究 被引量:3
15
作者 陈悦 陈运 +1 位作者 杨义先 胡迪 《成都信息工程学院学报》 2011年第5期533-537,共5页
网络爬虫是搜索引擎的重要组成部分。针对目前聚焦爬虫搜索策略的不足,提出了一种新的搜索策略解决方案。在搜索过程中对适应度高于或低于种群平均适应度的个体采用不同的交叉概率和变异概率来扩大爬虫的爬取范围、增加新个体,并通过改... 网络爬虫是搜索引擎的重要组成部分。针对目前聚焦爬虫搜索策略的不足,提出了一种新的搜索策略解决方案。在搜索过程中对适应度高于或低于种群平均适应度的个体采用不同的交叉概率和变异概率来扩大爬虫的爬取范围、增加新个体,并通过改进遗传算子,提高聚焦爬虫的搜索效率。实验证明,基于自适应遗传算法的聚焦爬虫在一定程度上解决了传统遗传算法的"早熟"问题,而且能够爬取到更多主题相关的网页和相关度高的网页。 展开更多
关键词 搜索引擎 搜索策略 聚焦爬虫 遗传算法 自适应
下载PDF
基于TF-IDF算法的分层搜索引擎设计 被引量:5
16
作者 张贤亮 张尤赛 《计算机与数字工程》 2021年第3期456-461,共6页
随着网络信息的迅速增长以及深层网络结构的广泛应用,人们对于覆盖率广、检索效率高的搜索引擎提出了愈来愈高的要求。据此,论文提出了一种两阶段的搜索引擎设计方案。在第一阶段利用网络爬虫爬取相关的网络信息,并构成词条语料库,在第... 随着网络信息的迅速增长以及深层网络结构的广泛应用,人们对于覆盖率广、检索效率高的搜索引擎提出了愈来愈高的要求。据此,论文提出了一种两阶段的搜索引擎设计方案。在第一阶段利用网络爬虫爬取相关的网络信息,并构成词条语料库,在第二阶段基于TF-IDF算法搜索词条语料库,得到与待查询语句最相近的词条。该引擎利用Flask框架构建本地Web界面,实现简洁明了的界面显示与快速的数据传输,且该框架易于维护。实验结果表明,该搜索引擎采用的爬虫技术所形成的语料库覆盖率广,TF-IDF算法具有计算速度快、匹配精度高的特点。 展开更多
关键词 搜索引擎 网络爬虫 TF-IDF算法 Flask框架
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部