期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
面向主题的网络蜘蛛技术研究及系统实现 被引量:13
1
作者 张博 蔡皖东 《微电子学与计算机》 CSCD 北大核心 2009年第5期52-55,共4页
首先研究了面向主题的网络蜘蛛的关键技术:抓取目标描述、网页分析算法和网页搜索策略等,在此基础上,设计并实现了一个面向主题的网络蜘蛛系统(简称主题蜘蛛),采用向量空间模型来计算网页的主题相关度,使用改进的Shark-Search网页搜索... 首先研究了面向主题的网络蜘蛛的关键技术:抓取目标描述、网页分析算法和网页搜索策略等,在此基础上,设计并实现了一个面向主题的网络蜘蛛系统(简称主题蜘蛛),采用向量空间模型来计算网页的主题相关度,使用改进的Shark-Search网页搜索策略来决定待抓取链接的访问次序,从种子网页开始,只爬行具有较高预测相关度的链接,仅采集与主题相关的网页,多线程对网页进行下载和分析,提高了主题网页采集的精度. 展开更多
关键词 信息收集 主题蜘蛛 相关度计算 搜索策略
下载PDF
专业搜索引擎搜索策略综述 被引量:34
2
作者 欧阳柳波 李学勇 +1 位作者 李国徽 王鑫 《计算机工程》 CAS CSCD 北大核心 2004年第13期32-33,46,共3页
按照评价链接价值所采用方法的不同,对专业搜索引擎的搜索策略进行了分类,分析了各类搜索策略的特点,比较了它们的优缺点。对未来的研究方向进行了展望,给出了若干值得研究的问题。
关键词 专业搜索引擎 网络蜘蛛 搜索策略
下载PDF
一个基础教育网站搜索引擎的设计与实现 被引量:2
3
作者 陈权 曹卓文 杨晓江 《现代图书情报技术》 CSSCI 北大核心 2007年第6期70-73,共4页
在研究网站元数据的基础上,介绍一个以基础教育网站为检索对象的搜索引擎系统。结合基础教育网站的特点,分析该系统的关键技术,如主题蜘蛛搜索、网站分类、网站信息提取等,并对系统的整体架构、功能模块进行详细描述。
关键词 主题蜘蛛 网站分类 信息提取 搜索引擎
下载PDF
中文农业主题搜索引擎的设计与实现 被引量:10
4
作者 刘辉林 郭来德 +1 位作者 刘兰哲 王光兴 《郑州大学学报(理学版)》 CAS 2007年第2期74-77,共4页
用户对农业信息的需求越来越多,农业搜索引擎的开发变得十分必要.从农业搜索引擎发展状况出发,在分析研究通用搜索引擎工作原理、系统架构的基础上,设计并实现了中文农业主题搜索引擎,给出了开发过程中采用的关键技术.结果表明,能满足... 用户对农业信息的需求越来越多,农业搜索引擎的开发变得十分必要.从农业搜索引擎发展状况出发,在分析研究通用搜索引擎工作原理、系统架构的基础上,设计并实现了中文农业主题搜索引擎,给出了开发过程中采用的关键技术.结果表明,能满足用户实际需求. 展开更多
关键词 搜索引擎 网络蜘蛛 农业信息资源 主题相关性
下载PDF
主题搜索引擎中爬虫搜索策略的研究 被引量:15
5
作者 史宝明 贺元香 吴崇正 《计算机工程与应用》 CSCD 2014年第2期116-119,128,共5页
为了解决传统主题爬虫效率偏低的问题,传统主题爬虫会选择最有价值的链接进行访问,仅简单地计算链接的相关性,却忽视待分析URL之间的相关性关系,致使主题爬虫爬取效率较低。提出一种基于链接模型的相关性判别算法,综合利用有标种子URL... 为了解决传统主题爬虫效率偏低的问题,传统主题爬虫会选择最有价值的链接进行访问,仅简单地计算链接的相关性,却忽视待分析URL之间的相关性关系,致使主题爬虫爬取效率较低。提出一种基于链接模型的相关性判别算法,综合利用有标种子URL和无标的待判别URL实现对无标URL的相关性判别,并推导出迭代初值选取对结果的不敏感性。实验结果表明,与传统的网络爬虫算法相关性判别方法相比,提出的方法效率更高。 展开更多
关键词 网络爬虫 主题搜索引擎 搜索策略 向量空间模型
下载PDF
网络蜘蛛搜索策略进展研究 被引量:8
6
作者 欧阳柳波 李学勇 +1 位作者 李国徽 王鑫 《小型微型计算机系统》 CSCD 北大核心 2005年第4期703-706,共4页
网络蜘蛛搜索策略的研究是近年来专业搜索引擎研究的焦点之一.按照评价链接价值所采用方法的不同,对专业搜索引擎网络蜘蛛的搜索策略进行了分类,分析、比较了各类搜索策略的特点和优缺点.对未来的研究方向进行了展望,给出了若干值得研... 网络蜘蛛搜索策略的研究是近年来专业搜索引擎研究的焦点之一.按照评价链接价值所采用方法的不同,对专业搜索引擎网络蜘蛛的搜索策略进行了分类,分析、比较了各类搜索策略的特点和优缺点.对未来的研究方向进行了展望,给出了若干值得研究的问题. 展开更多
关键词 专业搜索引擎 网络蜘蛛 搜索策略
下载PDF
主题搜索引擎中网络爬虫的搜索策略研究 被引量:37
7
作者 李勇 韩亮 《计算机工程与科学》 CSCD 2008年第3期4-6,56,共4页
本文对主题搜索引擎中的网络蜘蛛搜索策略进行了详细的分析,在深入分析主题页面在Web上的分布特征与主题相关性判别算法的基础上提出了一个面向主题搜索的网络蜘蛛模型,对模型的组织结构进行了详细阐述。作为主题网络蜘蛛搜索策略的核... 本文对主题搜索引擎中的网络蜘蛛搜索策略进行了详细的分析,在深入分析主题页面在Web上的分布特征与主题相关性判别算法的基础上提出了一个面向主题搜索的网络蜘蛛模型,对模型的组织结构进行了详细阐述。作为主题网络蜘蛛搜索策略的核心部分,主题相关性判断算法是网络蜘蛛能够围绕设定主题进行聚焦检索的关键。在URL的主题相关性判别过程中引入了链接文本及相关链接属性分析,提出了一种新颖的URL主题相关性算法—EPR算法。 展开更多
关键词 搜索引擎 网络蜘蛛 搜索策略 主题提取
下载PDF
基于搜索引擎调用的主题搜索设计与实现 被引量:1
8
作者 陈财森 王韬 +1 位作者 郑伟 陈建泗 《计算机工程与设计》 CSCD 北大核心 2008年第21期5627-5629,共3页
网络搜索是目前从因特网上获取信息的主要手段,而网络蜘蛛又是大多数网络搜索工具获取网络信息的主要方法,主题搜索策略是专业搜索引擎的核心技术。通过研究网络蜘蛛的工作原理,分析了网络蜘蛛的搜索策略和搜索优化措施,设计出一种将限... 网络搜索是目前从因特网上获取信息的主要手段,而网络蜘蛛又是大多数网络搜索工具获取网络信息的主要方法,主题搜索策略是专业搜索引擎的核心技术。通过研究网络蜘蛛的工作原理,分析了网络蜘蛛的搜索策略和搜索优化措施,设计出一种将限制搜索深度、多线程技术和正则表达式匹配方法结合一起的网络蜘蛛,实验结果表明该方法能够快速而准确地搜索所需的相关主题信息。 展开更多
关键词 主题搜索 搜索引擎 网络蜘蛛 多线程 正则表达式
下载PDF
自适应最优搜索算法的网络蜘蛛的设计与实现 被引量:1
9
作者 魏文国 谢桂园 《计算机应用》 CSCD 北大核心 2007年第11期2857-2859,共3页
主题搜索引擎NonHogSearch改进了采用最优搜索算法的网络蜘蛛的搜索过程,控制了搜索的贪婪程度;并引入网页信噪比概念,从而判断网页是否属于所要搜索的主题页面;进一步,NonHogSearch在爬行过程中自动更新链接的权重,当得到主题相关页面... 主题搜索引擎NonHogSearch改进了采用最优搜索算法的网络蜘蛛的搜索过程,控制了搜索的贪婪程度;并引入网页信噪比概念,从而判断网页是否属于所要搜索的主题页面;进一步,NonHogSearch在爬行过程中自动更新链接的权重,当得到主题相关页面时产生回报,将回报沿链接链路逆向反馈,更新链路上所有链接的Q值,这样避免了网络蜘蛛过早陷入Web搜索空间中局部最优子空间的陷阱,并通过并行方式实现多条链路的同时搜索,改进了搜索引擎的性能。实验证实了该算法在查全率与查准率两方面都有一定的优越性。 展开更多
关键词 个性化网络蜘蛛 最优搜索算法 在线增量自学习 网页信噪比
下载PDF
基于情感分析的商品评价模型构建研究 被引量:3
10
作者 陈晓玲 褚汉 许钧儒 《铜陵学院学报》 2018年第6期10-12,25,共4页
如何从海量的网上评论数据中,分析得出指导消费者的有用信息,是商品评价研究领域的新课题。本文以电商网站的评论数据为基础,以文本分析技术为工具,建立一套较为完善的情感词库与主体抽取规则,将不规则的评论数据转变成结构化的评价数据... 如何从海量的网上评论数据中,分析得出指导消费者的有用信息,是商品评价研究领域的新课题。本文以电商网站的评论数据为基础,以文本分析技术为工具,建立一套较为完善的情感词库与主体抽取规则,将不规则的评论数据转变成结构化的评价数据,利用模糊数学方法,建立基于情感分析的商品评价模型。研究显示,该评价模型的评价结论,贴合消费者体验,评价效率也得到提高。 展开更多
关键词 情感分析 主题模型 评价研究
下载PDF
企业专用搜索引擎的搜索策略 被引量:4
11
作者 王秀平 马保权 李治柱 《计算机与现代化》 2006年第11期59-61,共3页
分析了现有的通用搜索引擎技术,并指出了其局限性。针对企业用户的需求,提出构建面向企业用户的专用搜索引擎的设计思想。该设计采用人工智能启发式搜索的思想,在企业用户设定的种子站点集和关键词集的基础上,根据网页和链接的评价值进... 分析了现有的通用搜索引擎技术,并指出了其局限性。针对企业用户的需求,提出构建面向企业用户的专用搜索引擎的设计思想。该设计采用人工智能启发式搜索的思想,在企业用户设定的种子站点集和关键词集的基础上,根据网页和链接的评价值进行有针对性的搜索,提高了专用搜索引擎的效率,并为个性化的服务提供了基础。 展开更多
关键词 企业专用搜索引擎 启发式搜索策略 网络蜘蛛 个性化搜索
下载PDF
Flash资源智能搜索系统架构与关键技术研究
12
作者 谭金波 《山东师范大学学报(自然科学版)》 CAS 2010年第1期79-81,共3页
通过对Flash资源网站页面特征的分析,本文提出Flash资源智能搜索系统的架构,定义了Flash资源的“元数据结构”,阐述了该系统的总体设计思想,着重分析了系统的一些关键技术及实现方法,如特征提取、主题式蜘蛛、Flash资源分类等,并... 通过对Flash资源网站页面特征的分析,本文提出Flash资源智能搜索系统的架构,定义了Flash资源的“元数据结构”,阐述了该系统的总体设计思想,着重分析了系统的一些关键技术及实现方法,如特征提取、主题式蜘蛛、Flash资源分类等,并对系统模块详细描述. 展开更多
关键词 Flash资源 智能搜索 主题式蜘蛛 自动分类
下载PDF
网络多媒体主题搜索策略研究
13
作者 杨仁广 孟祥增 《中国科技资源导刊》 2009年第2期37-41,共5页
针对多媒体链接在网页中分布的特点,对PageRank、Shark-Search两种典型的主题搜索策略进行相关参数的改进,并从网页内容和网页链接的角度计算了多媒体链接与主题的相似度。实验结果表明,改进的Shark-Search多媒体主题搜索策略比改进后的... 针对多媒体链接在网页中分布的特点,对PageRank、Shark-Search两种典型的主题搜索策略进行相关参数的改进,并从网页内容和网页链接的角度计算了多媒体链接与主题的相似度。实验结果表明,改进的Shark-Search多媒体主题搜索策略比改进后的PageRank搜索策略更能有效地提高多媒体主题搜索的效率,同时也更适合网络多媒体资源的主题搜索。 展开更多
关键词 多媒体 主题搜索 主题搜索策略 网络蜘蛛
下载PDF
网络蜘蛛搜索策略比较研究 被引量:17
14
作者 李学勇 欧阳柳波 +1 位作者 李国徽 钟敏娟 《计算机工程与应用》 CSCD 北大核心 2004年第4期128-131,共4页
以何种策略访问Web,以提高搜索效率,是近年来专业搜索引擎研究的主要问题之一。按照评价链接价值所采用方法的不同,对现有的网络蜘蛛搜索策略进行了分类,分析、比较了各类搜索策略的特点和优缺点,总结了提高网络蜘蛛搜索效率的几个关键... 以何种策略访问Web,以提高搜索效率,是近年来专业搜索引擎研究的主要问题之一。按照评价链接价值所采用方法的不同,对现有的网络蜘蛛搜索策略进行了分类,分析、比较了各类搜索策略的特点和优缺点,总结了提高网络蜘蛛搜索效率的几个关键因素。对未来的研究方向进行了展望。 展开更多
关键词 网络蜘蛛 专业搜索引擎 搜索策略
下载PDF
搜索引擎中网络蜘蛛搜索策略比较研究 被引量:12
15
作者 李学勇 欧阳柳波 +1 位作者 李国徽 钟敏娟 《计算技术与自动化》 2003年第4期63-67,共5页
何种策略访问Web,以提高搜索效率,是近年来专业搜索引擎研究的焦点之一。按照评价链接价值所采用方法的不同,对现有的网络蜘蛛搜索策略进行了分类,分析、比较了各类搜索策略的特点和优缺点,总结了提高网络蜘蛛搜索效率的几个关键因素。... 何种策略访问Web,以提高搜索效率,是近年来专业搜索引擎研究的焦点之一。按照评价链接价值所采用方法的不同,对现有的网络蜘蛛搜索策略进行了分类,分析、比较了各类搜索策略的特点和优缺点,总结了提高网络蜘蛛搜索效率的几个关键因素。对未来的研究方向进行了展望。 展开更多
关键词 搜索引擎 网络蜘蛛搜索策略 信息资源 信息检索 计算机网络 WEB
下载PDF
一种垂直搜索引擎主题相关性改进算法
16
作者 陈丽萍 《电脑知识与技术(过刊)》 2009年第10X期8116-8118,共3页
迅速发展的Web给传统的搜索引擎带来了前所未有的挑战,面向特定主题或特定领域采集相关信息的垂直搜索引擎应运而生。在垂直搜索引擎中,网络蜘蛛的爬行策略和主题相关性判定算法是其核心。该文详细介绍了一种主题相关性判定算法-Hits算... 迅速发展的Web给传统的搜索引擎带来了前所未有的挑战,面向特定主题或特定领域采集相关信息的垂直搜索引擎应运而生。在垂直搜索引擎中,网络蜘蛛的爬行策略和主题相关性判定算法是其核心。该文详细介绍了一种主题相关性判定算法-Hits算法,并在此基础上提出了一个改进的主题相关性判定算法,实验表明,改进的Hits算法提高了爬取网页的主题相关度,有助于网络蜘蛛爬取特定主题的信息。 展开更多
关键词 垂直搜索引擎 网络蜘蛛 主题相关性 HITS算法
下载PDF
基于Boltzmann行动选择策略的网络蜘蛛搜索算法 被引量:4
17
作者 李学勇 许向阳 +2 位作者 邱建雄 欧阳柳波 李国徽 《小型微型计算机系统》 CSCD 北大核心 2005年第6期932-935,共4页
在分析传统网络蜘蛛搜索机制特点的基础上,将Boltzmann行动选择策略引入网络蜘蛛的链接选择机制,提出了一种基于Boltzmann行动选择策略的启发式网络蜘蛛搜索算法.针对国外四所著名大学计算机系网站中计算机论文资源的搜索实验表明,新的... 在分析传统网络蜘蛛搜索机制特点的基础上,将Boltzmann行动选择策略引入网络蜘蛛的链接选择机制,提出了一种基于Boltzmann行动选择策略的启发式网络蜘蛛搜索算法.针对国外四所著名大学计算机系网站中计算机论文资源的搜索实验表明,新的算法可以有效提高搜索效率. 展开更多
关键词 专业搜索引擎 网络蜘蛛 搜索策略 Boltzmann行动选择策略
下载PDF
基于模拟退火的网络蜘蛛性能分析与系统实现 被引量:2
18
作者 李学勇 欧阳柳波 李国徽 《江西师范大学学报(自然科学版)》 CAS 2004年第2期167-172,共6页
在分析传统网络蜘蛛搜索机制特点的基础上,将模拟退火机制引入网络蜘蛛的链接选择策略,提出了一种基于模拟退火机制的启发式网络蜘蛛搜索算法.设计并实现了一个计算机相关论文搜索引擎网络蜘蛛系统.针对国外4所著名大学计算机系网站中... 在分析传统网络蜘蛛搜索机制特点的基础上,将模拟退火机制引入网络蜘蛛的链接选择策略,提出了一种基于模拟退火机制的启发式网络蜘蛛搜索算法.设计并实现了一个计算机相关论文搜索引擎网络蜘蛛系统.针对国外4所著名大学计算机系网站中计算机论文资源的搜索实验表明,新算法可以有效提高搜索效率. 展开更多
关键词 模拟退火 网络蜘蛛 性能分析 专业搜索引擎 搜索策略
下载PDF
一种基于非贪婪策略的网络蜘蛛搜索算法 被引量:6
19
作者 李学勇 田立军 +2 位作者 谭义红 欧阳柳波 李国徽 《计算技术与自动化》 2004年第2期35-39,共5页
在分析传统网络蜘蛛搜索策略缺点的基础上,提出了一种非贪婪的链接选择策略,进而提出了一种基于非贪婪策略的启发式搜索算法。针对国外四所著名大学计算机系网站中计算机论文资源的搜索实验表明,新算法可以有效提高搜索效率。
关键词 网络蜘蛛 搜索策略 链接选择 非贪婪策略 专业搜索引擎
下载PDF
基于模拟退火机制的网络蜘蛛搜索策略 被引量:4
20
作者 李学勇 欧阳柳波 李国徽 《湖南理工学院学报(自然科学版)》 CAS 2004年第2期60-63,共4页
在分析传统网络蜘蛛搜索机制特点的基础上 ,将模拟退火机制引入网络蜘蛛的链接选择策略 ,提出了一种基于模拟退火机制的启发式网络蜘蛛搜索算法。针对国外四所著名大学计算机系网站中计算机论文资源的搜索实验表明 ,新算法可以有效提高... 在分析传统网络蜘蛛搜索机制特点的基础上 ,将模拟退火机制引入网络蜘蛛的链接选择策略 ,提出了一种基于模拟退火机制的启发式网络蜘蛛搜索算法。针对国外四所著名大学计算机系网站中计算机论文资源的搜索实验表明 ,新算法可以有效提高搜索效率。 展开更多
关键词 专业搜索引擎 网络蜘蛛 搜索策略 模拟退火
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部