期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
WWW上的信息发现与搜索引擎技术 被引量:39
1
作者 张晓辉 邵华 常桂然 《小型微型计算机系统》 EI CSCD 北大核心 1998年第6期66-71,共6页
随着Internet在我国逐步得到普遍应用以及WWW上中文信息量的不断增长,迫切需要研制适合我国国情的中英文Web索引和检索服务系统。WWW的信息发现和搜索引擎又称为robot,负责搜索和获取指定范围内的有关数据。本... 随着Internet在我国逐步得到普遍应用以及WWW上中文信息量的不断增长,迫切需要研制适合我国国情的中英文Web索引和检索服务系统。WWW的信息发现和搜索引擎又称为robot,负责搜索和获取指定范围内的有关数据。本文对Web搜索引擎的工作原理和关键技术进行了讨论和分析,并介绍了我们在研制中英文Web索引和检索服务器方面所做的工作,包括系统总体结构和汉语分词技术等。 展开更多
关键词 WWW 信息发现 搜索引擎 信息获取 INTERNET网
下载PDF
基于Web的DCI垂直搜索引擎的研究与设计 被引量:7
2
作者 吴洁明 冀单单 韩云辉 《计算机工程与设计》 CSCD 北大核心 2013年第4期1481-1487,共7页
为了解决用户能够快速、准确的搜索互联网上数字作品信息的问题,分析设计了一个对数字作品版权唯一标识符(Digital Copyright Identifier简称DCI)数字作品的垂直搜索引擎。首先基于Heritrix网络爬虫技术,对互联网上的数字作品进行数据... 为了解决用户能够快速、准确的搜索互联网上数字作品信息的问题,分析设计了一个对数字作品版权唯一标识符(Digital Copyright Identifier简称DCI)数字作品的垂直搜索引擎。首先基于Heritrix网络爬虫技术,对互联网上的数字作品进行数据采集和正文信息抽取,并将抽取的数据保存到本地;然后基于Lucene的全文检索工具包,对本地数据进行分词、倒排索引、索引检索和改进的相关度排序等处理,最终设计实现了一个通用可扩展的DCI垂直搜索引擎。实验结果表明,该搜索引擎在很大程度上提高了网页信息抽取的准确度和数据的检索效率。 展开更多
关键词 数据采集 倒排索引 垂直搜索引擎 信息抽取 相关度排序
下载PDF
垂直搜索引擎应用中的若干策略探讨——以12580餐饮垂直搜索为例 被引量:7
3
作者 许鑫 黄仲清 《现代图书情报技术》 CSSCI 北大核心 2009年第2期62-70,共9页
首先概述垂直搜索引擎的有关研究,结合通用搜索引擎分析垂直搜索引擎的一些特点和应用,然后结合实际的开发应用从提高查准率、提高查询速度、提高信息采集效率、控制信息采集质量等角度进行分析和探讨,在实例探讨中结合12580网络信息采... 首先概述垂直搜索引擎的有关研究,结合通用搜索引擎分析垂直搜索引擎的一些特点和应用,然后结合实际的开发应用从提高查准率、提高查询速度、提高信息采集效率、控制信息采集质量等角度进行分析和探讨,在实例探讨中结合12580网络信息采集的餐饮垂直搜索原型系统提出信息采集、信息更新、信息抽取等实际应用领域中的若干策略。 展开更多
关键词 垂直搜索引擎 信息采集 信息抽取 网络信息
下载PDF
基于日志分析的搜索引擎查询结果缓存研究 被引量:3
4
作者 马宏远 王斌 《计算机研究与发展》 EI CSCD 北大核心 2012年第S1期224-228,共5页
缓存是有效减少响应时间和系统负载的关键技术,是搜索引擎系统结构研究的重要领域之一.通过对搜狗搜索引擎在近1个月内约1500万条用户查询日志进行分析和研究,针对查询结果缓存,从查询局部性、缓存策略、缓存容量、工作负载周期性等方... 缓存是有效减少响应时间和系统负载的关键技术,是搜索引擎系统结构研究的重要领域之一.通过对搜狗搜索引擎在近1个月内约1500万条用户查询日志进行分析和研究,针对查询结果缓存,从查询局部性、缓存策略、缓存容量、工作负载周期性等方面进行分析.分析表明,混合缓存策略以及提高缓存容量相结合的技术能有效提高搜索引擎系统性能. 展开更多
关键词 信息检索 查询日志分析 性能优化 搜索引擎 缓存
下载PDF
基于因特网的自动化和智能化信息搜集技术 被引量:4
5
作者 刘素兰 《情报理论与实践》 CSSCI 北大核心 2001年第4期311-312,共2页
In order to make the information acquisition work of libraries more effectively,this paper proposes an automatic intelligent system based on Internet and explores the concepts and principles of meta search and documen... In order to make the information acquisition work of libraries more effectively,this paper proposes an automatic intelligent system based on Internet and explores the concepts and principles of meta search and document classification technologies. 展开更多
关键词 因特网 自动化 智能化 信息搜集技术 数字化图书馆 多元搜索技术 文档分类过滤技术
下载PDF
智慧校园背景下校内搜索引擎研究 被引量:1
6
作者 张文艳 宋子强 +1 位作者 孙荣 王正路 《现代电子技术》 2022年第20期75-80,共6页
为解决传统校内搜索的完整性和准确性不高、性能较差等问题,文中借助智慧校园基础平台建设优势,构建面向校内资源的垂直搜索引擎。首先,以通用的开发框架为基础,融合校内领域特征,优化搜索引擎技术中的信息采集、数据索引、信息检索模块... 为解决传统校内搜索的完整性和准确性不高、性能较差等问题,文中借助智慧校园基础平台建设优势,构建面向校内资源的垂直搜索引擎。首先,以通用的开发框架为基础,融合校内领域特征,优化搜索引擎技术中的信息采集、数据索引、信息检索模块;然后,结合资源整合和爬虫两种方式进行信息采集,并在数据索引中引入全量数据平台的语义知识库进行信息抽取、语义优化,增加扩展查询、统一身份认证等信息检索因素;最后,在超融合数据中心的硬件基础上,以跨平台门户为入口,提出覆盖率、准确率、检索速度更为优化的校内智能搜索方案。以江苏师范大学校内搜索平台为例验证该方案的可行性,得出建立个性化、精确化、智能化的校内垂直搜索服务,能够提升智慧校园进程中教学、科研和管理工作的效率。 展开更多
关键词 搜索引擎 智慧校园 信息采集 信息检索 垂直搜索 智能搜索
下载PDF
药学垂直搜索引擎平台的建立与技术研究 被引量:1
7
作者 焦强 束怡 戴昌林 《药学进展》 CAS 2010年第4期164-173,共10页
目的:针对国内医药企业和科研机构的工作特点,研究药学垂直搜索引擎平台的建立模式与技术实现。方法:应用Visual Studio 2008开发平台、SQL Server 2005商业智能平台以及垂直搜索引擎技术,开发具有市场应用价值的在线药学信息集成平台... 目的:针对国内医药企业和科研机构的工作特点,研究药学垂直搜索引擎平台的建立模式与技术实现。方法:应用Visual Studio 2008开发平台、SQL Server 2005商业智能平台以及垂直搜索引擎技术,开发具有市场应用价值的在线药学信息集成平台。结果:设计建立了包含新闻资讯、文献论文、专利情报、新药信息、药品信息、政策法规等在内的药学垂直搜索引擎平台。结论:该药学垂直搜索引擎平台可为医药企业和科研机构提供医药信息、文献和数据的检索、查询与分析等服务。 展开更多
关键词 药学信息 垂直搜索引擎 信息检索 数据采集 网络爬虫
下载PDF
一种基于预取感知接纳策略的查询结果缓存方法
8
作者 马宏远 王斌 《计算机研究与发展》 EI CSCD 北大核心 2012年第S1期148-152,共5页
针对搜索引擎查询结果缓存问题,提出了一种基于预取感知接纳策略的查询结果缓存方法,用于提高搜索引擎检索系统性能.查询结果预取导致查询结果页码的缓存缺失率具有显著差异性,结合该特性设计预取感知接纳策略,该策略包含查询评估模型... 针对搜索引擎查询结果缓存问题,提出了一种基于预取感知接纳策略的查询结果缓存方法,用于提高搜索引擎检索系统性能.查询结果预取导致查询结果页码的缓存缺失率具有显著差异性,结合该特性设计预取感知接纳策略,该策略包含查询评估模型以及模型特征选择方法.在该策略基础上,设计了一种查询结果缓存方法.在该搜索引擎两个月的大规模真实用户查询日志上的实验结果表明,与传统的典型方法相比,该方法可以获得6.38%~11.99%的缓存命中率提升. 展开更多
关键词 缓存 预取 查询结果 性能优化 接纳策略 搜索引擎 信息检索
下载PDF
分布式专业信息采集系统 被引量:2
9
作者 胡元军 彭四伟 许耀 《计算机工程与设计》 CSCD 北大核心 2007年第17期4243-4245,共3页
提出了一种基于Agent的分布式专业信息采集系统,详细介绍了系统的原理、框架、组成以及各部分的功能,并且介绍了系统的通讯安全性设计。普通的专业搜索引擎使用先采集然后过滤的方法得到专业数据,对资源造成了浪费,该系统有效地解决上... 提出了一种基于Agent的分布式专业信息采集系统,详细介绍了系统的原理、框架、组成以及各部分的功能,并且介绍了系统的通讯安全性设计。普通的专业搜索引擎使用先采集然后过滤的方法得到专业数据,对资源造成了浪费,该系统有效地解决上述问题。系统在运行中能够不断学习网络中专业知识的分布状况,从而提高专业信息采集工作效率。系统还具有对软硬件要求比较低,实现比较简单的优点,并且具有较高的性能。 展开更多
关键词 搜索引擎 分布式系统 信息采集 专业信息评价 安全
下载PDF
基于Web的高校FTP搜索引擎的技术研究 被引量:1
10
作者 赵旭 陈肖飞 《电脑知识与技术(过刊)》 2007年第22期966-967,970,共3页
在教育网内FTP站点资源不断丰富的情况下,具备快速文件检索能力的搜索引擎对高校师生来说尤为重要.本文从分析高校FTP搜索引擎系统的整体结构出发,主要研究其信息采集技术的三个组件.并对提高搜索引擎效率的其他技术进行了详尽阐述.
关键词 搜索引擎 信息采集 分页缓存
下载PDF
企业信息门户搜索引擎技术的研究 被引量:1
11
作者 冯妹雯 战莹 李一为 《电脑知识与技术》 2011年第11期7574-7575,共2页
企业信息门户(EIP)是企业信息系统的应用框架,它将各种应用系统、数据资源和互联网资源统一集成到一个信息管理平台之上提供给用户。面对门户建设中数据积累日渐增大,以及数据信息分散等问题,通过引进企业信息门户搜索引擎技术,... 企业信息门户(EIP)是企业信息系统的应用框架,它将各种应用系统、数据资源和互联网资源统一集成到一个信息管理平台之上提供给用户。面对门户建设中数据积累日渐增大,以及数据信息分散等问题,通过引进企业信息门户搜索引擎技术,提供快速、高效的检索功能,有效地整合了企业信息资源、提高了企业信息资源有效运用和访问。进一步加强了企业门户系统的建设和应用,使企业决策水平和信息公开效率得到提升。 展开更多
关键词 企业信息门户 搜索引擎 数据采集 信息搜索 分类 聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部