期刊文献+
共找到301篇文章
< 1 2 16 >
每页显示 20 50 100
基于知识图谱的垂直搜索引擎智能化研究 被引量:1
1
作者 伍星 《科技与创新》 2024年第14期69-72,共4页
知识图谱技术可以有效提升垂直搜索引擎的智能化程度。首先,概述了垂直搜索引擎和知识图谱的定义、特征及应用;其次,从整体上设计了一套利用知识图谱技术提升垂直搜索引擎智能化的方法流程;再次,详细解析了流程中的关键技术环节,包括用... 知识图谱技术可以有效提升垂直搜索引擎的智能化程度。首先,概述了垂直搜索引擎和知识图谱的定义、特征及应用;其次,从整体上设计了一套利用知识图谱技术提升垂直搜索引擎智能化的方法流程;再次,详细解析了流程中的关键技术环节,包括用户查询理解、图搜索算法、文本知识图谱化、结果排序融合等;最后,给出相关的图数据库和知识图谱构建的选型方案参考。研究结果可为如何应用知识图谱技术增强垂直搜索引擎的智能化提供详细的分析和设计方案。 展开更多
关键词 垂直搜索引擎 知识图谱 智能化 子图匹配
下载PDF
垂直搜索引擎赢利模式探讨 被引量:4
2
作者 毕建涛 霍云福 《大连大学学报》 2008年第3期71-75,共5页
利用自主研发的Soscan垂直搜索引擎系统,快速获取网上房屋交易供求信息,并构建房地产行业中介信息服务平台。提出一种全新电子商务赢利模式,即:不依赖网站访问量,利用所挖掘的行业信息的双向特性,通过信息撮合和定向信息发送等手段来实... 利用自主研发的Soscan垂直搜索引擎系统,快速获取网上房屋交易供求信息,并构建房地产行业中介信息服务平台。提出一种全新电子商务赢利模式,即:不依赖网站访问量,利用所挖掘的行业信息的双向特性,通过信息撮合和定向信息发送等手段来实现赢利。 展开更多
关键词 soscan垂直搜索引擎 房地产行业 信息定向发送 关键字竞价 赢利模式
下载PDF
生活服务领域垂直搜索引擎的设计与实现 被引量:8
3
作者 汲业 陈燕 +1 位作者 杨健 慕蓉 《计算机工程》 CAS CSCD 北大核心 2010年第24期24-26,共3页
根据生活服务领域网页信息的特点,提出一种面向生活服务领域的垂直搜索引擎模型,给出该模型在信息采集、信息抽取、索引建立和信息检索4个功能模块的具体算法及实现方式。实际应用表明,该模型搜索效果良好,提供HTML和WML 2种方式的用户... 根据生活服务领域网页信息的特点,提出一种面向生活服务领域的垂直搜索引擎模型,给出该模型在信息采集、信息抽取、索引建立和信息检索4个功能模块的具体算法及实现方式。实际应用表明,该模型搜索效果良好,提供HTML和WML 2种方式的用户界面,已经成功覆盖全国近40个城市的餐饮、娱乐和黄页信息。 展开更多
关键词 垂直搜索 网络蜘蛛 信息抽取 搜索引擎
下载PDF
面向垂直搜索引擎的主题提取算法 被引量:9
4
作者 吕林涛 陈丽萍 周红芳 《计算机工程》 CAS CSCD 北大核心 2009年第15期44-46,共3页
针对HITS算法对所有链接分配相等权重导致产生主题漂移的问题,提出基于计算链接价值度及Web页面语义主题相似度对链接分配合理权重的HITS改进算法,突出链接重要度的差异。实验表明,该算法的主题相关度提高了13%~42%,且较好地避免了主... 针对HITS算法对所有链接分配相等权重导致产生主题漂移的问题,提出基于计算链接价值度及Web页面语义主题相似度对链接分配合理权重的HITS改进算法,突出链接重要度的差异。实验表明,该算法的主题相关度提高了13%~42%,且较好地避免了主题漂移问题,增强了采集信息的准确性,对垂直搜索引擎的研究有重要的理论和实际应用价值。 展开更多
关键词 HITS算法 垂直搜索引擎 超链接 主题漂移
下载PDF
基于Nutch的农业垂直搜索引擎研究 被引量:10
5
作者 王晓琴 李书琴 +1 位作者 景旭 王蒙 《计算机工程与设计》 CSCD 北大核心 2014年第6期2239-2243,共5页
针对传统搜索引擎检索返回结果数量庞大、专业性差、查准率低等问题,在分析研究Nutch开源搜索引擎工作原理的基础上,采用基于词库的正向最大匹配分词算法实现中文分词、基于关键词的向量空间模型实现主题相关性判别、基于PageRank排序... 针对传统搜索引擎检索返回结果数量庞大、专业性差、查准率低等问题,在分析研究Nutch开源搜索引擎工作原理的基础上,采用基于词库的正向最大匹配分词算法实现中文分词、基于关键词的向量空间模型实现主题相关性判别、基于PageRank排序算法改进结果排序等对Nutch进行二次开发,并将农业领域本体应用于搜索引擎的信息采集及过滤、信息检索以及相关词推荐等各个阶段,设计并实现了基于Nutch的农业垂直搜索引擎。实验结果表明,基于Nutch的农业垂直搜索引擎可以提高用户检索的查准率,满足用户检索的专业性需求。 展开更多
关键词 垂直搜索引擎 主题相关性判别 PAGERANK算法 本体 相关词推荐
下载PDF
基于Internet的农业信息垂直搜索引擎的设计 被引量:6
6
作者 赵洋 滕桂法 +1 位作者 张玉新 何冬梅 《河北农业大学学报》 CAS CSCD 北大核心 2009年第6期125-128,共4页
农业信息化建设的飞速发展,使得互联网上农业信息迅速增长,但由于使用通用搜索引擎检索出的信息庞杂无序,农业主题信息的获取仍十分困难。因此,搜索引擎有向专业化、领域化方向发展的趋势。本文设立了一种基于特征词匹配算法的垂直搜索... 农业信息化建设的飞速发展,使得互联网上农业信息迅速增长,但由于使用通用搜索引擎检索出的信息庞杂无序,农业主题信息的获取仍十分困难。因此,搜索引擎有向专业化、领域化方向发展的趋势。本文设立了一种基于特征词匹配算法的垂直搜索引擎设计方案,该方案通过建立农业信息特征词词典,采用向量空间模型来对网页主题进行识别,从而提高信息检索的准确率。并采用基于超级链接分析的方法,使主题相关的URL优先得到访问,提高了搜索引擎的效率。 展开更多
关键词 垂直搜索引擎 主题识别 向量空间模型 特征词
下载PDF
基于Lucene/Heritrix的垂直搜索引擎的研究与应用 被引量:21
7
作者 白坤 耿国华 《计算机应用与软件》 CSCD 2009年第1期212-215,247,共5页
Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。Heritrix是一个由Java开发的、开源的Web网络爬虫,用户可以使用它从网络上抓取想要的资源。探讨了Lucene和Heritrix在构建垂直搜索引擎中的... Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。Heritrix是一个由Java开发的、开源的Web网络爬虫,用户可以使用它从网络上抓取想要的资源。探讨了Lucene和Heritrix在构建垂直搜索引擎中的应用。 展开更多
关键词 LUCENE HERITRIX 垂直搜索引擎
下载PDF
中文农业信息垂直搜索引擎的设计与实现 被引量:5
8
作者 夏斌 丁立 +1 位作者 乔红波 高瑞 《河南农业大学学报》 CAS CSCD 北大核心 2010年第6期715-717,共3页
本研究以用户对农业信息搜索需求为研究背景,设计实现了1个中文农业信息垂直搜索引擎,该系统采用向量空间模型对农业主题进行识别,并采用网页内容和链接分析相结合的方法,使排序结果更加合理,从而提高信息检索的效率和准确率.
关键词 垂直搜索引擎 农业信息 主题识别 页面排序
下载PDF
基于Web的DCI垂直搜索引擎的研究与设计 被引量:7
9
作者 吴洁明 冀单单 韩云辉 《计算机工程与设计》 CSCD 北大核心 2013年第4期1481-1487,共7页
为了解决用户能够快速、准确的搜索互联网上数字作品信息的问题,分析设计了一个对数字作品版权唯一标识符(Digital Copyright Identifier简称DCI)数字作品的垂直搜索引擎。首先基于Heritrix网络爬虫技术,对互联网上的数字作品进行数据... 为了解决用户能够快速、准确的搜索互联网上数字作品信息的问题,分析设计了一个对数字作品版权唯一标识符(Digital Copyright Identifier简称DCI)数字作品的垂直搜索引擎。首先基于Heritrix网络爬虫技术,对互联网上的数字作品进行数据采集和正文信息抽取,并将抽取的数据保存到本地;然后基于Lucene的全文检索工具包,对本地数据进行分词、倒排索引、索引检索和改进的相关度排序等处理,最终设计实现了一个通用可扩展的DCI垂直搜索引擎。实验结果表明,该搜索引擎在很大程度上提高了网页信息抽取的准确度和数据的检索效率。 展开更多
关键词 数据采集 倒排索引 垂直搜索引擎 信息抽取 相关度排序
下载PDF
农业垂直搜索引擎信息抽取的研究 被引量:4
10
作者 胡亮 袁芳 齐芸芸 《计算机工程与设计》 CSCD 北大核心 2009年第5期1115-1118,1134,共5页
自动文本信息抽取是垂直搜索引擎技术体系的一个研究方向,针对传统的农业垂直搜索引擎信息抽取精度不高的问题,在研究农业网页交易信息数据的特点的基础上,提出一种针对具有时空属性的行业领域信息的表示与抽取模型。该模型利用数据信... 自动文本信息抽取是垂直搜索引擎技术体系的一个研究方向,针对传统的农业垂直搜索引擎信息抽取精度不高的问题,在研究农业网页交易信息数据的特点的基础上,提出一种针对具有时空属性的行业领域信息的表示与抽取模型。该模型利用数据信息、数据时间、数据空间三元集描述定义此类数据,不仅可以表示数据对象的当前状态,而且可以准确地反映数据对象的历史与空间连续状态,据此设计了K-EA算法。实验结果表明,该模型对于具有时间与空间属性特点的数据有很好的召回率与精度。 展开更多
关键词 垂直搜索引擎 农业 信息抽取 时空属性信息 三元集
下载PDF
综合搜索引擎与垂直搜索引擎的比较研究 被引量:49
11
作者 刘畅 《情报科学》 CSSCI 北大核心 2007年第1期97-102,共6页
搜索引擎是目前互联网信息服务的主要工具,它的竞争也日趋激烈,搜索引擎的信息服务也逐渐引起重视。本文从信息服务的角度出发,通过对综合搜索引擎与垂直搜索引擎在信息服务各个要素方面的比较,找出它们之间的竞争与合作的关系,为当前... 搜索引擎是目前互联网信息服务的主要工具,它的竞争也日趋激烈,搜索引擎的信息服务也逐渐引起重视。本文从信息服务的角度出发,通过对综合搜索引擎与垂直搜索引擎在信息服务各个要素方面的比较,找出它们之间的竞争与合作的关系,为当前的搜索引擎发展做出初步的分析。 展开更多
关键词 搜索引擎 垂直搜索引擎 信息服务 比较研究
下载PDF
网络化制造资源垂直搜索引擎的研究与应用 被引量:6
12
作者 张建 程锦 《计算机应用》 CSCD 北大核心 2007年第5期1116-1118,共3页
着重研究了网络化制造资源垂直搜索系统的主题爬虫和中文分词技术。通过在主题爬虫中增加评价网页模块,优先爬行与主题相似度高的网页中的链接,提高了爬虫的工作效率。在对中文分词词典进行分层存储的基础上,通过一种改进的简洁的中文... 着重研究了网络化制造资源垂直搜索系统的主题爬虫和中文分词技术。通过在主题爬虫中增加评价网页模块,优先爬行与主题相似度高的网页中的链接,提高了爬虫的工作效率。在对中文分词词典进行分层存储的基础上,通过一种改进的简洁的中文分词词典匹配算法,有效地改善了分词的速度与精度,并缩减了索引库,增强了用户的响应。 展开更多
关键词 网络化制造 制造资源 垂直搜索引擎 页面解析
下载PDF
垂直搜索引擎应用中的若干策略探讨——以12580餐饮垂直搜索为例 被引量:7
13
作者 许鑫 黄仲清 《现代图书情报技术》 CSSCI 北大核心 2009年第2期62-70,共9页
首先概述垂直搜索引擎的有关研究,结合通用搜索引擎分析垂直搜索引擎的一些特点和应用,然后结合实际的开发应用从提高查准率、提高查询速度、提高信息采集效率、控制信息采集质量等角度进行分析和探讨,在实例探讨中结合12580网络信息采... 首先概述垂直搜索引擎的有关研究,结合通用搜索引擎分析垂直搜索引擎的一些特点和应用,然后结合实际的开发应用从提高查准率、提高查询速度、提高信息采集效率、控制信息采集质量等角度进行分析和探讨,在实例探讨中结合12580网络信息采集的餐饮垂直搜索原型系统提出信息采集、信息更新、信息抽取等实际应用领域中的若干策略。 展开更多
关键词 垂直搜索引擎 信息采集 信息抽取 网络信息
下载PDF
面向主题信息服务的垂直搜索引擎应用研究 被引量:2
14
作者 祁宁 吴齐 赵青 《图书馆学研究》 CSSCI 2008年第9期55-56,94,共3页
本文阐述了面向主题信息服务的发展方向,分析了垂直搜索引擎的特点,提出了面向主题信息服务的垂直搜索引擎的模块设计。
关键词 主题信息服务 垂直搜索引擎 搜索引擎
下载PDF
面向地学信息领域垂直搜索引擎设计与实现 被引量:4
15
作者 张思发 马永格 《计算机工程与应用》 CSCD 2012年第33期85-88,95,共5页
垂直搜索引擎是搜索引擎领域的行业化分工,根据地学信息领域的行业特征、整体需求及其工作流程,在Nutch开源搜索引擎平台上添加了"庖丁解牛"中文分词算法、主题相关度评分算法、"主题词管理"选项等技术,建立了基于... 垂直搜索引擎是搜索引擎领域的行业化分工,根据地学信息领域的行业特征、整体需求及其工作流程,在Nutch开源搜索引擎平台上添加了"庖丁解牛"中文分词算法、主题相关度评分算法、"主题词管理"选项等技术,建立了基于网络蜘蛛模型的面向地学信息领域的垂直搜索引擎。经过测试及结果比较,该系统相对于通用搜索引擎有明显的优势,使地学信息的定位和查找更加准确。该系统具有良好的扩展性和通用性,对垂直搜索引擎的研究和开发具有一定的借鉴作用。 展开更多
关键词 地学信息领域 垂直搜索引擎 NUTCH 中文分词 页面排序 主题词管理
下载PDF
垂直搜索引擎及其应用 被引量:14
16
作者 杨坚争 李朝平 《电子商务》 2006年第10期23-25,共3页
本文研究了垂直搜索引擎的基本概念,并探索了垂直搜索引擎在工作中的实际应用。
关键词 搜索引擎 垂直 应用
下载PDF
RL_Spider:一种自主垂直搜索引擎网络爬虫 被引量:2
17
作者 黄蔚 刘忠 刘全 《计算机应用与软件》 CSCD 2011年第12期183-187,共5页
在分析相关spider技术的基础上,提出了将强化学习技术应用到垂直搜索引擎的可控网络爬虫方法。该方法通过强化学习技术得到一些控制"经验信息",根据这些信息来预测较远的回报,按照某一主题进行搜索,以使累积返回的回报值最大... 在分析相关spider技术的基础上,提出了将强化学习技术应用到垂直搜索引擎的可控网络爬虫方法。该方法通过强化学习技术得到一些控制"经验信息",根据这些信息来预测较远的回报,按照某一主题进行搜索,以使累积返回的回报值最大。将得到的网页存储、索引,用户通过搜索引擎的搜索接口,就可以得到最佳的搜索结果。对多个网站进行主题爬虫搜索,实验结果表明,该方法对于网络的查全率和查准率都具有较大的提高。 展开更多
关键词 可控强化学习 垂直搜索引擎 网络爬虫
下载PDF
基于Nutch的节能减排垂直搜索引擎设计与实现 被引量:1
18
作者 袁志祥 张飞 +2 位作者 鲍威 孙国华 刘明 《计算机工程与设计》 北大核心 2016年第9期2565-2570,共6页
为提高搜索引擎检索节能减排领域信息的准确度,在研究垂直搜索引擎的设计思想和相关技术的基础上,利用Nutch开源框架设计实现节能减排垂直搜索引擎。采用网页模板技术对网页信息进行提取,利用改进的TF-IDF算法进行特征词表示,采用基于... 为提高搜索引擎检索节能减排领域信息的准确度,在研究垂直搜索引擎的设计思想和相关技术的基础上,利用Nutch开源框架设计实现节能减排垂直搜索引擎。采用网页模板技术对网页信息进行提取,利用改进的TF-IDF算法进行特征词表示,采用基于特征词的向量空间模型进行主题相关性判定,利用朴素贝叶斯分类算法对网页信息进行分类。实验结果表明,该搜索引擎可有效对节能减排的相关信息进行检索。 展开更多
关键词 节能减排 垂直搜索引擎 NUTCH 向量空间模型 朴素贝叶斯
下载PDF
垂直搜索引擎关键技术研究综述 被引量:8
19
作者 季春 姜琴 吴铮悦 《情报探索》 2012年第10期91-93,共3页
系统总结了垂直搜索引擎的关键技术及国内外应用现状,预测了未来的发展趋势。
关键词 搜索引擎 垂直搜索 网页信息抽取
下载PDF
面向计算机教育资源的垂直搜索引擎系统的设计 被引量:3
20
作者 李广丽 张红斌 《情报理论与实践》 CSSCI 北大核心 2010年第5期95-98,共4页
本文详细介绍了面向计算机教育资源的垂直搜索引擎的体系结构,重点叙述了构成垂直搜索引擎的主题爬虫的爬行策略、主题相关度算法和主题词库的设计策略。实验结果表明:软件系统中Heri-trix的最大响应时间是0.563秒,查询精度和主题相关... 本文详细介绍了面向计算机教育资源的垂直搜索引擎的体系结构,重点叙述了构成垂直搜索引擎的主题爬虫的爬行策略、主题相关度算法和主题词库的设计策略。实验结果表明:软件系统中Heri-trix的最大响应时间是0.563秒,查询精度和主题相关度判别算法的精度均达到了60%以上,可以面向Web加以应用。 展开更多
关键词 计算机 教育资源 垂直搜索引擎 向量空间 模型
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部