期刊文献+
共找到236篇文章
< 1 2 12 >
每页显示 20 50 100
Research on the User Interest Modeling of Personalized Search Engine 被引量:2
1
作者 LI Zhengwei XIA Shixiong NIU Qiang XIA Zhanguo 《Wuhan University Journal of Natural Sciences》 CAS 2007年第5期893-896,共4页
At present, how to enable Search Engine to construct user personal interest model initially, master user's personalized information timely and provide personalized services accurately have become the hotspot in the r... At present, how to enable Search Engine to construct user personal interest model initially, master user's personalized information timely and provide personalized services accurately have become the hotspot in the research of Search Engine area. Aiming at the problems of user model's construction and combining techniques of manual customization modeling and automatic analytical modeling, a User Interest Model (UIM) is proposed in the paper. On the basis of it, the corresponding establishment and update algorithms of User lnterest Profile (UIP) are presented subsequently. Simulation tests proved that the UIM proposed and corresponding algorithms could enhance the retrieval precision effectively and have superior adaptability. 展开更多
关键词 PERSONALIZATION search engine User Interest Model intellectual agent
下载PDF
Personalize Web Searching Strategies Classification and Comparison
2
作者 Mariya Savova Evtimova Ivan Momtchilov Momtchev 《通讯和计算机(中英文版)》 2016年第1期19-23,共5页
关键词 个性化网络 搜索策略 分类 网络搜索工具 用户兴趣模型 语义网 代理技术 信息
下载PDF
WWW上Meta-Search的研究与实现 被引量:6
3
作者 陈智健 《计算机科学》 CSCD 北大核心 1999年第4期38-42,共5页
1 引言 World Wide Web是目前全球最大的信息系统,在WWW上查询Web文档主要依赖于Internet上的索引信息系统,如Yahoo、Infoseek、AltaVista、WebCrawler、Excite、Lycos等等。由于WWW太大又没有良好的结构且Web服务器的自治性,所以Web文... 1 引言 World Wide Web是目前全球最大的信息系统,在WWW上查询Web文档主要依赖于Internet上的索引信息系统,如Yahoo、Infoseek、AltaVista、WebCrawler、Excite、Lycos等等。由于WWW太大又没有良好的结构且Web服务器的自治性,所以Web文档的查询难以做到全面而精确。衡量Web文档查询的质量主要有两个方面:①是否能把所有相关的文档资源找出来,不要有所遗漏。 展开更多
关键词 WWW 元搜索 INTERNET网 信息资源
下载PDF
Web search engine:characteristics of user behaviors and their implication 被引量:4
4
作者 王建勇 单松巍 +2 位作者 雷鸣 谢正茂 李晓明 《Science in China(Series F)》 2001年第5期351-365,共15页
In this paper, first studied are the distribution characteristics of user behaviors based on log data from a massive web search engine. Analysis shows that stochastic distribution of user queries accords with the char... In this paper, first studied are the distribution characteristics of user behaviors based on log data from a massive web search engine. Analysis shows that stochastic distribution of user queries accords with the characteristics of power-law function and exhibits strong similarity, and the user' s queries and clicked URLs present dramatic locality, which implies that query cache and 'hot click' cache can be employed to improve system performance. Then three typical cache replacement policies are compared, including LRU, FIFO, and LFU with attenuation. In addition, the distribution character-istics of web information are also analyzed, which demonstrates that the link popularity and replica pop-ularity of a URL have positive influence on its importance. Finally, variance between the link popularity and user popularity, and variance between replica popularity and user popularity are analyzed, which give us some important insight that helps us improve the ranking algorithms in a search engine. 展开更多
关键词 world wide web search engine distribution characteristic web information user behavior.
原文传递
Web Information Retrieval: Problem and Prospects
5
作者 Monika Arora Uma Kanjilal Dinesh Varshney 《Computer Technology and Application》 2011年第1期48-57,共10页
关键词 网络信息检索 网络搜索引擎 展望 相关反馈 支持向量机 图形分析 统计方法 新闻组
下载PDF
Web信息检索研究进展 被引量:118
6
作者 王继成 萧嵘 +1 位作者 孙正兴 张福炎 《计算机研究与发展》 EI CSCD 北大核心 2001年第2期187-193,共7页
Web上大量、分布、动态的信息造成了“信息过载”,如何在传统信息检索技术的基础上开展针对 Web的检索工作已经成为一项重要的研究课题 .但是 ,繁多的 Web信息检索系统和各种模糊的概念给用户的选择和研究人员的讨论带来了不便 .同时 ,... Web上大量、分布、动态的信息造成了“信息过载”,如何在传统信息检索技术的基础上开展针对 Web的检索工作已经成为一项重要的研究课题 .但是 ,繁多的 Web信息检索系统和各种模糊的概念给用户的选择和研究人员的讨论带来了不便 .同时 ,有关 Web信息检索最新技术的比较完整的分析又十分缺乏 .在此 ,对 Web信息检索技术进行了综述 ,从 Web信息检索系统的层次化分类 (搜索引擎与目录、元搜索引擎、信息检索 agent)、一般机制和关键新技术 (基于超链的相关度排序、检索结果的联机聚类、基于概念的检索、相关度反馈 )等方面加以阐述 。 展开更多
关键词 web 信息检索 搜索引擎 元搜索引擎 INTERNET
下载PDF
基于元数据与Z39.50的分布协作式Web信息检索 被引量:27
7
作者 王继成 杨晓江 +1 位作者 潘金贵 张福炎 《软件学报》 EI CSCD 北大核心 2001年第4期620-627,共8页
Web上大量的异质、分布、动态的信息造成了“信息过载”.如何有效地为用户提供 Web信息检索已经成为一项重要的研究课题 .Web搜索引擎部分地解决了信息检索问题 ,然而其效果却远远不能令人满意 .提出了 Web信息检索的分布协作策略以取... Web上大量的异质、分布、动态的信息造成了“信息过载”.如何有效地为用户提供 Web信息检索已经成为一项重要的研究课题 .Web搜索引擎部分地解决了信息检索问题 ,然而其效果却远远不能令人满意 .提出了 Web信息检索的分布协作策略以取代传统的集中式信息检索方式 ;给出了一种新的 Web信息检索系统模型 ,该模型支持对 Web文档的元数据进行检索 ,并采用 Z39.50协议作为接口标准 ,以克服不同信息检索系统之间的访问异构性 .在此基础上 ,设计了一个分布协作式 Web信息检索框架 ,用以帮助用户有效地进行 Web信息检索 . 展开更多
关键词 web 信息检索 搜索引擎 元数据 Z39.50
下载PDF
一种通用Web信息采集系统的设计与实现 被引量:11
8
作者 吴丽辉 王斌 余智华 《计算机工程》 EI CAS CSCD 北大核心 2005年第3期123-124,194,共3页
介绍了一种通用的Web信息采集系统,给出了系统总体结构,分析了信息采集器、采集控制服务器和信息发布服务器,讨论了系统实际的应用。实践证明,该系统能够对Internet信息进行自动采集,并对今后的应用提供充分的支持,具有良好的通用性。
关键词 web信息 通用性 采集系统 服务器 信息发布 信息采集 设计 证明 实际 系统总体结构
下载PDF
领域本体指导的Web商品信息抽取 被引量:9
9
作者 毕蕾 沈洁 +3 位作者 徐法艳 魏榴花 朱燕 孙荣霜 《计算机工程与设计》 CSCD 北大核心 2008年第24期6393-6396,共4页
信息在网络上传播具有高时效、低成本等特性,因而越来越多的企业和个人都选择在网上发布商品信息,例如汽车、房产等信息。这些内容多数是以有一定的结构的信息呈现,如表格,但是不同网站的表现形式却大相径庭。提出了以领域本体知识为指... 信息在网络上传播具有高时效、低成本等特性,因而越来越多的企业和个人都选择在网上发布商品信息,例如汽车、房产等信息。这些内容多数是以有一定的结构的信息呈现,如表格,但是不同网站的表现形式却大相径庭。提出了以领域本体知识为指导,抽取表格信息表达为主的商品信息,以房产为例,自动集成不同网站的同类服务或产品的信息,用以实现专业检索的功能。 展开更多
关键词 领域本体 信息检索 信息抽取 搜索引擎 网络信息挖掘
下载PDF
分布式Web信息采集系统的研究与设计 被引量:10
10
作者 李盛韬 成绫 余智华 《计算机工程与应用》 CSCD 北大核心 2003年第16期162-166,182,共6页
Web信息的急速膨胀,使得Web信息采集面临一个巨大的挑战。针对这一情况,实现了一个分布式Web信息采集系统,以提高一般Web信息采集的能力。文章论述了分布式信息采集的基本原理、分类、难点以及相应的对策,并就该分布式Web信息采集系统... Web信息的急速膨胀,使得Web信息采集面临一个巨大的挑战。针对这一情况,实现了一个分布式Web信息采集系统,以提高一般Web信息采集的能力。文章论述了分布式信息采集的基本原理、分类、难点以及相应的对策,并就该分布式Web信息采集系统进行了仔细的剖析。最后,对分布式Web信息采集的发展作了一个展望。 展开更多
关键词 信息采集 分布式 搜索引擎 信息处理 web
下载PDF
Web信息查询研究进展 被引量:5
11
作者 徐林昊 杨文柱 +2 位作者 张绍华 薛文玲 李天柱 《河北大学学报(自然科学版)》 CAS 2001年第3期347-354,共8页
Web上大量、分布、动态的信息 ,造成了用户在查询Web上的信息时产生的“信息过载”和“信息迷向”现象 .Web信息检索与查询是目前的研究热点 ,本文分析和比较现有Web信息检索和查询语言技术的发展现状 ,介绍了基于人工智能领域中机器学... Web上大量、分布、动态的信息 ,造成了用户在查询Web上的信息时产生的“信息过载”和“信息迷向”现象 .Web信息检索与查询是目前的研究热点 ,本文分析和比较现有Web信息检索和查询语言技术的发展现状 ,介绍了基于人工智能领域中机器学习方法的Web信息检索和查询以及信息抽取技术的研究 。 展开更多
关键词 搜索引擎 web查询 信息抽取 智能AGENT XML INTERNET
下载PDF
Web搜索引擎框架研究 被引量:48
12
作者 张卫丰 徐宝文 《计算机研究与发展》 EI CSCD 北大核心 2000年第3期376-378,共3页
Web搜索引擎是Internet上非常有用的信息检索工具,但是由于目前搜索引擎检索出的信息量庞大,且一个特定的搜索引擎主要包含某一特定领域的信息,这使得用户很难从某一个搜索引擎获得准确的导航信息.文中提出一个新的 W... Web搜索引擎是Internet上非常有用的信息检索工具,但是由于目前搜索引擎检索出的信息量庞大,且一个特定的搜索引擎主要包含某一特定领域的信息,这使得用户很难从某一个搜索引擎获得准确的导航信息.文中提出一个新的 Web搜索引擎框架 GSE,井提出了一个适合于 Web信息获取与处理的语言 WIRPL.通过WIRPL可以将多个Web搜索引擎结合起来,为用户提供一个一致、高效、准确的Web搜索引擎. 展开更多
关键词 搜索引擎 INTERNET网 web 信息检索工具
下载PDF
加速评估算法:一种提高Web结构挖掘质量的新方法 被引量:27
13
作者 张岭 马范援 《计算机研究与发展》 EI CSCD 北大核心 2004年第1期98-103,共6页
利用Web结构挖掘可以找到Web上的高质量网页 ,它大大地提高了搜索引擎的检索精度 目前的Web结构挖掘算法是通过统计链接到每个页面的超链接的数量和源结点的质量对页面进行评估 ,基于统计链接数目的算法存在一个严重缺陷 :页面评价两极... 利用Web结构挖掘可以找到Web上的高质量网页 ,它大大地提高了搜索引擎的检索精度 目前的Web结构挖掘算法是通过统计链接到每个页面的超链接的数量和源结点的质量对页面进行评估 ,基于统计链接数目的算法存在一个严重缺陷 :页面评价两极分化 一些传统的高质量页面经常出现在Web检索结果的前面 ,而Web上新加入的高质量页面很难被用户找到 提出了加速评估算法以克服现有Web超链接分析中的不足 。 展开更多
关键词 web结构挖掘 PAGERANK 信息检索 搜索引擎 加速评估算法
下载PDF
Web网站站外链接类型与特征调查——链接分析法可行性研究 被引量:24
14
作者 刘雁书 方平 《大学图书馆学报》 CSSCI 北大核心 2001年第5期65-68,共4页
通过对有代表意义网站站外链接类型及特征的调查分析,评价利用链接关系,评价网络信息的可行性。站外链接关系反应的是被链网页被利用与被推荐的总体情况,与被链网页质量存在正向(肯定)的联系,因此利用站外链接评价网络信息是可行的。
关键词 网络信息评价 链接类型 引文分析法 链接分析法 web网站 站外链接
下载PDF
语义Web搜索技术研究进展 被引量:19
15
作者 叶育鑫 欧阳丹彤 《计算机科学》 CSCD 北大核心 2010年第1期1-5,共5页
语义Web搜索技术是综合本体论、信息检索、自然语言处理等多学科理论和方法的新兴技术。介绍了语义Web和语义Web搜索的现状。在此基础上,给出了实现语义Web搜索技术的一般体系结构,并进一步分析了各组成模块的基本任务、现有技术和评价... 语义Web搜索技术是综合本体论、信息检索、自然语言处理等多学科理论和方法的新兴技术。介绍了语义Web和语义Web搜索的现状。在此基础上,给出了实现语义Web搜索技术的一般体系结构,并进一步分析了各组成模块的基本任务、现有技术和评价体系。最后给出了所做的相关工作和对语义Web搜索技术的展望。 展开更多
关键词 语义web搜索 本体 信息检索 智能搜索引擎
下载PDF
面向主题的Web信息收集系统的设计与实现 被引量:12
16
作者 潘春华 武港山 《小型微型计算机系统》 CSCD 北大核心 2003年第12期2150-2154,共5页
随着互联网信息的持续爆炸性增长 ,通用搜索引擎的信息覆盖率和检索精度都在不断下降 ,发展面向主题信息的专用网络信息检索工具已经成为趋势 .文中提出的面向主题的Web信息收集系统是这类工具的核心部件 .该系统采用文档矢量模型进行... 随着互联网信息的持续爆炸性增长 ,通用搜索引擎的信息覆盖率和检索精度都在不断下降 ,发展面向主题信息的专用网络信息检索工具已经成为趋势 .文中提出的面向主题的Web信息收集系统是这类工具的核心部件 .该系统采用文档矢量模型进行文档相关度计算 ,并结合页面链接的上下文信息过滤页面 ;借鉴并修改了Shark启发式查找算法来查找相关页面 ;可采用多机并行下载提高收集效率 ;并依据站点的重要程度进行动态更新 .在一个面向Internet的计算机教学资源检索的搜索引擎中具体实现了这个Web信息收集系统 ,整个系统在低性能的台式机上就能运行 ,并可获得较高的属于指定主题的页面的收集精度和收集效率 . 展开更多
关键词 web信息收集系统 搜索引擎 信息检索 万维网 WWW 互联网 主题 系统设计
下载PDF
Web服务搜索技术综述 被引量:4
17
作者 关佶红 许红儒 周水庚 《计算机科学与探索》 CSCD 2010年第5期385-400,共16页
随着Web服务应用的迅速发展与日益普及,如何快速、准确地搜索到用户所需的Web服务成为了制约Web服务发展的关键问题之一。目前的Web服务搜索技术包括:基于UDDI注册中心、通过Web服务网站、使用专用搜索引擎与使用通用搜索引擎四种方式... 随着Web服务应用的迅速发展与日益普及,如何快速、准确地搜索到用户所需的Web服务成为了制约Web服务发展的关键问题之一。目前的Web服务搜索技术包括:基于UDDI注册中心、通过Web服务网站、使用专用搜索引擎与使用通用搜索引擎四种方式。对现有主要Web服务搜索技术进行了详细评述。在对典型Web服务搜索技术分析比较的基础上,指出了建立专用的Web服务搜索引擎的必要性以及所面临的问题与挑战。 展开更多
关键词 web服务 搜索引擎 信息检索 服务匹配
下载PDF
基于移动爬虫的专用Web信息收集系统的设计 被引量:3
18
作者 潘春华 冯太明 武港山 《计算机工程与应用》 CSCD 北大核心 2003年第36期153-156,共4页
搜索引擎已经成为网上导航的重要工具。为了能够提供强大的搜索能力,搜索引擎对网上可访问文档维持着详尽的索引。创建和维护索引的任务由网络爬虫完成,网络爬虫代表搜索引擎递归地遍历和下载Web页面。Web页面在下载之后,被搜索引擎分... 搜索引擎已经成为网上导航的重要工具。为了能够提供强大的搜索能力,搜索引擎对网上可访问文档维持着详尽的索引。创建和维护索引的任务由网络爬虫完成,网络爬虫代表搜索引擎递归地遍历和下载Web页面。Web页面在下载之后,被搜索引擎分析、建索引,然后提供检索服务。文章介绍了一种更加有效的建立Web索引的方法,该方法是基于移动爬虫(MobileCrawler)的。在此提出的爬虫首先被传送到数据所在的站点,在那里任何不需要的数据在传回搜索引擎之前在当地被过滤。这个方法尤其适用于实施所谓的“智能”爬行算法,这些算法根据已访问过的Web页面的内容来决定一条有效的爬行路径。移动爬虫是移动计算和专业搜索引擎两大技术趋势的结合,能够从技术上很好地解决现在通用搜索引擎所面临的问题。 展开更多
关键词 互联网 搜索引擎 web 信息收集系统 设计 移动爬虫
下载PDF
基于概念分组的Web搜索结果聚类算法 被引量:2
19
作者 李红梅 丁振国 +1 位作者 周水生 周利华 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第1期130-134,共5页
为了便于用户浏览搜索引擎返回的搜索结果,快速有效地定位有价值的Web文档,提出了基于概念分组的Web搜索结果聚类算法.首先,建立特征词同现网络,利用概念分组技术挖掘特征词之间的语义关联,形成主题概念类;然后,计算文档与各概念类之间... 为了便于用户浏览搜索引擎返回的搜索结果,快速有效地定位有价值的Web文档,提出了基于概念分组的Web搜索结果聚类算法.首先,建立特征词同现网络,利用概念分组技术挖掘特征词之间的语义关联,形成主题概念类;然后,计算文档与各概念类之间的距离,据此实现Web搜索结果的聚类;最后,综合考虑特征词在类内和文档集中的重要性进行类别标签的选择.实验结果表明本算法具有较好的聚类性能,明显优于k-均值算法,且产生的类别标签容易理解. 展开更多
关键词 信息检索 搜索引擎 web文档 聚类 概念分组
下载PDF
主题Deep Web爬虫框架研究 被引量:3
20
作者 黄聪会 张水平 胡洋 《计算机工程与设计》 CSCD 北大核心 2010年第5期929-931,935,共4页
为满足用户精确化和个性化获取信息的需要,通过分析Deep Web信息的特点,提出了一个可搜索不同主题Deep Web信息的爬虫框架。针对爬虫框架中Deep Web数据库发现和Deep Web爬虫爬行策略两个难题,分别提出了使用通用搜索引擎以加快发现不... 为满足用户精确化和个性化获取信息的需要,通过分析Deep Web信息的特点,提出了一个可搜索不同主题Deep Web信息的爬虫框架。针对爬虫框架中Deep Web数据库发现和Deep Web爬虫爬行策略两个难题,分别提出了使用通用搜索引擎以加快发现不同主题的Deep Web数据库和采用常用字最大限度下载Deep Web信息的技术。实验结果表明了该框架采用的技术是可行的。 展开更多
关键词 深网 爬虫 搜索引擎 信息抽取 常用字
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部