题名 基于超链接分析搜索引擎页面排序算法的剖析
被引量:6
1
作者
张书江
机构
安徽理工大学计算机科学与工程学院
出处
《安徽理工大学学报(自然科学版)》
CAS
2008年第2期73-77,共5页
文摘
对搜索结果的排序是搜索引擎中至关重要的一项技术,算法的好坏直接关系到用户输的搜索引擎页面排序算法。对两种最基本的页面排序算法PageR ank和H ITS的算法思想和实现原理进行详细阐述。通过分析对比,总结出它们各自存在的优点和不足进而指出适合其应用的条件领域。最后指出搜素引擎应用超链接分析时应注意的一些影响因素。
关键词
搜索引擎
超链接 分析
页面排序
PAGERANK
HITS
Keywords
search engine
hyperlink analysis
page-ranking
PageRank
HITS
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 基于超链接引导和链接图分析的主题搜索引擎
被引量:2
2
作者
唐苏
刘循
机构
四川大学计算机学院
出处
《计算机技术与发展》
2011年第2期155-158,共4页
基金
国家自然科学基金(60773169)
文摘
主题搜索引擎是专为查询某一学科或主题信息而出现的查询工具。针对目前各种主题搜索引擎在主题搜索上的优缺点,提出将基于文字内容启发的超链接引导技术与基于Web链接图的PageRank算法相结合的IPageRank?IND算法,以提高链接相关度判断的准确性和主题资源搜索的覆盖率,并将网页按照VSM算法进行内容相关度判断和自动分类,从而提高检索效率。最后构建一个搜索引擎进行实验,通过比较该算法与其他几种算法的实验结果,能够看到IPageRank-IND算法的优势是明显的。
关键词
主题搜索引擎
超链接 分析
PAGERANK算法
自动分类
Keywords
focused crawler
hyperlink analysis
PageRank algorithm
automatic classification
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
题名 浅析搜索引擎的超链接分析排序算法
被引量:1
3
作者
梁永演
机构
广东交通职业技术学院
出处
《图书情报论坛》
2011年第3期48-50,共3页
文摘
以PageRank算法和HITS算法为例,分析超链接分析技术的搜索引擎排序算法,总结超链接分析技术应用于搜索引擎结果排序的局限性。
关键词
搜索引擎
超链接
PAGERANK算法
HITS算法
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 浅析搜索引擎的超链接分析排序算法
4
作者
梁永演
机构
广东交通职业技术学院
出处
《晋图学刊》
2011年第4期34-36,共3页
文摘
本文以PageRank算法和HITS算法为例,对基于超链接分析技术的搜索引擎排序算法进行分析,并总结了超链接分析技术应用于搜索引擎结果排序的局限性。
关键词
搜索引擎
超链接
排序
PAGERANK
算法
HITS算法
Keywords
search engine
hyperlink
ranking
PageRank
algorithm
HITS algorithm
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于搜索引擎的网络蜘蛛实现原理的研究
被引量:2
5
作者
唐雅媛
机构
湖南科技学院计算机与信息科学系
出处
《湖南科技学院学报》
2006年第11期229-231,共3页
基金
永州市科研项目(永科发[2004]19号)。
文摘
随着信息时代的到来,网络已成为我们生活中不可缺少的一部分。我们经常需要在网上查找资料,也就是用到搜索引擎,而网络蜘蛛又为它的核心——决定了搜索引擎数据容量的大小。本文对网络蜘蛛的实现原理及方法作了详细的论述。
关键词
搜索引擎
网络 蜘蛛
队列
超链接
Keywords
searchingengine
webspider
queue
hyperlink
分类号
TP393.14
[自动化与计算机技术—计算机应用技术]
题名 超链接网络分析的理论与应用研究
被引量:12
6
作者
庞景安
机构
中国科学技术信息研究所
出处
《情报理论与实践》
CSSCI
北大核心
2005年第6期632-635,共4页
文摘
超链接网络分析提供了网络环境中一种新型的计量分析方法,大大拓展了联机网络分析的应用范围,实现了揭示网络环境中由超链接形成的特殊网络结构的目的。本文对超链接网络分析的理论与应用研究进行了简要综述和评价,包括超链接网络分析的概念、方法、分析技术、数据计量,以及网络计量学的理论研究进展等。
关键词
网络 计量学
搜索引擎/超链接网络分析
Keywords
Webmetrics
search engine/hyperlink network analysis
分类号
G350
[文化科学—情报学]
题名 基于超链接信息的搜索引擎检索结果聚类方法研究
被引量:1
7
作者
夏斌
徐彬
机构
河南大学计算机信息工程学院
出处
《电脑开发与应用》
2007年第5期16-17,20,共3页
文摘
针对目前搜索引擎返回候选信息过多从而使用户不能准确查找与主题有关结果的问题,提出了基于超链接信息的搜索引擎检索结果聚类方法,通过对网页的超链接锚文档和网页文档内容挖掘,最终将网页聚成不同的子类别。这种方法在依据网页内容进行聚类的同时,充分利用了Web结构和超链接信息,比传统的结构挖掘方法更能体现网站文档的内容特点,从而提高了聚类的准确性。
关键词
搜索引擎
超链接
结构挖掘
聚类
Keywords
search engines ,hyperlink, structure mining, clustering
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 搜索引擎中Robot搜索算法的优化
被引量:21
8
作者
宋聚平
王永成
滕伟
许欢庆
机构
上海交通大学电子信息学院
出处
《情报学报》
CSSCI
北大核心
2002年第2期130-133,共4页
文摘
目前的搜索引擎越来越暴露出不足之处 ,当用户使用搜索引擎时输入特定关键词之后 ,返回的查询结果往往有数千甚至几百万之多 ,而且其中包含大量的重复信息与垃圾信息 ,用户从中筛选出自己感兴趣的网页仍然需要耗费很长的时间。另外一种情况就是 ,Web上明明存在某些重要网页 ,却没有被搜索引擎的robot发现。本文针对这种现象 ,重点讨论搜索引擎中的搜索策略 ,改善搜索算法 ,使Robot在搜索阶段就能够充分处理与Robot频繁交互的URL列表。根据网页的内容、HTML结构以及其中包含的超链信息计算网页的PageRank ,使URL列表能够根据重要性调整排列顺序。初步的试验结果表明 。
关键词
搜索引擎
超链接
ROBOT
PAGERANK
搜索 策略
搜索 模块
搜索 算法
优化算法
Keywords
search engine,hyperlink,Robot,PageRank.
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
题名 面向垂直搜索引擎的主题提取算法
被引量:9
9
作者
吕林涛
陈丽萍
周红芳
机构
西安理工大学计算机科学与工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第15期44-46,共3页
基金
陕西省自然科学基础研究计划基金资助项目(2007F52)
文摘
针对HITS算法对所有链接分配相等权重导致产生主题漂移的问题,提出基于计算链接价值度及Web页面语义主题相似度对链接分配合理权重的HITS改进算法,突出链接重要度的差异。实验表明,该算法的主题相关度提高了13%~42%,且较好地避免了主题漂移问题,增强了采集信息的准确性,对垂直搜索引擎的研究有重要的理论和实际应用价值。
关键词
HITS算法
垂直搜索引擎
超链接
主题漂移
Keywords
HITS algorithm
vertical search engine
hyperlink
topic drift
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 对Internet上专题型搜索引擎的探讨
被引量:6
10
作者
李瑞勤
朱慧
机构
东北师范大学信息管理系
出处
《情报学报》
CSSCI
北大核心
1999年第S2期158-160,共3页
文摘
本文就 Internet 网上常见的搜索引擎依据其检索内容进行分类,并重点介绍了两个专题型搜索引擎的功能。一个是用于医学领域信息检索的 Healthgate,另一个是用于物理学领域信息检索的 Metaphys 。期望以此引起人们对专题型搜索引擎的开发及利用的重视。
关键词
搜索引擎
检索工具
超链接
数据库
网址
反馈
分类号
TP393.092
[自动化与计算机技术—计算机应用技术]
题名 搜索引擎涉及的知识产权问题
被引量:13
11
作者
杨涛
机构
中山大学信息管理系
出处
《情报科学》
CSSCI
北大核心
2002年第5期553-555,共3页
文摘
本文指出了搜索引擎所涉及的知识产权问题的 3种类型 ,列举了有关的案例 ,同时结合美国和我国的法律规定分析了此问题。最后 。
关键词
搜索引擎
知识产权
超链接
网页快照
著作权法
数字版权法
Keywords
Search engine Intellectual property Hyperlink
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
D913
[政治法律—民商法学]
题名 搜索引擎的知识产权问题探讨
被引量:8
12
作者
赵莉
邓星晟
机构
武汉大学信息管理学院
外交部档案馆
出处
《情报杂志》
CSSCI
北大核心
2004年第3期91-93,共3页
文摘
结合法律规定和相关案例 ,从著作权、商标法和反不当竞争三个方面讨论了搜索引擎涉及的知识产权问题 ,提出了搜索引擎提供者的责任规避。
关键词
搜索引擎
知识产权
著作权
商标法
反不当竞争
超链接
分类号
D923.4
[政治法律—民商法学]
G354.2
[文化科学—情报学]
题名 我国招聘网站间超链接的社会网络分析
被引量:2
13
作者
张小茜
机构
南京大学工程管理学院
出处
《情报探索》
2011年第11期95-98,共4页
文摘
采用社会网络分析方法,分析了我国招聘网站之间由超链接形成的网络密度、程度中心度、中介度和结构对等性,揭示了我国招聘网站的现状及存在的问题,并对我国招聘网站的未来发展提出了一些建议。
关键词
超链接
社会网络分析
招聘网站
网络 招聘
分类号
G203
[文化科学—传播学]
题名 如何添加搜索引擎
14
作者
杨梅
出处
《计算机与网络》
2001年第Z1期14-14,共1页
文摘
ASP中在其最近的版本中新加入了一个文件管理的对象File System Object,可以利用它我们可以为我们的网站编制一个简单的搜索引擎。下面,我将向你讲解如何在一个不大的网站中,使用File SystemObject对象来实现一个简单的搜索引擎。 其实实现的原理很简单,通过文件系统对象,我们可以读出任何的权限范围内的文文的内容,把这些内容放到一个暂存变量中,通过和带搜索字符串的比较,来确定相应的文件是否是所需要的文件。
关键词
搜索引擎
系统对象
字符串变量
搜索 字符串
System
超链接
程序实现
模式匹配
文件夹
权限范围
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
题名 搜索引擎日志挖掘领域的论文合著网络分析
被引量:8
15
作者
王继民
李雷明子
张鹏
机构
北京大学信息管理系
工业和信息化部电子科学技术情报研究所
出处
《现代图书情报技术》
CSSCI
北大核心
2011年第4期58-63,共6页
基金
教育部人文社会科学研究项目“大规模中文搜索引擎日志挖掘及其应用研究”(项目编号:09YJA870002)
北京市共建专项-情报学重点学科建设项目的研究成果之一
文摘
基于Web of SCI和EI数据库中所收录的有关搜索引擎日志挖掘领域的研究论文,构建作者合著网络,利用社会网络分析方法研究合著网络的中心性、小世界特性、连通性等基本特征,发现该领域中最核心的科研合作团队、研究人员及其研究内容等。
关键词
搜索引擎
日志挖掘
社会网络分析
合著网络
Keywords
Search engine Log mining Social network analysis Co - authorship network
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
题名 利用超链接信息改进网页爬行器的搜索策略
被引量:8
16
作者
赫枫龄
左万利
机构
吉林大学计算机科学与技术学院
出处
《吉林大学学报(信息科学版)》
CAS
2005年第1期59-63,共5页
基金
国家自然科学基金项目资助(60373099)
文摘
网页爬行器在Web空间中爬行时,要面对如下两个问题:1)由于Internet上的信息量十分巨大,网络搜索引擎不可能包含整个Web网页;2)受到硬件资源的限制,它所能存储的网页是有限的。爬行器如果按照传统的宽度优先搜索策略在Web空间中爬行,它对所有的网页都采取一视同仁的态度,这样爬行的结果就导致了它所爬行回来的网页质量不高。为此,给出了利用超链接信息改进网页爬行器搜索策略的算法。该算法充分考虑了网页之间的超链接信息,克服了传统的宽度优先搜索策略的盲目性爬行。实验表明,利用该算法爬行得到的网页与某一特定主题相关的网页超过50%。
关键词
爬行器
网络 搜索引擎
宽度优先搜索
超链接
Keywords
crawler
internet search engine
breadth-first search
hyperlink
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
题名 网络信息检索技术现状、瓶颈及趋势分析
被引量:31
17
作者
龚蛟腾
机构
湘潭大学
出处
《情报杂志》
CSSCI
北大核心
2004年第5期75-77,共3页
文摘
目前网络信息检索技术主要有资源定位检索技术、超链接搜索技术、网络搜索引擎技术及通用信息检索技术 ,制约网络信息检索技术发展的瓶颈是图像音频视频检索、汉语自动切分、搜索引擎缺陷等。智能检索技术、知识检索技术、多媒体检索技术、新一代搜索引擎技术、自然语言检索技术和基于内容的检索技术是网络信息检索技术发展的核心与关键。
关键词
网络 信息检索技术
资源定位检索
超链接 搜索
搜索引擎
视频检索
音频检索
汉语切分
自动切分
智能检索
知识检索
多媒体检索
分类号
G354
[文化科学—情报学]
G250.73
[文化科学—图书馆学]
题名 基于PageRank算法的引擎搜索优化策略研究
被引量:2
18
作者
王毅
江小玲
机构
襄樊学院计算机教学中心
出处
《科技资讯》
2008年第11期148-149,151,共3页
文摘
本文针对目前主流的PageRank算法,集中研究了该算法的形成思路、计算方法,并分析该算法在独立网站、包含索引页面、入站链接和出站链接等几种模型下的效果,提出了相应的优化策略。从而有效指导网站链接结构优化,有组织,有规划地提高网页在搜索结果中的排名,避免盲目处理造成的混乱结果。实验证明了所提出优化策略的有效性。
关键词
PAGERANK
搜索引擎
超链接
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
题名 基于共词网络的我国搜索引擎研究热点可视化
被引量:7
19
作者
刘竟
王慧
徐桂芬
机构
江苏大学科技信息研究所
江苏牧羊集团
吉林大学管理学院
出处
《情报科学》
CSSCI
北大核心
2012年第4期604-608,共5页
基金
江苏大学高级专业人才科研启动基金项目(09JDG049)
文摘
对2001-2010年我国搜索引擎的期刊论文进行了文献调查,并采用基于关键词共现的社会网络分析法,构建搜索引擎研究的共词网络,对共词网络进行了点度中心度分析,同时对搜索引擎研究热点进行可视化和分析。
关键词
搜索引擎
共词网络
社会网络分析
可视化
研究热点
Keywords
search engineer
co-word network
social network analysis
visualization
research hotspot
分类号
G350
[文化科学—情报学]
题名 一种基于超链接结构的向量空间模型改进算法
20
作者
原福永
褚蓓蓓
机构
燕山大学信息科学与工程学院
出处
《中文信息学报》
CSCD
北大核心
2005年第4期68-71,77,共5页
文摘
在基于向量空间模型的信息检索系统中,TF-IDF算法被广泛的应用在基于关键字的信息检索中。然而,对于网页独特的超链接结构,需要有一种技术在表示网页内容的同时将与它相邻链接的网页内容考虑进去。本文分析了向量空间模型的实质,并找出了其精度低的原因,在传统模型基础上提出了一种基于网页超链接结构的向量空间模型改进算法。实验分析表明改进后的算法与原算法相比检索精确度提高了10%,在一定程度上改善了检索效果。
关键词
计算机应用
中文信息处理
搜索引擎
信息检索
向量空间模型
超链接
Keywords
computer application
Chinese information processing
search engine
information retrieval
vector space model
hyperlink
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]