期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
PageRank技术分析及网页重要性的综合评价模型
被引量:
9
1
作者
过仕明
《图书馆论坛》
CSSCI
北大核心
2006年第1期80-81,79,共3页
分析了搜索引擎Google的PageRank技术及其存在的不足,并结合搜索引擎的第一定律和用户对页面的超文本链的点击率判断网页重要性的方法,建立了网页重要性的综合评价模型。
关键词
搜索引擎
PAGERANK
网页重要性
综合评价模型
下载PDF
职称材料
面向主题的网页搜索系统
被引量:
12
2
作者
宋聚平
王永成
+1 位作者
尹中航
滕伟
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2003年第3期401-403,共3页
论述一个面向主题的网页搜索系统 (SATWP) ,该系统在智能代理的辅助下具有搜索、导航、以及信息反馈等功能 .在判断网页与查询主题的相关度时改变了单纯的从网页内容上考虑的方法 ,即从网页自身的 URL、网页间的关系以及网页的内容来判...
论述一个面向主题的网页搜索系统 (SATWP) ,该系统在智能代理的辅助下具有搜索、导航、以及信息反馈等功能 .在判断网页与查询主题的相关度时改变了单纯的从网页内容上考虑的方法 ,即从网页自身的 URL、网页间的关系以及网页的内容来判断 .SATWP采用在客户端的智能代理记录用户的浏览行为 ,并把有关信息反馈给服务器 ,服务器根据这些信息随时调整数据库中相关网页的重要性顺序 ,增加了自身的学习功能 .试验结果表明 。
展开更多
关键词
定题搜索
搜索引擎
网页重要性
超链分析
下载PDF
职称材料
基于遗传算法的主题爬虫
被引量:
2
3
作者
张海亮
袁道华
《计算机技术与发展》
2012年第8期48-52,共5页
针对目前主题网络爬虫搜索策略难以在全局范围内找到最优解,通过对遗传算法的分析与研究,文中设计了一个基于遗传算法的主题爬虫方案。引入了结合文本内容的PageRank算法;采用向量空间模型算法计算网页主题相关度;采取网页链接结构与主...
针对目前主题网络爬虫搜索策略难以在全局范围内找到最优解,通过对遗传算法的分析与研究,文中设计了一个基于遗传算法的主题爬虫方案。引入了结合文本内容的PageRank算法;采用向量空间模型算法计算网页主题相关度;采取网页链接结构与主题相关度来评判网页的重要性;依据网页重要性选择爬行中的遗传因子;设置适应度函数筛选与主题相关的网页。与普通的主题爬虫比较,该策略能够获取大量主题相关度高的网页信息,能够提高获取的网页的重要性,能够满足用户对所需主题网页的检索需求,并在一定程度上解决了上述问题。
展开更多
关键词
遗传算法
爬虫
主题爬虫
主题相关度
网页重要性
下载PDF
职称材料
基于灰狼算法的主题爬虫
被引量:
8
4
作者
萧婧婕
陈志云
《计算机科学》
CSCD
北大核心
2018年第B11期146-148,166,共4页
为了解决主题爬虫在全局搜索中难以实现最优解的问题,提高主题爬虫的准确率和召回率,文中设计了一个结合灰狼算法的主题爬虫搜索策略。实验结果表明,与传统的广度优先搜索策略以及同样是群体智能算法的遗传算法相比,基于灰狼算法的主题...
为了解决主题爬虫在全局搜索中难以实现最优解的问题,提高主题爬虫的准确率和召回率,文中设计了一个结合灰狼算法的主题爬虫搜索策略。实验结果表明,与传统的广度优先搜索策略以及同样是群体智能算法的遗传算法相比,基于灰狼算法的主题爬虫的性能有了很大的提高,能爬取到更多的主题相关的网页。
展开更多
关键词
主题爬虫
灰狼算法
主题相关度
网页重要性
下载PDF
职称材料
题名
PageRank技术分析及网页重要性的综合评价模型
被引量:
9
1
作者
过仕明
机构
吉林大学管理学院
出处
《图书馆论坛》
CSSCI
北大核心
2006年第1期80-81,79,共3页
基金
黑龙江省教育厅人文社会科学研究资助项目(项目编号:10542069)
文摘
分析了搜索引擎Google的PageRank技术及其存在的不足,并结合搜索引擎的第一定律和用户对页面的超文本链的点击率判断网页重要性的方法,建立了网页重要性的综合评价模型。
关键词
搜索引擎
PAGERANK
网页重要性
综合评价模型
Keywords
search engine
pagerank
webpage essentiality
integrate evaluate mode
分类号
G354 [文化科学—情报学]
下载PDF
职称材料
题名
面向主题的网页搜索系统
被引量:
12
2
作者
宋聚平
王永成
尹中航
滕伟
机构
上海交通大学电子信息学院
出处
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2003年第3期401-403,共3页
基金
国家自然科学基金资助项目 ( 60 0 82 0 0 3 )
文摘
论述一个面向主题的网页搜索系统 (SATWP) ,该系统在智能代理的辅助下具有搜索、导航、以及信息反馈等功能 .在判断网页与查询主题的相关度时改变了单纯的从网页内容上考虑的方法 ,即从网页自身的 URL、网页间的关系以及网页的内容来判断 .SATWP采用在客户端的智能代理记录用户的浏览行为 ,并把有关信息反馈给服务器 ,服务器根据这些信息随时调整数据库中相关网页的重要性顺序 ,增加了自身的学习功能 .试验结果表明 。
关键词
定题搜索
搜索引擎
网页重要性
超链分析
Keywords
topic specific searching
search engine
authority of pages
hyperlink analysis
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于遗传算法的主题爬虫
被引量:
2
3
作者
张海亮
袁道华
机构
四川大学计算机学院
出处
《计算机技术与发展》
2012年第8期48-52,共5页
文摘
针对目前主题网络爬虫搜索策略难以在全局范围内找到最优解,通过对遗传算法的分析与研究,文中设计了一个基于遗传算法的主题爬虫方案。引入了结合文本内容的PageRank算法;采用向量空间模型算法计算网页主题相关度;采取网页链接结构与主题相关度来评判网页的重要性;依据网页重要性选择爬行中的遗传因子;设置适应度函数筛选与主题相关的网页。与普通的主题爬虫比较,该策略能够获取大量主题相关度高的网页信息,能够提高获取的网页的重要性,能够满足用户对所需主题网页的检索需求,并在一定程度上解决了上述问题。
关键词
遗传算法
爬虫
主题爬虫
主题相关度
网页重要性
Keywords
genetic algorithm
crawler
focused crawler
topic similarity
web importance
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于灰狼算法的主题爬虫
被引量:
8
4
作者
萧婧婕
陈志云
机构
华东师范大学计算机科学技术系
出处
《计算机科学》
CSCD
北大核心
2018年第B11期146-148,166,共4页
基金
基于MOOC的计算机课资源建设项目资助
文摘
为了解决主题爬虫在全局搜索中难以实现最优解的问题,提高主题爬虫的准确率和召回率,文中设计了一个结合灰狼算法的主题爬虫搜索策略。实验结果表明,与传统的广度优先搜索策略以及同样是群体智能算法的遗传算法相比,基于灰狼算法的主题爬虫的性能有了很大的提高,能爬取到更多的主题相关的网页。
关键词
主题爬虫
灰狼算法
主题相关度
网页重要性
Keywords
Focused crawler
Grey wolf algorithm
Thematic relevance
Webpage importance
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
PageRank技术分析及网页重要性的综合评价模型
过仕明
《图书馆论坛》
CSSCI
北大核心
2006
9
下载PDF
职称材料
2
面向主题的网页搜索系统
宋聚平
王永成
尹中航
滕伟
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2003
12
下载PDF
职称材料
3
基于遗传算法的主题爬虫
张海亮
袁道华
《计算机技术与发展》
2012
2
下载PDF
职称材料
4
基于灰狼算法的主题爬虫
萧婧婕
陈志云
《计算机科学》
CSCD
北大核心
2018
8
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部