期刊文献+
共找到187篇文章
< 1 2 10 >
每页显示 20 50 100
Web结构挖掘 被引量:20
1
作者 杨炳儒 李岩 +1 位作者 陈新中 王霞 《计算机工程》 CAS CSCD 北大核心 2003年第20期28-30,共3页
概述了Web结构挖掘的有关概念和相关应用,详细分析和比较了基于超链接结构分析的网页排序的最权威算法,提出了有关Web结构挖掘技术的几个新的研究方向,供感兴趣的同行参考。
关键词 web结构挖掘 PAGERANK HITS SALSA 超链接 网页排序
下载PDF
加速评估算法:一种提高Web结构挖掘质量的新方法 被引量:27
2
作者 张岭 马范援 《计算机研究与发展》 EI CSCD 北大核心 2004年第1期98-103,共6页
利用Web结构挖掘可以找到Web上的高质量网页 ,它大大地提高了搜索引擎的检索精度 目前的Web结构挖掘算法是通过统计链接到每个页面的超链接的数量和源结点的质量对页面进行评估 ,基于统计链接数目的算法存在一个严重缺陷 :页面评价两极... 利用Web结构挖掘可以找到Web上的高质量网页 ,它大大地提高了搜索引擎的检索精度 目前的Web结构挖掘算法是通过统计链接到每个页面的超链接的数量和源结点的质量对页面进行评估 ,基于统计链接数目的算法存在一个严重缺陷 :页面评价两极分化 一些传统的高质量页面经常出现在Web检索结果的前面 ,而Web上新加入的高质量页面很难被用户找到 提出了加速评估算法以克服现有Web超链接分析中的不足 。 展开更多
关键词 web结构挖掘 PAGERANK 信息检索 搜索引擎 加速评估算法
下载PDF
Web结构挖掘算法探讨 被引量:18
3
作者 宋建康 张礼平 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2003年第5期537-540,共4页
在分析Web结构挖掘现有算法的基础上,重点研究了HITS(Hyperlink-InducedTopicSearch)算法。Hub页面的多主题性、无关页面和无关链接等对于HITS算法有较大影响。针对这些问题,提出了HITS算法的改进算法。
关键词 web结构挖掘 HITS XML HUB 权威页面
下载PDF
基于PageRank和HITS的Web结构挖掘算法研究 被引量:6
4
作者 刘栋 刘希玉 郝婷婷 《山东科学》 CAS 2006年第4期11-14,共4页
在对Web结构挖掘的典型算法探讨的基础上,提出了一种PageRank算法和HITS算法相结合的改进算法,并对该算法进行了简要分析。
关键词 数据挖掘 web结构挖掘 PAGERANK HITS
下载PDF
应用Web结构挖掘的PageRank算法的改进研究 被引量:5
5
作者 范聪贤 刘秋菊 徐汀荣 《计算机工程与应用》 CSCD 北大核心 2010年第9期127-129,共3页
随着Internet技术的发展,Web网页成为人们获取信息的有效途径,Web数据挖掘逐渐成为研究的热点。基于Web结构挖掘的PageRank算法存在不足的情况下,提出了一种改进的算法,实验结果证明改进的算法较原算法具有较好的效果,具有一定的实用价值。
关键词 web数据挖掘 web结构挖掘 PAGERANK GOOGLE
下载PDF
Web结构挖掘及其算法 被引量:10
6
作者 王艳华 张纪 《计算机工程》 CAS CSCD 北大核心 2005年第B07期125-127,共3页
随着网络和数据挖掘技术的发展,Web数据挖掘得到了较多的研究。该文从Web结构挖掘的角度出发,在分析了网络有向图的总体结构以及导航页面、目标页面和网络功能的基础上,研究了结构挖掘算法,针对Hub页面的多主题性、无关页面、无关链接... 随着网络和数据挖掘技术的发展,Web数据挖掘得到了较多的研究。该文从Web结构挖掘的角度出发,在分析了网络有向图的总体结构以及导航页面、目标页面和网络功能的基础上,研究了结构挖掘算法,针对Hub页面的多主题性、无关页面、无关链接等问题,提出了HITS算法的改进算法。 展开更多
关键词 数据挖掘 web结构挖掘 HITS算法 中枢 权威
下载PDF
基于Web结构挖掘的搜索引擎作弊检测方法 被引量:4
7
作者 冉丽 何毅舟 许龙飞 《计算机应用》 CSCD 北大核心 2004年第10期158-160,共3页
搜索引擎作弊行为从搜索引擎优化中演变而来,却对网络发展带来负面影响。通过构造站内站外精简模型用于判断几类作弊行为,得出PageRank改进算法中惩罚因子的公式和其中三个函数的特征,展望了搜索引擎作弊检测方法的发展前景。
关键词 web结构挖掘 搜索引擎作弊 精简模型 PAGERANK
下载PDF
基于Web结构数据挖掘技术的数学方法 被引量:3
8
作者 刘山 刘峨 《计算机工程》 CAS CSCD 北大核心 2002年第7期248-249,共2页
引入传统的数学方法:线性方程组表示页结构之间的关系及通过求解齐次线性方程组来计算页的的键值。进而发WebWebPageRank现结构中重要的页的知识,可以被用来改进搜索引擎的性能。
关键词 web结构 数据挖掘 数学方法 WWW 线性方程 数据库 计算机
下载PDF
Web结构挖掘的PageRank算法改进 被引量:3
9
作者 吴春旭 郭磊 《情报杂志》 CSSCI 北大核心 2005年第10期55-56,58,共3页
分析了Web结构挖掘的PageRank和HITS算法,并介绍了一种对PageRank算法的改进。
关键词 web结构 搜索引擎 网络信息 HITS算法 PAGERANK算法
下载PDF
自组织映射在Web结构挖掘中的应用 被引量:1
10
作者 周晓峥 刘勘 +1 位作者 孟波 周洞汝 《计算机工程与应用》 CSCD 北大核心 2003年第3期31-33,共3页
该文讨论了用自组织映射进行Web结构挖掘的基本方法。用SOM可直观地表示数据的相似性和进行分类,还可方便地进行数据聚簇分析,并可在Web挖掘中找到权威页面等有用信息。
关键词 自组织映射 web结构挖掘 聚簇 数据挖掘 数据库 INTERNET
下载PDF
Web结构挖掘研究 被引量:16
11
作者 陈定权 《情报理论与实践》 CSSCI 北大核心 2003年第1期59-61,96,共4页
Superficially,the Web is believed to lack structure and organization as a whole Recent research,however,shows it’s self organized to some extent Analyses of the Web’s network of hyperlinks reveal an intricate struct... Superficially,the Web is believed to lack structure and organization as a whole Recent research,however,shows it’s self organized to some extent Analyses of the Web’s network of hyperlinks reveal an intricate structure that is proved to be valuable for organizing information,improving search methods and understanding the Web in a broader technological and social context This paper first introduces the concept and taxonomy of Web mining,then illustrates some classical algorithms,finally gives some application examples of Web structure 展开更多
关键词 web结构挖掘 web数据挖掘 应用 PAGERANK算法 HITS算法
下载PDF
Web结构挖掘中基于熵的链接分析法 被引量:1
12
作者 王勇 杨华千 李建福 《计算机工程与设计》 CSCD 北大核心 2006年第9期1622-1624,1688,共4页
在Web结构挖掘中,传统的HITS(hyperlink induced topics search)算法被广泛应用来寻找搜索引擎返回页面中的Autho-rity页面和Hub页面。但是在网站中除了有价值的页面内容外,还有很多与页面内容无关的链接,如广告、链接导航等。由于这些... 在Web结构挖掘中,传统的HITS(hyperlink induced topics search)算法被广泛应用来寻找搜索引擎返回页面中的Autho-rity页面和Hub页面。但是在网站中除了有价值的页面内容外,还有很多与页面内容无关的链接,如广告、链接导航等。由于这些链接的存在,应用HITS算法时就会导致某些广告网页或无关网页获得较高的Authority值和Hub值。为了解决这个问题,在原有HITS算法的基础上,引入了香农信息熵的概念,提出了基于熵的网页链接分析方法来挖掘网页结构。该算法的核心思想是用信息熵来表示链接文本所隐含的知识。 展开更多
关键词 主题提取 链接分析 web结构挖掘
下载PDF
Web结构挖掘中HITS算法改进的研究 被引量:11
13
作者 范聪贤 徐汀荣 范强贤 《微计算机信息》 2010年第3期160-162,共3页
随着Internet技术的发展,Web网页成为人们获取信息的有效途径,Web数据挖掘逐渐成为国内外研究的热点。基于Web结构挖掘中HITS算法只考虑页面之间的链接关系而忽视了页面的具体内容,在这种情况下容易出现主题偏离[1]现象,影响了搜索结果... 随着Internet技术的发展,Web网页成为人们获取信息的有效途径,Web数据挖掘逐渐成为国内外研究的热点。基于Web结构挖掘中HITS算法只考虑页面之间的链接关系而忽视了页面的具体内容,在这种情况下容易出现主题偏离[1]现象,影响了搜索结果,为了抑制主题偏离现象,本文把超链接信息检索方法与页面内容相结合,提出了一种改进的算法。实验结果证明改进的算法较原算法具有较好的效果,有效的抑制了主题偏离现象,具有一定的实用价值。 展开更多
关键词 web数据挖掘 web结构挖掘 HITS GOOGLE
下载PDF
Web结构挖掘及HITS算法分析 被引量:8
14
作者 黄英铭 《计算机与现代化》 2007年第7期23-25,37,共4页
在介绍Web结构的基础上,研究了基于Web超链接的HITS算法,分析该算法存在的若干问题并提出了两种改进的算法。
关键词 web结构挖掘 超链接 HITS算法
下载PDF
基于粗糙集的Web结构挖掘 被引量:1
15
作者 周勇 刘锋 《计算机技术与发展》 2008年第3期151-153,206,共4页
Web站点是由许多Web页面构成的信息系统,随着网络的飞速发展,Web挖掘得到了越来越多的研究。如何从Web中找到与用户查询主题相关的权威页面,是Web结构挖掘的一个重要研究方向。粗糙集理论作为一种有效处理模糊和不确定信息的数学工具,... Web站点是由许多Web页面构成的信息系统,随着网络的飞速发展,Web挖掘得到了越来越多的研究。如何从Web中找到与用户查询主题相关的权威页面,是Web结构挖掘的一个重要研究方向。粗糙集理论作为一种有效处理模糊和不确定信息的数学工具,由于其不需要任何先验知识,在数据挖掘领域取得了广泛的应用。文中概述了Web结构挖掘的有关概念,基于粗糙集理论,定义了Web结构挖掘的数据模型,并给出了基于粗糙集的Web结构挖掘的实现流程,分析说明了该方法的性能。 展开更多
关键词 web挖掘 web结构挖掘 粗糙集
下载PDF
应用数据词典构造基于Web结构的数据库中间件 被引量:1
16
作者 苗京 李圆媛 佘幼宇 《计算机系统应用》 北大核心 2004年第9期60-62,共3页
基于Web结构的数据库中间件负责管理服务器和数据库服务器之间的通信并提供应用程序服务。数据词典是指按数据流程图中的每一个成分逐一给出精确的定义,组成一个有机系统。本文介绍了在三层结构系统模式中应用数据词典来构造基于Web结... 基于Web结构的数据库中间件负责管理服务器和数据库服务器之间的通信并提供应用程序服务。数据词典是指按数据流程图中的每一个成分逐一给出精确的定义,组成一个有机系统。本文介绍了在三层结构系统模式中应用数据词典来构造基于Web结构的数据库中间件,详细地给出了基于这种方法开发数据库中间件的理论基础、设计原理以及实现方法中所采用的关键技术。 展开更多
关键词 数据库中间件 web结构 数据词典 构造 数据库服务器 管理服务器 数据流程图 应用程序 有机系统 系统模式 三层结构 理论基础 关键技术 设计原理
下载PDF
基于三层Web结构的NT应用服务器系统实现
17
作者 叶德谦 杨金鹏 马勤勇 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2001年第3期332-334,共3页
实现了一个基于三层Web结构的NT应用服务器系统,它是由Web服务器、数据库、主服务器和多个分立执行器组成的。运用此系统用户可通过Internet运行和管理异步运行的应用程序。文中给出了系统的结构,工作原理以及实现方法。
关键词 三层web结构 web服务器 主服务器 执行器 NT 物业管理 应用程序 企业管理 Internet
下载PDF
基于Web结构的网站新闻采集系统的设计与实现 被引量:3
18
作者 陈建国 《井冈山大学学报(自然科学版)》 2012年第2期54-57,共4页
在深入研究网络信息采集技术的基础上,提出一个基于Web结构的新闻采集模型。该模型加载采集入口地址后,通过信息采集和过滤算法确定新闻列表页,结合正则表达式技术自动识别新闻内容页的链接地址,访问目标新闻内容页,使用采集算法自动提... 在深入研究网络信息采集技术的基础上,提出一个基于Web结构的新闻采集模型。该模型加载采集入口地址后,通过信息采集和过滤算法确定新闻列表页,结合正则表达式技术自动识别新闻内容页的链接地址,访问目标新闻内容页,使用采集算法自动提取新闻信息数据。同时,它可以过滤在此页面中嵌入的广告等信息。实践结果表明,该模型工作良好,可以自动化、高效率地采集新闻信息。 展开更多
关键词 信息采集 web结构 正则表达式 数据挖掘 新闻采集
下载PDF
基于Web结构挖掘算法的网站构建 被引量:1
19
作者 叶琳莉 林嵩凯 《电脑知识与技术》 2008年第12期1619-1620,1629,共3页
Web结构挖掘是对Web的链接结构进行分析。该文概述Web结构挖掘技术。列举其常见算法。并对PageRank和HITS这两种最重要的Web结构挖掘算法分析比较。通过对算法规律的研究,指出在网站设计规划时的策略以提高网站的价值。
关键词 web结构挖掘 PAGERANK HITS 算法
下载PDF
基于Web结构的文本自动摘要技术研究 被引量:1
20
作者 王健 《科技信息》 2007年第29期102-103,共2页
随着Internet的发展大量机读形式的文献潮水般涌来,自动文本摘要的意义尤为重要。本文从Web文本结构的特点入手,提出了计算主题词权重公式及句子的评价方法,并对LUHN算法进行了改进。
关键词 自动摘要 LUHN算法 web结构 权重系数
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部