期刊文献+
共找到88篇文章
< 1 2 5 >
每页显示 20 50 100
WEB上超文本数据导航方法的研究 被引量:11
1
作者 马瑞民 衣治安 《情报学报》 CSSCI 北大核心 2001年第5期537-544,共8页
迷路问题是超文本数据模型中的主要弊病之一 ,解决该问题需要使用超文本数据的导航方法。本文从超文本数据链接结构的研究出发 ,解释了超文本数据出现迷路的主要原因 ,并对解决Web页面浏览时出现的迷路问题所采用的导航方法进行了综述... 迷路问题是超文本数据模型中的主要弊病之一 ,解决该问题需要使用超文本数据的导航方法。本文从超文本数据链接结构的研究出发 ,解释了超文本数据出现迷路的主要原因 ,并对解决Web页面浏览时出现的迷路问题所采用的导航方法进行了综述与研究 。 展开更多
关键词 超文本/超媒体 迷路问题 导航方法 web 超链 页面链接优化 自动超链接技术 导航图
下载PDF
Web结构分析算法HITS的改进及应用 被引量:5
2
作者 李昕 朱永胜 武港山 《计算机工程》 EI CAS CSCD 北大核心 2005年第6期40-42,83,共4页
在网络环境下,传统检索技术不可避免地存在种种不足,而超链分析技术可以直接或间接地解决这些问题。该文在介绍网络结构的基础上,描述了已有的HITS算法及其改进策略,并提出了该算法的简单实现架构。HITS算法着眼于挖掘超链间的潜在语义... 在网络环境下,传统检索技术不可避免地存在种种不足,而超链分析技术可以直接或间接地解决这些问题。该文在介绍网络结构的基础上,描述了已有的HITS算法及其改进策略,并提出了该算法的简单实现架构。HITS算法着眼于挖掘超链间的潜在语义关系,有助于 在更深层次上挖掘Web中蕴含的语义信息。 展开更多
关键词 web 超链 HITS
下载PDF
Web应用测试技术进展 被引量:44
3
作者 邓小鹏 邢春晓 蔡莲红 《计算机研究与发展》 EI CSCD 北大核心 2007年第8期1273-1283,共11页
Web应用的特殊性使得其测试具有挑战性,但目前针对其测试的研究同其设计开发的研究相比相对薄弱.从Web应用的体系结构、实现技术、组成成分、运行机制、运行环境、开发设计等方面分析了影响测试的因素.归纳了现有Web应用设计阶段、开发... Web应用的特殊性使得其测试具有挑战性,但目前针对其测试的研究同其设计开发的研究相比相对薄弱.从Web应用的体系结构、实现技术、组成成分、运行机制、运行环境、开发设计等方面分析了影响测试的因素.归纳了现有Web应用设计阶段、开发阶段、运行阶段、维护阶段所涉及的主要测试方面及使用的动态、静态测试技术.并从测试的几个关键方面,如链接测试、组件黑盒测试、组件白盒测试、WS及WSC测试及性能测试等方面综述当前研究热点难点,包括面向对象的建模、统计建模、控制流测试、数据流测试、数据组合测试、WS测试、WS组测试、WSC测试、协议测试、性能测试的负载模型与用户会话数据集的优化等问题.指出了有关研究的局限性.从模型驱动测试、基于Agent测试、WS及SOA测试、性能测试等方面探讨了Web应用测试未来的研究方向. 展开更多
关键词 web应用测试 超级链接测试 组件测试 WS及WSC测试 性能测试 进展
下载PDF
关于中国Web的大小、形状和结构 被引量:17
4
作者 闫宏飞 李晓明 《计算机研究与发展》 EI CSCD 北大核心 2002年第8期958-967,共10页
基于天网搜索引擎连续 4次的大规模搜集记录 ,揭示了中国 2 0 0 2年初中国 Web的大小、形状和结构 .主要结论包括有 :1中国大约有 5 0 0 0万网页和 5万个 Web站点 ;2全国不到 1/ 3的省市拥有 2 / 3强数目的网站 ;3中国网络是高度连通的 ... 基于天网搜索引擎连续 4次的大规模搜集记录 ,揭示了中国 2 0 0 2年初中国 Web的大小、形状和结构 .主要结论包括有 :1中国大约有 5 0 0 0万网页和 5万个 Web站点 ;2全国不到 1/ 3的省市拥有 2 / 3强数目的网站 ;3中国网络是高度连通的 ,Web直径是 17;4网页入度分布很好地符合幂级数定律 ;5有确凿证据显示 。 展开更多
关键词 web 网站 网页 互连结构 搜索引擎 INTERNET
下载PDF
Web搜索中的数据挖掘技术研究 被引量:4
5
作者 耿桦 李媛 +1 位作者 朱炜 潘金贵 《计算机科学》 CSCD 北大核心 2005年第4期37-41,共5页
WWW已经成为世界上是大的分布式信息系统,如何快速有效地搜索用户所需的资源一直是研究热点。Web挖掘也已经成为数据挖掘中相对成熟的一个分支。本文针对Web资源搜索中利用的相关Web挖掘技术做一个综述。文章首先对目前流行的Web内容挖... WWW已经成为世界上是大的分布式信息系统,如何快速有效地搜索用户所需的资源一直是研究热点。Web挖掘也已经成为数据挖掘中相对成熟的一个分支。本文针对Web资源搜索中利用的相关Web挖掘技术做一个综述。文章首先对目前流行的Web内容挖掘方面的常用技术进行了研究分析,然后着重研究了Web结构挖掘技术,介绍并评价了多种算法模型。接着介绍了用户使用的挖掘,并提出了Web内容挖掘技术,结构挖掘技术和用户使用挖掘相结合,应用于开发智能型搜索引擎的趋势。 展开更多
关键词 数据挖掘技术 web搜索 分布式信息系统 web挖掘技术 web内容挖掘 web结构 研究热点 资源搜索 研究分析 算法模型 搜索引擎 WWW 用户 智能型
下载PDF
Web结构挖掘 被引量:20
6
作者 杨炳儒 李岩 +1 位作者 陈新中 王霞 《计算机工程》 CAS CSCD 北大核心 2003年第20期28-30,共3页
概述了Web结构挖掘的有关概念和相关应用,详细分析和比较了基于超链接结构分析的网页排序的最权威算法,提出了有关Web结构挖掘技术的几个新的研究方向,供感兴趣的同行参考。
关键词 web结构挖掘 PAGERANK HITS SALSA 超链接 网页排序
下载PDF
一种无词典的从Web新闻页面抽取主题的算法 被引量:2
7
作者 蔡巍 王永成 尹中航 《情报学报》 CSSCI 北大核心 2008年第1期12-17,共6页
主题抽取是自然语言处理研究的重要问题之一。目前流行的方法是“词典+匹配”,但该方法用于处理动态变化的网页信息时,词典难于及时更新等弊病就表现出来。本文作者在研究中文新闻网页内容、结构特点的基础上,提出了一种利用Web页... 主题抽取是自然语言处理研究的重要问题之一。目前流行的方法是“词典+匹配”,但该方法用于处理动态变化的网页信息时,词典难于及时更新等弊病就表现出来。本文作者在研究中文新闻网页内容、结构特点的基础上,提出了一种利用Web页面结构无需词典的主题抽取算法。我们使用该方法对新华网财经新闻语料1000篇进行主题抽取实验,并与手工抽取的主题进行比较,结果表明,重合率高达93%以上。 展开更多
关键词 主题提取 web页面 超链接
下载PDF
Web站点的超链结构挖掘 被引量:15
8
作者 阳小华 《计算机工程与应用》 CSCD 北大核心 2001年第8期64-65,共2页
WWW是一个由成千上万个分布在世界各地的Web站点组成的全球信息系统,每个Web站点又是一个由许多Web页构成的信息(子)系统。由于一个文档作者可以通过超链把自己的文档与任意一个已知的Web页链接起来,而一个 Web... WWW是一个由成千上万个分布在世界各地的Web站点组成的全球信息系统,每个Web站点又是一个由许多Web页构成的信息(子)系统。由于一个文档作者可以通过超链把自己的文档与任意一个已知的Web页链接起来,而一个 Web站点上的信息资源又通常是由许多人共同提供的, 因此 Web站点内的超链链接通常是五花八门、各种各样的,它们可以有各种含义和用途。文章分析了WWW系统中超链的使用特征和规律,提出了一个划分超链类型、挖掘站点结构的方法,初步探讨了它在信息收集和查询等方面的应用。 展开更多
关键词 web站点 超链结构 数据挖掘 WWW 主页
下载PDF
基于Hyperlink聚类的网页分类研究 被引量:1
9
作者 叶卫国 卢正鼎 王天江 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第12期5-6,31,共3页
研究并提出了基于Hyperlink聚类的分类算法 ,它不需要分析Web文档内容 ,只根据Web图来聚类 .算法性能比传统文本分类方法有很大提高 ,大大增强了网页分类的能力和效率 ,适合于海量网页分类 .实验表明基于Hyperlink聚类的分类算法 ,应用... 研究并提出了基于Hyperlink聚类的分类算法 ,它不需要分析Web文档内容 ,只根据Web图来聚类 .算法性能比传统文本分类方法有很大提高 ,大大增强了网页分类的能力和效率 ,适合于海量网页分类 .实验表明基于Hyperlink聚类的分类算法 ,应用于Web文档信息分类 ,比传统的文本分类方法更加有效 . 展开更多
关键词 网页分类 超链接 聚类 中心点
下载PDF
基于页面链接挖掘的Web教育信息检索 被引量:4
10
作者 王成云 王乐乐 《情报科学》 CSSCI 北大核心 2004年第4期475-477,487,共4页
教育信息检索是教育信息应用于教育科研与教育教学的关键环节 ,而 Web页面链接挖掘是对 Web页面之间的链接结构进行挖掘。本文对 Web链接结构挖掘在教育信息检索方面上进行了研究 ,介绍了 Web挖掘的概念、分类 ,以及 HITS与 Page- rank... 教育信息检索是教育信息应用于教育科研与教育教学的关键环节 ,而 Web页面链接挖掘是对 Web页面之间的链接结构进行挖掘。本文对 Web链接结构挖掘在教育信息检索方面上进行了研究 ,介绍了 Web挖掘的概念、分类 ,以及 HITS与 Page- rank等算法 ,并提出了一种基于样本模式特征提取的信息检索方法。 展开更多
关键词 教育信息 网络信息检索 页面链接 数据挖掘 web结构挖掘 HITS Page-rank 算法
下载PDF
HTTP多路超链接在Web Servers中的应用 被引量:1
11
作者 周刚 朱晴波 +1 位作者 陈道蓄 谢立 《计算机工程》 CAS CSCD 北大核心 2001年第8期40-42,共3页
频繁的WWW访问要求有有效的Web Servers组织方式。针对HTTP超链接不能进行负载平衡的缺点,提出了HTTP多路超链接,并用HTTP超链接对HTTP多路超链接进行了模拟。最后将HTTP多路超链接引入Web S... 频繁的WWW访问要求有有效的Web Servers组织方式。针对HTTP超链接不能进行负载平衡的缺点,提出了HTTP多路超链接,并用HTTP超链接对HTTP多路超链接进行了模拟。最后将HTTP多路超链接引入Web Servers设计。 展开更多
关键词 HTTP 超链接 webServers 服务器 浏览器 WWW
下载PDF
WEB超链分析及应用 被引量:4
12
作者 向桂林 《大学图书馆学报》 CSSCI 北大核心 2002年第2期48-51,共4页
文章分析了传统的基于文本处理的信息检索算法在处理WEB页面时遇到的问题,指出在处理WEB页面时,应分析页面中超链的意义,给出了超链分析在网络爬行和检索结果排序两个方面的应用及相应的算法。
关键词 web页面 超链分析 信息检索 检索结果排序 网络爬行 田比连图算法
下载PDF
最大流算法发现Web社团的改进 被引量:1
13
作者 何拥军 龚发根 《计算机工程与应用》 CSCD 北大核心 2007年第13期170-173,共4页
提出了一种更好的分配边容量的方法,即不是给每条边分配一个相同的常量值,而是为不同的边依据信息的重要度来动态分配不同的边值,较好地解决最大流算法发现Web社团中的主题漂移问题。
关键词 web社团 超链接 最大流
下载PDF
PH-MaxFlow算法发现Web社区 被引量:1
14
作者 郭希娟 刘静 《计算机工程与应用》 CSCD 北大核心 2009年第5期113-116,共4页
HITS是一种经典的利用链接技术计算网页权威值和中心值的算法,它能够快速发现主题相关网页,其缺点是会发生"主题偏移"现象,首先提出PHITS算法,在一定程度上抑制了这种现象的发生。运用该方法提取权威值高的页面,作为PH-MaxFlo... HITS是一种经典的利用链接技术计算网页权威值和中心值的算法,它能够快速发现主题相关网页,其缺点是会发生"主题偏移"现象,首先提出PHITS算法,在一定程度上抑制了这种现象的发生。运用该方法提取权威值高的页面,作为PH-MaxFlow算法的种子节点,使得发现的Web社区更精确。同时提出了一种有效的评价Web社区的标准,用这个标准对原始最大流算法和提出的PH-MaxFlow算法进行比较,从而得出PH-MaxFlow算法发现的Web社区与主题更相关。 展开更多
关键词 web社区 基于超链接分析的主题搜索算法 最大流算法
下载PDF
Inherit/Feedback:一种新的Web主题挖掘方法 被引量:4
15
作者 杨沛 郑启伦 彭宏 《计算机研究与发展》 EI CSCD 北大核心 2004年第5期807-811,共5页
经典链接分析方法 (如PageRank和HITS)更多地关注的是网页的权威度 ,而不是其主题相关度 ,所以在引导主题搜索的过程中 ,很快就发生主题漂移 为此 ,在构建主题关联拓扑模型的基础上 ,提出了Inherit/Feedback方法 ,以用于Web主题挖掘 ... 经典链接分析方法 (如PageRank和HITS)更多地关注的是网页的权威度 ,而不是其主题相关度 ,所以在引导主题搜索的过程中 ,很快就发生主题漂移 为此 ,在构建主题关联拓扑模型的基础上 ,提出了Inherit/Feedback方法 ,以用于Web主题挖掘 基本思想是 :在搜索路径上 ,一个结点继承其父辈结点的主题相关度 ,并且将其主题相关度反馈给父辈结点 同时 ,提出了基于Inherit/Feedback的主题搜索算法 (IFC) 实验结果表明 ,这种方法能有效地引导主题搜索 。 展开更多
关键词 链接分析 主题搜索 web挖掘
下载PDF
Web结构挖掘及HITS算法分析 被引量:8
16
作者 黄英铭 《计算机与现代化》 2007年第7期23-25,37,共4页
在介绍Web结构的基础上,研究了基于Web超链接的HITS算法,分析该算法存在的若干问题并提出了两种改进的算法。
关键词 web结构挖掘 超链接 HITS算法
下载PDF
基于频繁链接的Web权威资源挖掘 被引量:6
17
作者 楼宇波 马坚 +2 位作者 周皓峰 袁晴晴 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2003年第7期1095-1103,共9页
如何有效地利用Web这个巨大的信息库 ?传统的基于关键字的搜索引擎取得了一定的成绩 ,但是存在着查准率不高的问题 Web页面间链接结构事实上隐含地表达着权威的信息 ,这已被许多研究者用来试图改善Web信息检索(包括搜索引擎 )的性能 ,... 如何有效地利用Web这个巨大的信息库 ?传统的基于关键字的搜索引擎取得了一定的成绩 ,但是存在着查准率不高的问题 Web页面间链接结构事实上隐含地表达着权威的信息 ,这已被许多研究者用来试图改善Web信息检索(包括搜索引擎 )的性能 ,取得了较好的效果 ,但依然存在很大的改善空间 为此 ,提出了FARMING(基于频繁度的Web图的权威资源挖掘 )算法 诠释了新的权威页面定义 ,提出了带阶的频繁子图和权威社团等概念 。 展开更多
关键词 信息检索 频繁子图 权威页面 权威社团 web挖掘
下载PDF
主题精选算法中Web邻域图的构造
18
作者 许卓明 曹潇 +1 位作者 韩亚洪 董逸生 《计算机应用研究》 CSCD 北大核心 2004年第1期73-76,共4页
给出了为主题精选算法(如HITS)构造Web邻域图的方法和实用系统。该系统基于Web搜索引擎(AltaVista),使用额外的Visual C++软件模块构造一个查询特定的邻域图,并将图节点和边信息存储于数据库中以供超链分析使用。Web环境的实验表明该邻... 给出了为主题精选算法(如HITS)构造Web邻域图的方法和实用系统。该系统基于Web搜索引擎(AltaVista),使用额外的Visual C++软件模块构造一个查询特定的邻域图,并将图节点和边信息存储于数据库中以供超链分析使用。Web环境的实验表明该邻域图构造方法是可行的,邻域图构造系统是可靠的。 展开更多
关键词 web信息检索 搜索引擎 超链分析 HITS web邻域图
下载PDF
PageCluster:一种Web页面层次聚类方法
19
作者 吴萍 宋瀚涛 姜峰 《计算机工程与应用》 CSCD 北大核心 2004年第29期84-86,共3页
提出了Web页面聚类算法PageCluster及相应的改进算法ImPageCluster。该方法在兼顾Web站点结构和页面链接的同时,基于各个页面的重要程度对各个超链接进行赋权。与传统聚类算法相比,该算法不需要事先给定相似度阈值。实验结果证实了该算... 提出了Web页面聚类算法PageCluster及相应的改进算法ImPageCluster。该方法在兼顾Web站点结构和页面链接的同时,基于各个页面的重要程度对各个超链接进行赋权。与传统聚类算法相比,该算法不需要事先给定相似度阈值。实验结果证实了该算法的可行性和高效性。 展开更多
关键词 聚类 web页面 超链接 相似矩阵 PageCluster ImPageCluster
下载PDF
基于Web链接的学术核心网站评选方法研究
20
作者 秦丽 许旭 《现代情报》 北大核心 2006年第10期176-178,共3页
网络环境下,确定核心网站在图书情报机构进行网络信息导航、个性化服务及信息推送等方面具有重要的应用价值。本文系统研究了各种基于Web链接的核心网站评选方法,同时对各种方法的优劣进行了分析,以此探讨核心网站评选的新方法。
关键词 核心网站 评选 web链接
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部