期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于本体的自动化网页搜集器
1
作者 江河 《河北软件职业技术学院学报》 2011年第1期37-38,共2页
在网络信息时代,将有限的时间投入到查找无限的信息资源中是不可取的,如何使用户在信息大潮中搜索到有用的信息,已成为研究的重要课题。主动式网页搜索技术成为当今信息系统中重要的研究方向。基于本体的自动网页检索系统会主动提供关... 在网络信息时代,将有限的时间投入到查找无限的信息资源中是不可取的,如何使用户在信息大潮中搜索到有用的信息,已成为研究的重要课题。主动式网页搜索技术成为当今信息系统中重要的研究方向。基于本体的自动网页检索系统会主动提供关键词判断比对,进而提升网页搜集的精确度。 展开更多
关键词 本体 网页搜集 PROTÉGÉ MYECLIPSE
下载PDF
垂直搜索中网页抓取技术的研究 被引量:5
2
作者 陈哲 《科技信息》 2009年第22期I0182-I0182,共1页
网页抓取是由一个称为网络爬虫的程序实现的,该程序是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。网络爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面... 网页抓取是由一个称为网络爬虫的程序实现的,该程序是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。网络爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上提取新的URL放入队列,直到满足系统的一定停止条件。 展开更多
关键词 网络爬虫 网页搜集 网页抓取
下载PDF
Web多媒体资源搜索与相关文本提取研究 被引量:1
3
作者 于文超 刘菲 《中国科技资源导刊》 2009年第6期37-40,共4页
Web多媒体网页中多媒体资源的相关文本对于描述Web多媒体资源具有重要意义,利用Web多媒体网页搜集器搜集网络中包含多媒体资源的网页,对网页进行区域分析。根据多媒体资源所在网页中的嵌入形式,设计Web多媒体资源相关文本信息提取系统,... Web多媒体网页中多媒体资源的相关文本对于描述Web多媒体资源具有重要意义,利用Web多媒体网页搜集器搜集网络中包含多媒体资源的网页,对网页进行区域分析。根据多媒体资源所在网页中的嵌入形式,设计Web多媒体资源相关文本信息提取系统,准确提取Web页面中多媒体资源的相关文本。实验结果表明,该系统提取Web多媒体资源的相关文本准确率较高,有助于提高多媒体信息检索系统的查全率与查准率。 展开更多
关键词 网页搜集 区域识别 文本提取
下载PDF
基于搜索引擎的网络敏感信息检索系统 被引量:1
4
作者 侯建刚 姜海岚 袁峰 《信息技术与信息化》 2009年第4期15-17,20,共4页
本文详细的介绍一种基于Web搜索引擎技术的网络敏感信息检索系统的设计与实现。基于搜索引擎技术的信息检索融合了文本挖掘的思想,它以一定的策略在WEB上搜集和发现信息,在对信息进行处理和组织后,结合本行业的特点,为特殊用户提供信息... 本文详细的介绍一种基于Web搜索引擎技术的网络敏感信息检索系统的设计与实现。基于搜索引擎技术的信息检索融合了文本挖掘的思想,它以一定的策略在WEB上搜集和发现信息,在对信息进行处理和组织后,结合本行业的特点,为特殊用户提供信息检索服务。 展开更多
关键词 网页数据搜集 分词 消重 检索模型 优先度排序
下载PDF
一个增量搜集中国W eb的系统模型及其实现 被引量:7
5
作者 孟涛 闫宏飞 王继民 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2005年第S1期1882-1886,共5页
针对中国W eb的高效增量搜集,设计试验考察了网页的短期变化规律,估算出增量搜集需要的最小搜集能力。提出一个通用的增量式搜集系统模型和它的性能准则,该模型阐明了增量搜集的运行原理。针对该模型,结合北大天网增量搜集系统的开发经... 针对中国W eb的高效增量搜集,设计试验考察了网页的短期变化规律,估算出增量搜集需要的最小搜集能力。提出一个通用的增量式搜集系统模型和它的性能准则,该模型阐明了增量搜集的运行原理。针对该模型,结合北大天网增量搜集系统的开发经验,讨论了它的性能瓶颈并给出解决方案。对增量搜集的两类目标——变化网页和新网页,探讨了相应的搜集策略。介绍了该模型的实现和性能状况。该文的工作为增量搜集系统的设计和实现提供了一个成功的模型。 展开更多
关键词 增量式 网页搜集 系统模型 中国Web 实现策略
原文传递
基于知识本体的个人化网页检索系统设计
6
作者 江河 《计算机与信息技术》 2010年第10期62-63,共2页
让使用者在浩瀚的信息大潮中搜索有用的信息,已成为研究的重要课题。因而主动式网页搜索技术成为当今信息系统中不可或缺的重要部分。本论文提出一本体论支持的Java程序网页搜集器,使用者只要输入关键词,系统在领域本体论的支持下,就会... 让使用者在浩瀚的信息大潮中搜索有用的信息,已成为研究的重要课题。因而主动式网页搜索技术成为当今信息系统中不可或缺的重要部分。本论文提出一本体论支持的Java程序网页搜集器,使用者只要输入关键词,系统在领域本体论的支持下,就会主动提供关键词判断比对,进而提升网页搜集的精确度。实验结果验证了本技术确实能提升网页搜集的精准度,同时能成功下载相关网页信息。 展开更多
关键词 知识本体 网页搜集 PROTÉGÉ
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部