期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于Deep Web的教育资源检索系统 被引量:1
1
作者 张世明 覃正 +1 位作者 徐和祥 夏德元 《计算机工程》 CAS CSCD 北大核心 2010年第3期76-78,82,共4页
针对《基础教育教学资源元数据应用规范》中资源建设标准的缺陷,提出一种基于Deep Web集成技术的教育资源跨库检索系统设计方案。该系统包含知识发现、集成查询、知识库和系统监控等模块,加入了环境变化监控构件,并在多个环节中采用自... 针对《基础教育教学资源元数据应用规范》中资源建设标准的缺陷,提出一种基于Deep Web集成技术的教育资源跨库检索系统设计方案。该系统包含知识发现、集成查询、知识库和系统监控等模块,加入了环境变化监控构件,并在多个环节中采用自动化方式。 展开更多
关键词 deep web集成技术 信息孤岛 跨库检索 知识发现
下载PDF
基于规则集的Deep Web信息检索
2
作者 杨巨峰 史广顺 +1 位作者 赵玉娟 王庆人 《计算机工程》 CAS CSCD 北大核心 2008年第13期51-53,共3页
提出一种基于规则集的新型Deep Web信息检索模型。该模型包含4个层次,主要处理环节如任务分派、信息提取、数据清洗等引入了Deep Web特有的结构规则、逻辑规则和应用规则协助工作。把该模型应用于科技文献检索、电子机票定购和工作简历... 提出一种基于规则集的新型Deep Web信息检索模型。该模型包含4个层次,主要处理环节如任务分派、信息提取、数据清洗等引入了Deep Web特有的结构规则、逻辑规则和应用规则协助工作。把该模型应用于科技文献检索、电子机票定购和工作简历搜索3个领域,实验结果证明该模型灵活、可信,有效信息查全率达到96%以上。 展开更多
关键词 信息检索 深层网络 规则集 数据提取
下载PDF
基于个性化图书馆的Deep Web Crawler研究与实现 被引量:1
3
作者 张云冬 徐和祥 +1 位作者 胡运发 邓河 《计算机应用与软件》 CSCD 2009年第4期148-149,252,共3页
为了整合复旦图书馆数字化论文资源,来为教授提供个性化推荐服务,使用sniffer监听网络信息,模拟IE的浏览行为,实现了针对Vip、ISI和Metalib三个数据源的Deep Web Crawler,并研究了通用Deep Web Crawler的系统框架和功能模块。
关键词 deepweb 模式匹配 信息抽取
下载PDF
Deep web站点查询界面的潜在语义分析(英文) 被引量:2
4
作者 茅琴娇 冯博琴 潘善亮 《Journal of Southeast University(English Edition)》 EI CAS 2008年第3期312-314,共3页
为了进一步提高搜索引擎的效率,实现对deep web中所蕴含的大量有用信息的检索、索引和定位,引入潜在语义分析理论是一种简单而有效的方法.通过对作为deep web站点入口的查询界面里的表单属性进行潜在语义分析,从表单属性中挖掘出潜在语... 为了进一步提高搜索引擎的效率,实现对deep web中所蕴含的大量有用信息的检索、索引和定位,引入潜在语义分析理论是一种简单而有效的方法.通过对作为deep web站点入口的查询界面里的表单属性进行潜在语义分析,从表单属性中挖掘出潜在语义结构,并实现一定程度上的降维.利用这种潜在语义结构,推断对应站点的数据内容并改善不同站点的相似度计算.实验结果显示,潜在语义分析修正和改善了deep web站点的表单属性的语义理解,弥补了单纯的关键字匹配带来的一些不足.该方法可以被用来实现为某一站点查找网络上相似度高的站点及通过键入表单属性给出拥有相似表单的站点列表. 展开更多
关键词 deep web 信息检索 潜在语义分析 奇异值分解
下载PDF
基于Tabu的Deep Web特征选择算法 被引量:1
5
作者 谭春亮 甘丹 +1 位作者 陈丽娜 蒋运承 《计算机工程与设计》 CSCD 北大核心 2008年第13期3358-3361,3473,共5页
Deep Web分类的小样本、高维特征的特点限制了分类算法的选择,影响分类器的设计和准确度,降低了分类器的"泛化"能力,出现分类器"过拟合",所以需要进行特征选择,降低特征的维数,避免"维数灾难"。目前,没有... Deep Web分类的小样本、高维特征的特点限制了分类算法的选择,影响分类器的设计和准确度,降低了分类器的"泛化"能力,出现分类器"过拟合",所以需要进行特征选择,降低特征的维数,避免"维数灾难"。目前,没有Deep Web特征选择自动算法的相关研究。通过对Deep Web分类的特征选择进行研究,提出了基于类别可分性判据和Tabu搜索的特征选择算法,可以在2的时间复杂度内得到次优的特征子集,减小了分类器设计的难度,提高了分类器分类准确率。根据特征选择前后的特征集,利用KNN分类算法进行Deep Web分类,结果表明提高了分类器的分类准确率,降低了分类算法的时间复杂度。 展开更多
关键词 特征选择 TABU搜索算法 深层网络 信息检索 分类算法 分类器
下载PDF
一种安全验证模式下Deep Web爬虫的研究
6
作者 徐和祥 张永忠 胡运发 《计算机应用与软件》 CSCD 2010年第5期9-11,26,共4页
Deep Web信息大约是Surface Web信息的400到500倍,这些信息对传统搜索引擎不可见。Deep Web爬虫的研究,是搜索引擎获得Deep Web信息的重要步骤,仍处于研究的早期阶段。目前对于爬虫的研究,主要成果集中在Surface Web,而很少有对Deep We... Deep Web信息大约是Surface Web信息的400到500倍,这些信息对传统搜索引擎不可见。Deep Web爬虫的研究,是搜索引擎获得Deep Web信息的重要步骤,仍处于研究的早期阶段。目前对于爬虫的研究,主要成果集中在Surface Web,而很少有对Deep Web爬虫的研究。分析Deep Web的访问模式,并在此基础上提出一种安全验证模式下Deep Web爬虫的算法。试验表明:该算法可以有效实现特定安全验证模式下的Deep Web信息的抓取。 展开更多
关键词 deep web 安全模式 爬虫 信息抽取
下载PDF
A Survey of Web Information System and Applications
7
作者 HAN Yanbo LI Juanzi +3 位作者 YANG Nan LIU Qing XU Baowen MENG Xiaofeng 《Wuhan University Journal of Natural Sciences》 CAS 2007年第5期769-772,共4页
The fourth international conference on Web information systems and applications (WISA 2007) has received 409 submissions and has accepted 37 papers for publication in this issue. The papers cover broad research area... The fourth international conference on Web information systems and applications (WISA 2007) has received 409 submissions and has accepted 37 papers for publication in this issue. The papers cover broad research areas, including Web mining and data warehouse, Deep Web and Web integration, P2P networks, text processing and information retrieval, as well as Web Services and Web infrastructure. After briefly introducing the WISA conference, the survey outlines the current activities and future trends concerning Web information systems and applications based on the papers accepted for publication. 展开更多
关键词 web mining data warehouse deep web web integration web services P2P computing text processing information retrieval web security
下载PDF
Decision-tree induction from self-mapping space based on web
8
作者 张树瑜 朱仲英 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2007年第1期134-139,共6页
An improved decision tree method for web information retrieval with self-mapping attributes is proposed.The self-mapping tree has a value of self-mapping attribute in its internal node,and information based on dissimi... An improved decision tree method for web information retrieval with self-mapping attributes is proposed.The self-mapping tree has a value of self-mapping attribute in its internal node,and information based on dissimilarity between a pair of mapping sequences.This method selects self-mapping which exists between data by exhaustive search based on relation and attribute information.Experimental results confirm that the improved method constructs comprehensive and accurate decision tree.Moreover,an example shows that the self-mapping decision tree is promising for data mining and knowledge discovery. 展开更多
关键词 电气技术 计算机 决策树 自动化
下载PDF
Invisible Web研究综述 被引量:19
9
作者 黄晓冬 《情报科学》 CSSCI 北大核心 2004年第9期1144-1148,共5页
本文对有关 Invisible Web的内容进行了全面、详细地介绍。首先论述了什么是 Invisible Web以及为什么要研究 Invisible Web,同时介绍了两个相关概念 ;其次对 Invisible Web不可见的原因加以分析 ;对 Invisible Web的类型进行了划分 ;... 本文对有关 Invisible Web的内容进行了全面、详细地介绍。首先论述了什么是 Invisible Web以及为什么要研究 Invisible Web,同时介绍了两个相关概念 ;其次对 Invisible Web不可见的原因加以分析 ;对 Invisible Web的类型进行了划分 ;介绍了 Invisible Web的检索工具 ;最后总结了 Invisible Web研究的方向。 展开更多
关键词 INVISIBLE web deep web 信息检索 搜索引擎
下载PDF
基于Web的自映射空间决策树方法研究 被引量:1
10
作者 张树瑜 朱仲英 《计算机工程与应用》 CSCD 北大核心 2005年第3期184-187,共4页
论文讨论了Web信息的自映射空间模型和决策树算法的实现。从应用角度提出一种新的决策树方法SMS-DT,并根据映射序列的不同在内节点得到唯一的映射属性值。在关系和属性信息的基础上,自映射由不同数据集选择合理的空间模型,得到有效的决... 论文讨论了Web信息的自映射空间模型和决策树算法的实现。从应用角度提出一种新的决策树方法SMS-DT,并根据映射序列的不同在内节点得到唯一的映射属性值。在关系和属性信息的基础上,自映射由不同数据集选择合理的空间模型,得到有效的决策树映射方法。实验结果进一步证实自映射决策树具有全面性与精确性。由于自映射决策树较好地软化了数量属性论域的划分边界,从而为进一步满足Web信息检索提供了一种个性化的高效信息检索工具。 展开更多
关键词 web信息 自映射空间 决策树
下载PDF
图书馆信息资源整合解决方案——INNOVATIVE公司的新产品MAP(Millennium Access Plus) 被引量:3
11
作者 闫晓弟 李娟 《现代情报》 2004年第6期101-104,共4页
介绍了美国Innovative公司的MAP解决方案的主要组成及各自的功能
关键词 MAP webBtidge MetaFind web ACCESS Management 信息资源检索
下载PDF
重视深网资源挖掘 提升信息检索技能 被引量:3
12
作者 易斌 《现代情报》 北大核心 2008年第8期69-70,74,共3页
介绍了深网的概念、形成的原因及利用的必要性,提出检索深网的信息必须从信息意识的提高、专业目录的利用、专业及常规搜索引擎的运用、Invisible Web数据库等途径入手。
关键词 深网 网络资源 信息检索 检索方法
下载PDF
美国深网实践工作研究 被引量:1
13
作者 曾伟忠 《新世纪图书馆》 2006年第2期38-39,共2页
论文介绍了深网的原理,分析了美国BrightPlanet公司和Yahoo公司在深网实践工作中所取得的成果。
关键词 深网 网络信息资源 信息检索 美国
下载PDF
深网及其有效检索策略 被引量:3
14
作者 徐莹 《农业图书情报学刊》 2006年第3期97-99,共3页
介绍深网的概念、规模以及形成的原因,对于获取深网专业信息资源的策略提出一些看法。
关键词 深网 搜索引擎 信息资源 检索工具
下载PDF
网络信息检索现状及未来 被引量:4
15
作者 易向军 《合肥学院学报(社会科学版)》 2007年第4期90-92,共3页
随着计算机技术和网络技术的发展,网络信息检索显得越发重要。在对现行的几种网络信息检索模式简要介绍的基础上提出了相关的问题,从而对网络信息检索的未来作出展望。
关键词 信息检索 网络 模式 发展趋势
下载PDF
基于电子地图的大气环境质量报告系统设计
16
作者 陈洁 刘欢 任斌 《价值工程》 2015年第7期72-73,共2页
概括地介绍了我国大气环境质量状况。通过需求分析,进行了大气环境质量报告系统的功能描述,研究了大气扩散模型,实现了基于电子地图的大气环境质量报告系统,可以满足不断变化的用户需求。
关键词 地理信息系统 基于web的电子地图 大气环境质量 空气扩散模型
下载PDF
多核学习与用户反馈结合的WMS图层检索方法 被引量:7
17
作者 李牧闲 桂志鹏 +2 位作者 成晓强 吴华意 秦昆 《测绘学报》 EI CSCD 北大核心 2019年第10期1320-1330,共11页
现有WMS检索方法多基于服务元数据文本匹配,缺乏对地图内容的“感知”,无法应对元数据缺失或图文不符的情境。本文设计了一种多特征多核学习和用户反馈结合的WMS图层检索方法,利用多核学习算法融合颜色、形状与纹理特征,实现图层分类和... 现有WMS检索方法多基于服务元数据文本匹配,缺乏对地图内容的“感知”,无法应对元数据缺失或图文不符的情境。本文设计了一种多特征多核学习和用户反馈结合的WMS图层检索方法,利用多核学习算法融合颜色、形状与纹理特征,实现图层分类和相似度排序,并通过采集检索结果展示页面中的兴趣图层标记进行用户反馈,以优化分类模型和提高检索精度。试验结果表明,该方法查准率高且检索用时较短,能够与现有基于文本检索的地理信息资源门户集成,实现WMS的快速检索与有效发现。 展开更多
关键词 地理信息资源检索 多核学习 多特征融合 用户反馈 网络地图服务
下载PDF
带模板的结构化HTML文档深度标注框架 被引量:2
18
作者 廖述梅 徐升华 陶皖 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第z1期936-941,共6页
将现有W eb提升为语义W eb的有效方法之一就是标注W eb页。当前W eb上,动态生成页面的规模有静态页面的500倍之多,标注从数据库动态生成的页面是深度标注方法之一。针对数据库生成的W eb页面具有模板和结构化的特征,在对带模板的结构化H... 将现有W eb提升为语义W eb的有效方法之一就是标注W eb页。当前W eb上,动态生成页面的规模有静态页面的500倍之多,标注从数据库动态生成的页面是深度标注方法之一。针对数据库生成的W eb页面具有模板和结构化的特征,在对带模板的结构化HTM L文档和本体形式化表示之后,提出了两段式的深度标注框架,即第一阶段解析HTM L文档,抽取结构化信息,第二阶段指定实例与词汇间的映射,标注自动生成。与其他标注方法相比,该方法能明显降低标注过程的工作量。 展开更多
关键词 语义网 深度标注 信息抽取 映射规则
原文传递
基于爬虫和深度学习的计量信息数据推送系统 被引量:2
19
作者 姜海洋 田锋 +1 位作者 智峰 杨一凡 《计量科学与技术》 2021年第9期35-39,共5页
国家计量科学数据中心开发了计量信息数据推送系统。该系统利用爬虫技术从国内外计量权威网站抓取最新计量信息数据,经AI预处理及人工审核后构建到三个维度的主题地图,再发布到网站,推送给相应主题词订阅用户。科研人员可按三个维度的... 国家计量科学数据中心开发了计量信息数据推送系统。该系统利用爬虫技术从国内外计量权威网站抓取最新计量信息数据,经AI预处理及人工审核后构建到三个维度的主题地图,再发布到网站,推送给相应主题词订阅用户。科研人员可按三个维度的主题地图或自定义主题词进行信息订阅,实时获取最新领域的计量信息数据。该系统已在国家计量科学数据中心网站上线,实际运行效果较好,验证了方案的可行性和发展潜力。 展开更多
关键词 计量信息数据 爬虫 深度学习 主题地图 大数据
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部