期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于MapReduce虚拟机的Deep Web数据源发现方法
被引量:
3
1
作者
辛洁
崔志明
+2 位作者
赵朋朋
张广铭
鲜学丰
《通信学报》
EI
CSCD
北大核心
2011年第7期189-195,共7页
为了提高Deep Web爬虫发现和搜集数据源的效率,提出了一种融合MapReduce和虚拟化技术实现DeepWeb海量数据挖掘的并行计算方法。基于MapReduce架构提出了一个Deep Web爬虫模型,通过链接过滤分类、页面过滤分类、表单过滤分类等3个MapRed...
为了提高Deep Web爬虫发现和搜集数据源的效率,提出了一种融合MapReduce和虚拟化技术实现DeepWeb海量数据挖掘的并行计算方法。基于MapReduce架构提出了一个Deep Web爬虫模型,通过链接过滤分类、页面过滤分类、表单过滤分类等3个MapReduce过程找到Deep Web数据源接口,并利用虚拟机构建单机集群进行性能测试。实验结果显示该方法可以实现大规模数据的并行处理,有效提高爬虫数据源发现的效率,避免网络及物理资源的浪费,验证了云计算技术在Deep Web数据挖掘方面的可行性。
展开更多
关键词
数据源发现
MAPREDUCE
DEEP
Web
虚拟化技术
云计算
下载PDF
职称材料
基于搜索引擎的Deep Web数据源发现
被引量:
1
2
作者
王海龙
胡景芝
+1 位作者
赵朋朋
崔志明
《计算机工程》
CAS
CSCD
北大核心
2011年第5期77-79,82,共4页
提出一种利用搜索引擎发现数据源的方法。为向搜索引擎提交高质量的关键词,将本体作为等级化组织词汇的架构引入到初始词构建过程。对所有词汇按在当前领域中出现频率高低进行分类,并根据搜索引擎返回接口集元素数量进行二次分类,确保...
提出一种利用搜索引擎发现数据源的方法。为向搜索引擎提交高质量的关键词,将本体作为等级化组织词汇的架构引入到初始词构建过程。对所有词汇按在当前领域中出现频率高低进行分类,并根据搜索引擎返回接口集元素数量进行二次分类,确保关键词是对发现数据源查询接口贡献较大的词汇。在不同领域上的测试结果表明,该方法能发现相当数量的查询接口,从而验证其有效性。
展开更多
关键词
数据源发现
深层网
本体
下载PDF
职称材料
省市县基础地理信息联动更新关键技术研究
3
作者
陈路
《地理空间信息》
2024年第10期113-116,共4页
针对传统基础测绘要素数据生产存在重复投入、自动化程度较低、生产周期长、人工工作量大等问题,研究提出了省市县联动更新机制、技术路径及多源数据变化发现方法,并基于“天地图”平台,构建了信息共享平台和数据库。实例表明,该方法能...
针对传统基础测绘要素数据生产存在重复投入、自动化程度较低、生产周期长、人工工作量大等问题,研究提出了省市县联动更新机制、技术路径及多源数据变化发现方法,并基于“天地图”平台,构建了信息共享平台和数据库。实例表明,该方法能够解决传统基础测绘DLG数据更新周期长、相同区域不同比例尺数据重复采集等问题,实现了基础地理信息资源整合、挖掘和更新的目标。
展开更多
关键词
框架地理实体
数据
库
联动更新方法
多
源
数据
变化
发现
下载PDF
职称材料
题名
基于MapReduce虚拟机的Deep Web数据源发现方法
被引量:
3
1
作者
辛洁
崔志明
赵朋朋
张广铭
鲜学丰
机构
苏州大学智能信息处理及应用研究所
出处
《通信学报》
EI
CSCD
北大核心
2011年第7期189-195,共7页
基金
国家自然科学基金资助项目(60970015
61003054)
+4 种基金
江苏省企业博士创新项目(BK2009563)
江苏省高校自然科学研究项目(10KJB520018)
苏州市科技型企业技术创新资金专项(SG201043)
江苏省2010年度普通高校研究生科研创新计划基金资助项目(CX10B_041Z)
江苏省普通高等学校科研成果产业化推进基金资助项目(JH09-46)~~
文摘
为了提高Deep Web爬虫发现和搜集数据源的效率,提出了一种融合MapReduce和虚拟化技术实现DeepWeb海量数据挖掘的并行计算方法。基于MapReduce架构提出了一个Deep Web爬虫模型,通过链接过滤分类、页面过滤分类、表单过滤分类等3个MapReduce过程找到Deep Web数据源接口,并利用虚拟机构建单机集群进行性能测试。实验结果显示该方法可以实现大规模数据的并行处理,有效提高爬虫数据源发现的效率,避免网络及物理资源的浪费,验证了云计算技术在Deep Web数据挖掘方面的可行性。
关键词
数据源发现
MAPREDUCE
DEEP
Web
虚拟化技术
云计算
Keywords
data source discovery
MapReduce
Deep Web
virtualization technology
cloudy computing
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于搜索引擎的Deep Web数据源发现
被引量:
1
2
作者
王海龙
胡景芝
赵朋朋
崔志明
机构
苏州大学智能信息处理及应用研究所
苏州大学材料与化学化工学部
江苏省现代企业信息化应用支撑软件工程技术研发中心
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第5期77-79,82,共4页
基金
国家自然科学基金资助项目(60970015)
2008年江苏省重大科技支撑与自主创新计划基金资助项目(BE2008044)
文摘
提出一种利用搜索引擎发现数据源的方法。为向搜索引擎提交高质量的关键词,将本体作为等级化组织词汇的架构引入到初始词构建过程。对所有词汇按在当前领域中出现频率高低进行分类,并根据搜索引擎返回接口集元素数量进行二次分类,确保关键词是对发现数据源查询接口贡献较大的词汇。在不同领域上的测试结果表明,该方法能发现相当数量的查询接口,从而验证其有效性。
关键词
数据源发现
深层网
本体
Keywords
data source discovery
Deep Web
ontology
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
省市县基础地理信息联动更新关键技术研究
3
作者
陈路
机构
江苏省测绘工程院
出处
《地理空间信息》
2024年第10期113-116,共4页
文摘
针对传统基础测绘要素数据生产存在重复投入、自动化程度较低、生产周期长、人工工作量大等问题,研究提出了省市县联动更新机制、技术路径及多源数据变化发现方法,并基于“天地图”平台,构建了信息共享平台和数据库。实例表明,该方法能够解决传统基础测绘DLG数据更新周期长、相同区域不同比例尺数据重复采集等问题,实现了基础地理信息资源整合、挖掘和更新的目标。
关键词
框架地理实体
数据
库
联动更新方法
多
源
数据
变化
发现
Keywords
framework geographical entity database
linkage update method
multi-source data change discover
分类号
P208 [天文地球—地图制图学与地理信息工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于MapReduce虚拟机的Deep Web数据源发现方法
辛洁
崔志明
赵朋朋
张广铭
鲜学丰
《通信学报》
EI
CSCD
北大核心
2011
3
下载PDF
职称材料
2
基于搜索引擎的Deep Web数据源发现
王海龙
胡景芝
赵朋朋
崔志明
《计算机工程》
CAS
CSCD
北大核心
2011
1
下载PDF
职称材料
3
省市县基础地理信息联动更新关键技术研究
陈路
《地理空间信息》
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部