非合约对地观测数据源的动态汇聚

Dynamic aggregation of non-contractual earth observation data-sources

下载PDF

导出

摘要互联网上存在大量的免费、公开、有价值的非合约形式的对地观测数据源,这些数据源具有网页查询入口、海量数据隐藏在后台的大型数据库且数据共享平台多样、不同种类空间数据平台难以互联等特点,难以利用传统技术实现数据汇聚和共享。在阐述目前遇到的问题后,提出了一种基于暗网爬虫架构的非合约异构分布式数据源被动汇聚架构;设计出一套数据源识别标准、非合约式数据源发现机制、非合约式数据源搜索条件树构建模式、非合约式数据源索引机制以及数据源异步更新规则,成功汇聚了分布在国际上不同网络域的五个大型对地观测数据源,包括NASA、USGS、ASAR等三个国际上使用较为广泛的运行性数据源;形成了对地观测数据资源自动化汇聚和更新工具集,最终使用户可以通过统一查询界面获取非合约对地观测数据资源信息。 It is difficult to use the traditional technology to realize data aggregation and data sharing for the Internet, which contains a large number of free, open and valuable non-contractual earth obser- vation data sources. These data sources have the characteristics of webpage query entrance, massive data hidden in the network background database, data sharing platform diversity and different kinds of spatial data platform to interconnect etc. Considering these problems, a non-contractual heterogeneous distribu ted data sources passive aggregation architecture is proposed, which is based on deep web crawler tech- nology. Meanwhile, we design a data source identification standard, non-contractual data source discov- ery mechanism, non-contractual data source search tree building mode, non-contractual data source inde- xing mechanism and data source asynchronous update rules. Using this mechanism, we archive 5 data sources of large data sharing system including NASA, USGS, ASAR, these three widely used data re- sources and form earth observation data resouree automatic aggregation and update tool sets. Eventual- ly, through a unified query interface, users can obtain non-contractual earth observation data resouree information.

作者黄克颖高玥李国庆

机构地区中国科学院遥感与数字地球研究所中国科学院大学中国科学院计算机网络信息中心

出处《计算机工程与科学》 CSCD 北大核心 2013年第11期68-75,共8页 Computer Engineering & Science

基金国家863计划资助项目(2012AA12A301)

关键词对地观测数据搜索非合约式数据源暗网爬虫增量爬虫 earth observation data search non-contractual data sources deep web crawler incremental crawler

分类号 TP274 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献8

1孙九林,李爽.地球科学数据共享与数据网格技术[J].地球科学（中国地质大学学报）,2002,27(5):539-543. 被引量：41
2曾澜.欧洲卫星遥感基础设施发展现状及对我们的启示[J].国土资源信息化,2003(5):42-45. 被引量：4
3冯明远,林怀忠.基于最优查询的多领域deep Web爬虫[J].计算机应用研究,2009,26(9):3375-3377. 被引量：3
4张亮,陆余良,刘金红.Deep Web入口探测与分类方法研究[J].计算机应用研究,2009,26(12):4697-4700. 被引量：2
5曾伟辉,李淼.基于JavaScript切片的AJAX框架网络爬虫技术研究[J].计算机系统应用,2009,18(7):169-171. 被引量：10
6卓林,杨舟,岳亮,赵朋朋,崔志明.Deep Web爬虫的一种增量式更新策略[J].苏州大学学报（工科版）,2011,31(4):6-10. 被引量：1
7冯春,郭伟,龙小祥,邵俊.我国遥感数据共享探讨[J].中国科技资源导刊,2010,42(3):66-72. 被引量：6
8李哲,陈鹏,李涛.深度搜索中下一页链接获取策略的研究[J].微计算机信息,2007,23(33):183-184. 被引量：2

二级参考文献69

1杨海东,叶小岭,张颖超.基于Hash算法实现搜索引擎中重复WEB页面的消除[J].微计算机信息,2006,22(09X):299-301. 被引量：6
2关于进一步做好我国地球科学、资源与环境科学研究基础资料与数据共享的建议[J].地球科学进展,1996,11(1):122-123. 被引量：3
3赵朋朋,高岭,崔志明.基于查询接口特征的Deep Web数据源自动分类[J].微电子学与计算机,2006,23(10):47-50. 被引量：11
4Jesse James Garrett. Ajax: A New Approach to Web Applications.http://www.adaptivepath.com/ideas/essay s/archives/000385.php2005.
5Alvarez M, Pan A, Raposo J, Vina A. Client-Side Deep Web Data Extraction ext ended paper, http://www.tic. udc.es/-mad/publications/csdeepweb_extended.pdf.
6Steindl C. Program slicing for object-oriented programmming languages [PhD Thesis]. Johannes Kepler University Linz. 1999.
7Weiser M. Program slicing. IEEE Transactions on Software Engineering, July1984.
8Ottenstein K J, Ottenstei LM. The program dependence graph in a softwaredevelopment environment. Proceedings of the ACM SIGSOFT/SIGP LAN software Engineering Sysposium on Practical Software Development Environments, ACM SIGPLAN Notices. 1984,19(5).
9CHANG K C C, HE B, LI C, et al. Structured databases on the Web: observations and implications[ C]//Proc of 2008 ACM SIGMOD International Conference on Management of Data. 2004:61-70.
10CHANG K C C, HE B, ZHANG Z. Toward large-scale integration: building a metaquerier over databases on the Web [ C ]//Proc of the 2nd Conference on Innovative Data Systems Research. Asilomar: [ s. n. ], 2005: 44-55.

共引文献59

1王淑强,王卷乐,李扬,王晶,王玉洁,李海英.基于文献计量学的国际地球科学数据管理研究进展[J].全球变化数据学报（中英文）,2020,4(3):299-313. 被引量：1
2屈宝强,彭洁,刘蔚,普丽娜.科学数据共享及其发展趋势[J].情报学进展,2020(1):381-420. 被引量：10
3王喜,杨华,范况生.城市网格化管理系统的关键技术及示范应用研究[J].测绘科学,2006,31(4):117-119. 被引量：41
4孙庆辉,骆剑承,李宏伟,赵军喜.网格GIS及其关键技术[J].测绘学院学报,2004,21(3):200-204. 被引量：9
5李德仁,崔巍.空间信息语义网格[J].武汉大学学报（信息科学版）,2004,29(10):847-851. 被引量：23
6张延松,薛永生,张宇,韩绍兵.电子政务建设中的基础数据库建设规划研究[J].厦门大学学报（自然科学版）,2004,43(B08):293-299. 被引量：14
7张书亮,陶陶,闾国年.地理信息共享与互操作框架研究[J].测绘科学,2004,29(6):58-61. 被引量：17
8刘劲松,陈辉,高吉喜.环境背景数据的分类编码与应用[J].地球信息科学,2004,6(4):56-61. 被引量：2
9刘劲松,陈辉,高吉喜.环境背景数据分类编码研究[J].河北师范大学学报（自然科学版）,2005,29(2):199-203. 被引量：2
10胡引翠.网格计算技术的应用及其发展趋势[J].测绘通报,2005(3):23-26. 被引量：12

1许美,田世全,陈钊.基于林产品贸易Web信息增量爬虫的研究[J].农业网络信息,2016(2):18-21.
2张孟资,陶安.无线传感器网络动态汇聚节点调度算法研究[J].军械工程学院学报,2014,26(1):59-63.
3罗勇.畅游3G，网络流量心知肚明[J].软件指南,2010(2):56-56.
4张浩然,陈辉金.高校机房预约管理系统设计[J].科技信息,2014,0(12):16-17.
5梅炳夫.基于ASP的通用网页查询函数的设计[J].现代计算机,2008,14(9):131-132. 被引量：2
6苏楠,吴冰,徐伟,苏光大.人脸识别综合技术的发展[J].信息安全研究,2016,2(1):33-39. 被引量：43
7最新国际生物识别标准公布[J].A&S（安全&自动化）,2006(7):30-30.
8我国将成立生物特征识别标准工作组[J].金融电子化,2010(2):108-108.
9杨颂,欧阳柳波.基于Heritrix的面向电子商务网站增量爬虫研究[J].软件导刊,2010,9(7):38-39. 被引量：6
10范军涛,李国庆.实用的机群监控系统[J].计算机工程与设计,2008,29(1):190-192. 被引量：2

计算机工程与科学

2013年第11期

浏览历史

内容加载中请稍等...

非合约对地观测数据源的动态汇聚

参考文献8

二级参考文献69

共引文献59

相关作者

相关机构

相关主题

浏览历史