信牌驱动式Web数据采集模型的应用被引量：4

Applications of XINPAI-driven Web data scraping model

下载PDF

导出

摘要针对数据源复杂、实时性强、准确性高和数据类型多样的Web空间环境数据采集任务,提出了一个基于Petri网的信牌驱动式Web数据采集模型。首先,通过引入Petri网的基本要素作为模型的理论基础,研究适合于Web数据采集的建模方法;在此基础上,针对模型的具体应用验证,研究了空间环境数据采集任务服务系统(SEDGSS)的架构设计,对数据源配置子系统、任务控制子系统和任务处理子系统进行具体的实现。实验结果表明,该模型实现了自动化机制和回溯校验机制,并具有良好的易配置性、可重用性和扩展灵活性;该系统7×24小时实时抓取254个复杂的数据源任务,目前正承担着自动化、业务化的空间环境数据采集任务以服务于我国空间环境预报。 In order to scrap the space environment data which is complex,real-time,accurate and diverse,an XINPAIdriven Web scraping model based on Petri net was proposed.Firstly,by intruducing basic elements of Petri net as the theoretical foundation,a modeling method for Web data scraping was investigated.Then,to verify this model,the architecture of Space Environment Data Gather Service System（ SEDGSS） was designed.Simultaneously,data source configuring subsystem,task controlling subsystem and task processing subsystem were implemented.The experimental results show that,this model shows automated mechanism and backtracking mechanism,and possesses easy configurability,reusability and expansion flexibility.At the same time,254 complex data sources are scraped in real time and the system undertakes the automatic task of scraping space environment data for forecast.

作者周朝挥蔡燕霞鲁国瑞

机构地区中国科学院国家空间科学中心中国科学院大学计算机与控制学院

出处《计算机应用》 CSCD 北大核心 2016年第A01期252-256,共5页 journal of Computer Applications

基金装备技术基础项目(ZKKZX20141ZL01) 中科院高技术局项目(YYYJ-1110-01)

关键词空间环境数据 PETRI网信牌驱动式 Web数据采集模型空间环境预报 space environment data Petri net XINPAI-driven Web data scraping model space environment forecast

分类号 TP274.2 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献12

1叶宗海,都亨,龚建村.中国的空间环境研究与空间环境预报[J].地球物理学进展,1999,14(S1):20-29. 被引量：3
2齐鹏,李隐峰,宋玉伟.基于Python的Web数据采集技术[J].电子科技,2012,25(11):118-120. 被引量：32
3CALIFF M E, MOONEY R J. Relational learning of pattern-match rules for information extraction [ C]/! AAAI'99/IAAI'99: Proceed-ings of the Sixteenth National Conference on Artificial Intelligence. Menlo Park: American Association for Artificial Intelligence, 1999: 328 - 334.
4KUSHMERICK N. Wrapper induction: Efficiency and expressive- ness[J]. Artificial Intelligence, 2000, 118(1): 15-68.
5BAUMGARTNER R, FLESCA S, GOTI'LOB G. Visual Web infor- mation extraction with lixto[ C]//VLDB'01: Proceedings of the 27th International Conference on Very Large Data Bases. San Francisco: Morgan Kaufmann Publishers, 2001:119 - 128.
6BASAK O, ALBAYRAK Y E. Petri net based decision system mod- eling in real-time scheduling and control of flexible automotive man- ufacturing systems[ J]. Computers & Industrial Engineering, 2014, 86:116 - 126.
7DENARO G, PEZZE M. Petri nets and software engineering[ C]// Lectures on Concurrency and Petri Nets, LNCS 3098. Heidelberg: Springer Berlin, 2004:439-466.
8TOSIC M, MANIC M. A RESTful technique for collaborative learn- ing content transclusion by Wiki-style mashups[ C]//Proceedings of the 2011 5th IEEE International Conference on E-Learning in Indus- trial Electronics. Piscataway: 1EEE, 2011:38 -43.
9GLEZ-PENA D, LOUREN(O A, LOPEZ-FEMANDEZ H, et al. Web scraping technologies in an API world[ J]. Briefings in bioin- formaties, 2014, 15(5): 788-797.
10HE W. System and method for synchronized Web scraping: U.S. Patent 20140351091[ P]. 2014 - 11 -27.

二级参考文献15

1叶宗海,都亨.中国的空间环境研究[J].地球物理学报,1997,40(S1):429-441. 被引量：9
2王世金,林华安.一种新的太阳质子事件警报方法的探讨[J].空间科学学报,1993,13(3):215-223. 被引量：8
3古士芬,师立勤,臧振群.空间等离子体引起的高电压太阳阵之弧光放电[J].空间科学学报,1995,15(2):131-136. 被引量：6
4Yue Xiaoli，Proc of theInt’l Symp on Future Software Technology，1998年，339页
5Yu Lei，Proc of the ER-97Workshop on Behavioral Modeling and DesignTransformations:Issue，1997年
6赫特兰.Python基础教程[M].2版.北京:人民邮电出版社,2010.
7丘恩.Python核心编程[M].2版.北京:人民邮电出版社,2008.
8鲁特兹.Python学习手册[M].北京:机械工业出版社,2009.
9都亨,叶宗海.低轨道航天器空间环境手册[M]国防工业出版社,1996.
10《人造地球卫星环境手册》编写组.人造地球卫星环境手册[M]国防工业出版社,1971.

共引文献59

1李涛.空间原子氧环境效应模拟方法[J].航天器环境工程,2008,25(2):134-137. 被引量：4
2董云卫,楼文晓,郝克刚.业务流程管理与集成系统SynchroFLOW的软件体系结构[J].计算机科学,2004,31(6):138-140. 被引量：6
3王斌君,郝克刚.工作流过程定义中的分层结构与正则Petri网[J].计算机科学,2003,30(11):157-159. 被引量：3
4董云卫,郝克刚.一种乐观嵌套工作流事务模型[J].计算机科学,2005,32(8):90-93. 被引量：5
5董云卫,郝克刚,葛玮.“过程”新论[J].计算机科学,2005,32(10):14-15. 被引量：1
6邵秀丽,李玉福.基于Petr i网的集成系统工作流建模的研究[J].南开大学学报（自然科学版）,2005,38(6):53-59. 被引量：6
7王鹏,王宏,刘立娜.航天环境仿真数值计算模型设计[J].计算机工程,2006,32(13):228-230.
8姬艳芳,葛玮.基于工作流的分布式开发与研究[J].科学技术与工程,2006,6(19):3102-3106.
9冯卫兵,郝克刚.基于Petri网的工作流模型的分析[J].计算机工程与应用,2007,43(3):194-197. 被引量：6
10朱武,马书磊.应用工作流模型对测试管理过程建模[J].计算机工程与设计,2007,28(18):4336-4338. 被引量：4

同被引文献30

1李净,袁小华,沈晓晶.Web权威信息自动提取技术的研究及应用[J].计算机工程,2008,34(13):54-55. 被引量：3
2陈钊,张冬梅.Web信息抽取技术综述[J].计算机应用研究,2010,27(12):4401-4405. 被引量：22
3夏家莉,陈辉,杨兵.一种动态优先级实时任务调度算法[J].计算机学报,2012,35(12):2685-2695. 被引量：53
4吴统文,宋连春,刘向文,李巧萍,梁潇云,程彦杰,周巍,聂肃平,张莉,颉卫华,房永杰,张艳武,路屹雄,储敏,李江龙.国家气候中心短期气候预测模式系统业务化进展[J].应用气象学报,2013,24(5):533-543. 被引量：94
5汪宏波,熊建宁,赵长印.太阳辐射指数F_(10.7)的中期预报方法[J].天文学报,2014,55(4):302-312. 被引量：8
6韩盈党,李哲.MEMS加速度传感器的数据采集和预处理[J].仪表技术与传感器,2015(2):16-19. 被引量：24
7高梦超,胡庆宝,程耀东,周旭,李海波,杜然.基于众包的社交网络数据采集模型设计与实现[J].计算机工程,2015,41(4):36-40. 被引量：14
8邱雪松,蔺艳斐,邵苏杰,郭少勇,于军.一种面向智能电网数据采集的传感器聚合布局构造算法[J].电子与信息学报,2015,37(10):2411-2417. 被引量：14
9韩立,刘正捷,李晖,余晨晔,张军,陈媛嫄.基于情境感知的远程用户体验数据采集方法[J].计算机学报,2015,38(11):2234-2246. 被引量：23
10张玉凤,楼芳,张历.面向软件攻击面的Web应用安全评估模型研究[J].计算机工程与科学,2016,38(1):73-77. 被引量：7

引证文献4

1马莉莉,刘江平.大数据信息传输中恶意攻击数据识别仿真[J].计算机仿真,2017,34(10):375-378. 被引量：5
2朱坤帅,蔡燕霞,鲁国瑞.基于Petri网的业务化空间环境模式集成平台[J].电子设计工程,2018,26(3):50-54. 被引量：1
3邓文雯,孙成明,秦培亮.云储存海量数据的采集方法研究[J].现代电子技术,2018,41(14):10-13.
4王仕艳.云环境中Web信息抓取技术的研究及应用[J].通信电源技术,2018,35(9):175-176. 被引量：1

二级引证文献7

1王助尧.论邓小平哲学思想的核心和实质[J].探索,2000(2):4-7. 被引量：5
2金磊.基于大数据分析的DDOS检测系统的设计与实现[J].自动化与仪器仪表,2018,0(11):121-124. 被引量：5
3殷复莲,徐荣阁,刘志心,冀美琪.影视节目扁平化标签获取技术研究[J].软件导刊,2019,18(7):150-153. 被引量：1
4高菲.分布式异构网络恶意攻击取证及预警方法研究[J].计算技术与自动化,2021,40(1):184-188. 被引量：2
5李扬,李红霞,刘飞,乔新辉,李楠,黄存强.基于时空大数据的电能系统集成及应用研究[J].电子设计工程,2021,29(14):131-135. 被引量：1
6王彩霞,张志刚.关于无线网络用户需求信息快速识别仿真[J].计算机仿真,2019,36(4):392-395.
7詹柳春,黄长江,林美.基于大数据的网络恶意攻击信息识别技术研究[J].信息与电脑,2019,0(16):182-183. 被引量：1

1韦建杰.云计算环境下的数据采集模型分析[J].信息通信,2014,27(7):142-142. 被引量：2
2郑耿,刘国平.网络化控制系统中的实时数据采集[J].吉林大学学报（工学版）,2004,34(z1):314-317.
3胡迎松,宁海霞.一种新型的Web挖掘数据采集模型[J].计算机工程与科学,2007,29(2):36-39. 被引量：5
4陈新.文件档案信息管理系统的构建模型[J].信息技术与信息化,2014(8):121-122.
5殷小虹,顾冬娟,徐赛华.在WEB数据采集中对正则表达式优化的研究[J].青年与社会,2013(12):277-277.
6刁志刚.基于嵌入式无线网络数据采集模型的设计与实现[J].科技信息,2011(8):249-250. 被引量：1
7林川,王汉军,陈庚午.基于SNMP的数据采集框架[J].计算机系统应用,2016,25(5):55-59. 被引量：1
8耿亚玮,熊桂喜.一种用于数据库搜索引擎的数据采集模型[J].微计算机信息,2007,23(33):136-138. 被引量：8
9胡友民,杜润生,杨叔子.制造系统数据采集技术研究[J].制造业自动化,2002,24(3):23-27. 被引量：16
10王水,邱罡.多用户PHPWEB空间的安全策略[J].微机发展,2001,11(4):60-62.

计算机应用

2016年第A01期

浏览历史

内容加载中请稍等...

信牌驱动式Web数据采集模型的应用被引量：4

参考文献12

二级参考文献15

共引文献59

同被引文献30

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

信牌驱动式Web数据采集模型的应用 被引量：4

参考文献12

二级参考文献15

共引文献59

同被引文献30

引证文献4

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

信牌驱动式Web数据采集模型的应用被引量：4