-
题名在WEB数据采集中对正则表达式优化的研究
- 1
-
-
作者
殷小虹
顾冬娟
徐赛华
-
机构
南昌工学院信息学院
-
出处
《青年与社会》
2013年第12期277-277,共1页
-
文摘
正则表达式是数据验证技术中功能十分强大的输入控制技术,将这种技术应用于WEB数据采集能够大大提高数据采集的准确性和效率。文章通过对正则表达式NFA和DFA引擎运行过程的研究,使用优化后的正则表达式作为数据检索引擎来进行web数据采集。以期提高在多种数据结构中正则表达式的检索速度。
-
关键词
正则表达式
web数据采集
NFA
DAF
-
分类号
TP274.2
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名信牌驱动式Web数据采集模型的应用
被引量:4
- 2
-
-
作者
周朝挥
蔡燕霞
鲁国瑞
-
机构
中国科学院国家空间科学中心
中国科学院大学计算机与控制学院
-
出处
《计算机应用》
CSCD
北大核心
2016年第A01期252-256,共5页
-
基金
装备技术基础项目(ZKKZX20141ZL01)
中科院高技术局项目(YYYJ-1110-01)
-
文摘
针对数据源复杂、实时性强、准确性高和数据类型多样的Web空间环境数据采集任务,提出了一个基于Petri网的信牌驱动式Web数据采集模型。首先,通过引入Petri网的基本要素作为模型的理论基础,研究适合于Web数据采集的建模方法;在此基础上,针对模型的具体应用验证,研究了空间环境数据采集任务服务系统(SEDGSS)的架构设计,对数据源配置子系统、任务控制子系统和任务处理子系统进行具体的实现。实验结果表明,该模型实现了自动化机制和回溯校验机制,并具有良好的易配置性、可重用性和扩展灵活性;该系统7×24小时实时抓取254个复杂的数据源任务,目前正承担着自动化、业务化的空间环境数据采集任务以服务于我国空间环境预报。
-
关键词
空间环境数据
PETRI网
信牌驱动式
web数据采集模型
空间环境预报
-
Keywords
space environment data
Petri net
XINPAI-driven
web data scraping model
space environment forecast
-
分类号
TP274.2
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于嵌入式Web服务器的远程实时数据采集
被引量:15
- 3
-
-
作者
韩树人
周贤娟
鄢化彪
刘生华
-
机构
江西理工大学机电工程学院
-
出处
《计算机技术与发展》
2008年第1期206-208,共3页
-
基金
教育部科学技术研究重点项目(206077)
江西省教育厅基金项目(2006191)
-
文摘
对系统进行网络化监控是嵌入式系统的重要研究发展方向之一。介绍了CGI和Java Applet技术的工作原理,及将CGI和Java Applet技术结合的方法,重点介绍了Applet嵌入代码及如何将Applet采集代码加载到HTML网页中及嵌入式Web服务器上,并通过浏览器远程访问嵌入式Web采集实时数据,解决了因距离影响对监测区数据的获取问题,实现真正意义上的网络化监测。
-
关键词
嵌入式web实时采集数据
JAVA
APPLET
-
Keywords
embedded web
real-time data collection
Java Applet
-
分类号
TP212
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于Web内容采集技术的天气预报系统设计与实现
被引量:2
- 4
-
-
作者
林宏
黔枫
-
机构
毕节学院信息化管理中心
-
出处
《毕节学院学报(综合版)》
2008年第4期109-114,共6页
-
基金
国家星火计划项目。项目编号:2006EA820003
-
文摘
采用主动与手动相结合的采集方式等关键技术,获职权威气象部门网站的天气信息,保证了天气预报的权威性与实时性,并将天气预报信息在毕节试验区农村科技信息网上发布,能为用户提供更全面的农业科技信息服务。
-
关键词
web数据采集
天气预报
C#
VB
-
Keywords
web-based Data-Collection
Weather Forecast
C#
VB
-
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
-
-
题名结合汇文系统实现图书馆统计数据的WEB图表展现
- 5
-
-
作者
刘奇扉
-
机构
武汉科技大学图书馆
-
出处
《云南图书馆》
2012年第1期50-53,共4页
-
文摘
从汇文系统中采集图书馆读者借还数据。通过Generic Handler机制用web图表动态展现。期望对图书馆读者借还量实现实时监控,为图书馆人性化资源配置提供数据支撵,并为更多汇文数据的个性化统计与WEB图表展现提供可行性参考。
-
关键词
web2.0汇文数据采集
web
统计图表
GENERIC
Handler机制
-
分类号
G
[文化科学]
-
-
题名WEB挖掘技术研究在检验中的应用
- 6
-
-
作者
李永锐
龚汉东
颜刚华
-
机构
嘉伟计算机科技有限公司
深圳信息职业技术学院电子通信技术系
广东检验检疫技术中心
-
出处
《深圳信息职业技术学院学报》
2010年第4期89-93,共5页
-
基金
国家质检总局项目(2007IK118)
-
文摘
随着Web上的信息量剧增,大量有价值的信息隐藏于非结构化文档中,Web数据挖掘的作用愈显重要。本文从Web数据挖掘的定义与分类开始分析,介绍了Web数据挖掘的主要技术以及其在检验检疫管理中的应用实例和实现方法。
-
关键词
web数据采集
web数据挖掘
RAPEX系统
-
Keywords
web information collection
web information extraction
RAPEX
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于云服务的政府舆情监测平台架构的设计与实现
被引量:8
- 7
-
-
作者
王鹏举
薛惠锋
张永恒
李建雄
张峰
-
机构
西北工业大学自动化学院
榆林学院信息工程学院
延安市科技局
-
出处
《电子设计工程》
2015年第6期78-81,共4页
-
基金
延安市科学技术研究发展计划项目(2012ks-06)
榆林市科技计划项目(Sf13-23)
-
文摘
为了提高政府舆情监测的能力,加强对舆情的管理,解决Web2.0环境下技术进步、社会环境演化给政府管理模式重构所带来的机遇与挑战的问题,利用云服务和Web数据采集技术,提出了一个面向云服务的政府信息化管理平台。重点研究了面向云服务的政府信息化管理与舆情传播控制模式、本地化分析处理系统功能结构、舆情监测内部门户网站和互联网信息智能采集的功能模块和物理结构。应用结果表明,该方案结合云服务平台和Web的数据挖掘技术,实现政府信息化管理水平,提高舆情监测能力和解决效率。
-
关键词
云服务
政府信息化
舆情检测
web数据挖据
云采集
-
Keywords
cloud services
E-government
sentiment monitoring
web data mining
cloud collection
-
分类号
TN391
[电子电信—物理电子学]
-
-
题名桌面终端安全管理指标集中监测工具的设计与实现
- 8
-
-
作者
毛鑫
张小龙
周颖
-
机构
国网朝阳供电公司
-
出处
《电力信息与通信技术》
2018年第1期56-60,共5页
-
文摘
为了满足桌面终端安全管理工作的需要,及时消除桌面终端安全隐患,解决各类桌面终端安全管控系统信息孤岛和桌面终端安全运行指标人工监测费时费力、监测准确率低等问题,开发了一种基于Web数据采集和网络爬虫技术的指标集中监测工具。文章从该监测工具的总体架构、设计实现和关键技术出发,介绍了其实现原理和过程。应用结果表明,该监测工具可显著提高桌面终端安全管控工作的效率和质量,具有较高的应用推广价值。
-
关键词
桌面终端安全
集中监测
web数据采集
短信告警
指标监测
-
Keywords
desktop terminal security
centralized monitoring
web data acquisition
SMS alarm
index monitoring
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-
-
题名基于Heritrix的Web信息抽取
被引量:6
- 9
-
-
作者
陈俊彬
曹树金
-
机构
中山大学资讯管理系
-
出处
《图书情报工作》
CSSCI
北大核心
2009年第9期112-115,共4页
-
文摘
针对现阶段Web信息抽取技术的不足,提出一种基于Heritrix的精确抽取方法,由三个分别独立的功能模块共同完成。与一般信息抽取不同,本方法注重于在精确抽取的前提下实现通用化,做到可以根据数据库表的字段来进行最小单位的信息抽取,并且较好地解决信息采集通用性和准确性之间的矛盾。
-
关键词
HERITRIX
信息抽取
HTMLPARSER
web数据采集
-
Keywords
Heritrix information extraction HTMLparser web information acquisition
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-