-
题名基于Kettle的铁路数据接入的设计与实现
被引量:1
- 1
-
-
作者
王天举
许丹亚
尹文志
齐晨虹
-
机构
中国铁路郑州局集团有限公司信息技术所
-
出处
《无线互联科技》
2023年第8期79-82,共4页
-
基金
项目名称:中国铁路郑州局集团有限公司科技研究开发计划一般课题,项目编号:2022S2。
-
文摘
为解决实际业务中的数据接入解析处理等问题,使数据的接入、转换、解析、同步等工作更加高效便捷,文章通过对业务需求的分析和数据接入整合技术的调研,开展对开源ETL工具Kettle的研究。基于对Kettle应用场景和业务数据特点的分析,构建了基于Kettle的业务数据转换同步流程。经实际项目案例验证,该流程与传统方法相比,基于Kettle的数据转换接入流程降低了开发的复杂度提升了工作效率,不仅解决了在实际业务系统中的数据接入转化问题,同时也为其他数据集成工作提供了更多思路。
-
关键词
接入
转换
解析
集成
流程
-
Keywords
access
transformation
analysis
integrate
technological process
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名基于大数据技术的铁路工务检测数据平台方案研究
- 2
-
-
作者
许丹亚
欧阳慎
齐晨虹
朱志
尹文志
-
机构
中国铁路郑州局集团有限公司信息技术所
-
出处
《电脑知识与技术》
2023年第13期76-78,共3页
-
基金
中国铁路郑州局集团有限公司科技研究开发计划重点课题(2022S2)。
-
文摘
当前,普速铁路故障点检测手段多样,各种检测数据的类型多样,数据量大,查询分析逻辑复杂。不同于以往基于关系型数据库的数据处理,方案基于Hadoop大数据集群,采用低代码的形式和多种数据处理工具,设计实现工务数据同步、存储、查询、共享流程,降低了数据存储成本,提高了数据查询效率。同时,有助于后续其他业务系统的海量数据开发流程优化,为铁路各项业务提供稳定、高效数据处理方案。
-
关键词
大数据
PHOENIX
DataX
铁路
HADOOP
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名医院信息数据挖掘及数据可视化
被引量:5
- 3
-
-
作者
齐晨虹
高生鹏
-
机构
兰州交通大学电子与信息工程学院
-
出处
《中国科技信息》
2014年第22期115-116,共2页
-
文摘
概述
近些年来,信息技术快速发展,现代计算机信息应用技术在医疗领域发挥了前所未有的作用,大型医院都已经建立了医院信息系统(Hospital Information System,HIS)随着HIS的广泛使用,数据库中的医院信息不断累积增加。
-
关键词
数据挖掘
数据可视化
可视化方法
信息应用
信息系统
医学数据
信息技术
关联模式
序列模式
卫生统计
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于特征选择和数据分类的乳腺癌数据的评估分析
被引量:2
- 4
-
-
作者
吴辰文
齐晨虹
高生鹏
-
机构
兰州交通大学电子与信息工程学院
-
出处
《宁夏大学学报(自然科学版)》
CAS
2018年第2期155-159,共5页
-
基金
国家自然科学基金资助项目(61163010)
甘肃省自然科学基金资助项目(1308RJZA111)
兰州市科技计划基金资助项目(2015-02-99)
-
文摘
提出以乳腺癌数据进行挖掘数据的有效分类方法.针对兰州市某医院乳腺癌数据,通过数据挖掘技术中3种不同的特征提取方法,对乳腺癌数据集的属性进行选择,特征选择后减少的属性代替原来较多的属性,再对其用贝叶斯网络、属性选择分类器、J48、逻辑回归模型、One-R 5种方法进行分类.结果表明,得到的子集再经过分类时所花费时间明显减少,利用贝叶斯网络算法进行分类的准确率和各项性能指标高于其他算法,用逻辑回归模型算法进行特征选择后准确率明显提高.
-
关键词
特征选择
数据分类
乳腺癌
贝叶斯网络
-
Keywords
feature selection
data classification
breast cancer
Bayesian network
-
分类号
TP274
[自动化与计算机技术—检测技术与自动化装置]
R737.9
[医药卫生—肿瘤]
-