期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于Kettle的铁路数据接入的设计与实现 被引量:1
1
作者 王天举 许丹亚 +1 位作者 尹文志 齐晨虹 《无线互联科技》 2023年第8期79-82,共4页
为解决实际业务中的数据接入解析处理等问题,使数据的接入、转换、解析、同步等工作更加高效便捷,文章通过对业务需求的分析和数据接入整合技术的调研,开展对开源ETL工具Kettle的研究。基于对Kettle应用场景和业务数据特点的分析,构建... 为解决实际业务中的数据接入解析处理等问题,使数据的接入、转换、解析、同步等工作更加高效便捷,文章通过对业务需求的分析和数据接入整合技术的调研,开展对开源ETL工具Kettle的研究。基于对Kettle应用场景和业务数据特点的分析,构建了基于Kettle的业务数据转换同步流程。经实际项目案例验证,该流程与传统方法相比,基于Kettle的数据转换接入流程降低了开发的复杂度提升了工作效率,不仅解决了在实际业务系统中的数据接入转化问题,同时也为其他数据集成工作提供了更多思路。 展开更多
关键词 接入 转换 解析 集成 流程
下载PDF
基于大数据技术的铁路工务检测数据平台方案研究
2
作者 许丹亚 欧阳慎 +2 位作者 齐晨虹 朱志 尹文志 《电脑知识与技术》 2023年第13期76-78,共3页
当前,普速铁路故障点检测手段多样,各种检测数据的类型多样,数据量大,查询分析逻辑复杂。不同于以往基于关系型数据库的数据处理,方案基于Hadoop大数据集群,采用低代码的形式和多种数据处理工具,设计实现工务数据同步、存储、查询、共... 当前,普速铁路故障点检测手段多样,各种检测数据的类型多样,数据量大,查询分析逻辑复杂。不同于以往基于关系型数据库的数据处理,方案基于Hadoop大数据集群,采用低代码的形式和多种数据处理工具,设计实现工务数据同步、存储、查询、共享流程,降低了数据存储成本,提高了数据查询效率。同时,有助于后续其他业务系统的海量数据开发流程优化,为铁路各项业务提供稳定、高效数据处理方案。 展开更多
关键词 大数据 PHOENIX DataX 铁路 HADOOP
下载PDF
医院信息数据挖掘及数据可视化 被引量:5
3
作者 齐晨虹 高生鹏 《中国科技信息》 2014年第22期115-116,共2页
概述 近些年来,信息技术快速发展,现代计算机信息应用技术在医疗领域发挥了前所未有的作用,大型医院都已经建立了医院信息系统(Hospital Information System,HIS)随着HIS的广泛使用,数据库中的医院信息不断累积增加。
关键词 数据挖掘 数据可视化 可视化方法 信息应用 信息系统 医学数据 信息技术 关联模式 序列模式 卫生统计
下载PDF
基于特征选择和数据分类的乳腺癌数据的评估分析 被引量:2
4
作者 吴辰文 齐晨虹 高生鹏 《宁夏大学学报(自然科学版)》 CAS 2018年第2期155-159,共5页
提出以乳腺癌数据进行挖掘数据的有效分类方法.针对兰州市某医院乳腺癌数据,通过数据挖掘技术中3种不同的特征提取方法,对乳腺癌数据集的属性进行选择,特征选择后减少的属性代替原来较多的属性,再对其用贝叶斯网络、属性选择分类器、J4... 提出以乳腺癌数据进行挖掘数据的有效分类方法.针对兰州市某医院乳腺癌数据,通过数据挖掘技术中3种不同的特征提取方法,对乳腺癌数据集的属性进行选择,特征选择后减少的属性代替原来较多的属性,再对其用贝叶斯网络、属性选择分类器、J48、逻辑回归模型、One-R 5种方法进行分类.结果表明,得到的子集再经过分类时所花费时间明显减少,利用贝叶斯网络算法进行分类的准确率和各项性能指标高于其他算法,用逻辑回归模型算法进行特征选择后准确率明显提高. 展开更多
关键词 特征选择 数据分类 乳腺癌 贝叶斯网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部