摘要
铁路运输管理信息系统从20世纪90年代建设以来,累积了大量的运行数据。以货票信息管理系统产生的货票数据为例,具有字段多、范围广、类型复杂、海量等特征,传统的关系型数据库由于系统扩展性差、成本高、海量数据运算性能低等特征,难以满足当前大数据分析的需要,故提出基于Hadoop的分布式数据分析解决方案。该方案可以有效降低海量数据的存储成本,提升海量数据的运算性能,实现海量数据中定向查询的毫秒级响应,提高分析效率和节约时间成本,为铁路货运运营维护提供快速有力的数据支撑。
出处
《中国铁路》
2014年第4期94-97,共4页
China Railway