-
题名省级交通大数据平台中数据资源规划设计
- 1
-
-
作者
张震
马继骏
肖瑞洁
王子昂
董佳兵
-
机构
郑州大学电气与信息工程学院
河南省交通运输调度指挥中心
郑州大学计算机与人工智能学院
-
出处
《河南科技》
2023年第4期19-24,共6页
-
基金
2019年河南省交通运输厅科技计划项目“河南省交通运输行业信息资源目录管理及标准检测平台关键技术研究”(2019G3)。
-
文摘
【目的】目前,交通运输行业各个系统间的信息孤岛问题严重。通过数据资源规划和数据库设计,建设大数据平台数据资源体系,从而实现对交通运输行业数据资源的统一规划、组织、管理、存储和深度利用,加强各类信息间的分析及服务,解决交通运输行业信息资源缺乏整合共享的问题。【方法】交通运输行业数据体系设计主要包括数据资源规划、数据资源体系设计、数据治理和数据交换这四部分内容,数据资源体系是在数据资源规划的基础上,根据数据的属性和用途的不同,将其归纳形成服务于各业务应用系统的基础数据库、业务数据库、主题数据库和共享数据库,从而明确不同数据资源间的组织和管理方式。【结果】数据治理是通过对公路、水路交通运输行业数据资源进行综合管控,保障数据的准确性、一致性、完整性、可用性和安全性。【结论】数据交换负责行业内不同层级部门之间跨部门数据交换,解决跨部门、跨业务的数据共享问题。
-
关键词
交通运输
数据资源规划
数据资源体系
数据治理
数据交换
-
Keywords
transportation
data resource planning
data resources system
data governance
data switching
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名复合可靠性分析下的不平衡数据证据分类
- 2
-
-
作者
田鸿朋
张震
张思源
肖宗荣
董佳兵
-
机构
郑州大学电气与信息工程学院
-
出处
《郑州大学学报(工学版)》
CAS
北大核心
2023年第4期22-28,共7页
-
基金
河南省重大公益专项(201300311200)。
-
文摘
针对传统分类模型在处理不平衡数据时会侧重于大类而忽略小类的问题,提出了一种复合可靠性分析下的不平衡数据证据分类方法,通过评估分类模型的全局可靠性和局部可靠性来提升模型对每个不平衡测试样本的分类能力。首先,对大类多次降采样,采样后的数据与小类组成多个训练子集,用这些子集训练得到多个分类模型,通过最大均值差异度量采样前后数据分布的差异性得到不同分类模型的全局可靠性。其次,利用待测样本在训练集中的近邻来评估其分类结果的局部可靠性,待测样本与其近邻具有相似的数据分布和空间结构,分类模型对近邻的分类结果与真实类别偏差越小,其局部可靠性就越大。最后,在证据推理框架下,全局可靠性与局部可靠性组合为复合可靠性因子对不同分类模型得到的分类结果进行折扣,将部分概率值分配给完全未知类来表征数据类别的不确定性,用Dempster-Shafer(DS)规则融合多个折扣后的分类结果做决策分析。实验结果表明:所提方法对KEEL和UCI数据库的12个不平衡数据分类结果的平均FM为80.18%,GM为87.24%,相较于其他不平衡数据分类方法中最优结果分别高出8.1%和4.99%。所提方法的有效性在不平衡数据分类中得到了证实。
-
关键词
不平衡数据
分类
全局可靠性
局部可靠性
证据推理
-
Keywords
imbalanced data
classification
global reliability
local reliability
evidential reasoning
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-