-
题名通用数据质量评估模型及本体实现
被引量:14
- 1
-
-
作者
张晓冉
袁满
-
机构
东北石油大学计算机与信息技术学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2018年第6期1333-1344,共12页
-
基金
黑龙江省教育厅科技项目(12531059)~~
-
文摘
随着数据科学技术在各个领域的深度应用,作为企业重要资产的数据越发表现出它的价值性与重要性.绝大多数企业结合行业特点开发了数据质量检测系统来解决自身数据质量问题.这些系统的评估模型各有特点,对于数据质量维度的定义也是各有千秋.试图将这些模型与数据质量维度以一种通用的形式来定义,旨在成为企业研发数据质量评估系统的标准.通过分析国内外学者在该研究领域取得的成果并结合常年研发数据质量检测与评估系统的经验,首先,提出了一个通用的数据质量检测与评估的数学模型;接着,以此模型为基础,采用本体技术定义了从该通用的数据质量评估数学模型到本体模型映射的转换规则;随后,考虑到多数数据存储在关系数据库中,因此以关系数据模型为例,依据所提出的数学模型和转换规则实现了对数据质量评估本体的抽取与构建,该模型实现了复杂质量规则的定义,具有规范性,实现了对不同来源、不同格式的数据质量进行检测与评估;最后,结合中国石油的油田开发数据质量评估项目进行了系统的实现,验证所提出模型的正确性、科学性、合理性以及可扩充性等.由于所提出的数据质量检测与评估模型与领域无关,所以它具有通用性.
-
关键词
数据质量
数据质量维度
数据质量评估
关系数据模型
本体映射
数据质量本体模型
-
Keywords
data quality
data quality dimension
data quality assess
relational data model
ontologymapping
data quality ontology model
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-