-
题名从数据质量到数据产品质量
被引量:5
- 1
-
-
作者
蔡莉
朱扬勇
-
机构
云南大学软件学院
复旦大学计算机科学技术学院
上海市数据科学重点实验室
-
出处
《大数据》
2022年第3期26-39,共14页
-
基金
国家自然科学基金资助项目(No.61663047)
云南省软件工程重点实验室项目(No.2020SE314)。
-
文摘
长期以来,数据质量研究主要是为了满足组织自身信息系统正常运行的需求。随着数据要素市场的建设与发展,数据的质量需求从“自用需求”转变为“他用需求”“监管需求”。数据市场中的数据产品质量问题是数据使用者(购买者)和市场监管机构重点关注的内容。分析了数据产品质量的使用者需求和监管者需求,创新性地提出了一个数据产品质量体系框架;在此基础上,以盒装数据产品为例,从时间、空间和内容完整性3个方面构建了对应的质量维度、质量指标和质量评测模型。该质量体系可以对资源类数据产品进行检测和评定,能够为数据产品购买者和市场监管机构提供行之有效的检测依据和标准。
-
关键词
数据产品
数据质量
质量管理
盒装数据
-
Keywords
data product
data quality
quality control
boxeddata
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名盒装数据:一种基于数据盒的数据产品形态
被引量:11
- 2
-
-
作者
叶雅珍
朱扬勇
-
机构
复旦大学计算机科学技术学院
上海市数据科学重点实验室
-
出处
《大数据》
2022年第3期15-25,共11页
-
文摘
与通常的商品市场一样,数据市场中流通的数据商品也分为标准产品和非标准产品两大类。目前,市场中有效流通的数据产品是音乐、图片、电影等标准数据产品,而一般意义上的、大规模的大数据流通则遇到了诸多障碍,其中一个障碍就是数据产品的计量计价问题,需要设计一个可计量的标准数据产品形态。基于数据盒模型,设计了一种数据产品的基础标准形态,称之为盒装数据。一个盒装数据产品包括盒内数据、盒外包装两部分,其中,盒内数据是指“时间+空间+内容”三维度的数据立方体组织,一般包括图像、图形、视频、音频、文本、结构化数据等多种数据类型;盒外包装包括产品登记证书,以及产品说明书、质量证书、合规证书等内容。盒装数据旨在为数据要素市场提供一个可计量计价的标准数据产品形态。
-
关键词
数据产品
盒装数据
产品形态
数据市场
-
Keywords
data product
boxeddata
product form
data market
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
F49
[经济管理—产业经济]
-