-
题名一种非清洁数据库的数据模型
被引量:11
- 1
-
-
作者
王宏志
李建中
高宏
-
机构
哈尔滨工业大学计算机科学与技术系
-
出处
《软件学报》
EI
CSCD
北大核心
2012年第3期539-549,共11页
-
基金
国家自然科学基金(61003046
60933001)
+4 种基金
国家重点基础研究发展计划(973)(2012CB316200)
中国博士后科学基金(201003447)
教育部博士点基金(20102302120054)
哈尔滨工业大学优秀青年教师培养计划(HITQNJS.2009.052)
数据工程与知识工程教育部重点实验室(中国人民大学)开放课题(KF2011003)
-
文摘
非清洁数据为数据管理带来了新的挑战,当前,处理非清洁的数据清洗方法在实际应用中存在一定的局限性,因此需要在一定程度上容忍非清洁数据的存在.这样,研究管理包含非清洁数据的数据库管理技术就成为了重要的问题,其核心在于如何从包含非清洁数据的数据库中得到满足应用所要求的清洁度的查询结果.从非清洁数据处理角度出发,提出了一种非清洁数据库的数据模型.该模型提出了非清洁数据的表示方法,支持非清洁数据的数据操作,并且支持数据操作清洁度的计算.同时还讨论了查询表达式的等价转换规则和模型的初步实现.
-
关键词
数据质量
非清洁数据
数据模型
查询处理
-
Keywords
data quality
dirty data
data model
query processing
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名大数据环境下面向知识服务的数据清洗研究
被引量:47
- 2
-
-
作者
蒋勋
刘喜文
-
机构
南京大学信息管理学院
无锡城市职业技术学院电子信息工程系
-
出处
《图书与情报》
CSSCI
北大核心
2013年第5期16-21,共6页
-
基金
国家自然科学基金项目"面向知识服务的知识库结构研究"(项目编号:71303109)
无锡城市职业技术学院重点课题"数字图书馆中信息的语义组织与跨领域检索模式研究"(项目编号:WXCY-2012-GZ-005)
江苏省高校2012年度"青蓝工程"优秀青年骨士教师人才项目研究成果之一
-
文摘
大数据既丰富了知识的内涵,也增添了知识显式化的障碍。对大数据进行数据清洗是最终获取知识的有效途径。由大数据的特点对知识服务重新提出要求,不仅要提高数据的使用价值,更要使数据严密的关联,这些要求一方面通过数据清洗满足数据质量的提高,另一方面容忍非清洁数据实现知识服务效率与水平的同步提高。文章给出了数据清洗的基本框架模型及其局限,从而进一步提出非清洁数据的清洁度的机制。
-
关键词
大数据
知识服务
知识库
数据清洗
非清洁数据
清洁度
-
Keywords
big data
knowledge service
knowledge base
data cleaning
dirty data
data quality
-
分类号
G302
[文化科学]
TP391
[自动化与计算机技术—计算机应用技术]
-