期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于位运算的不完整记录分类检测方法 被引量:3
1
作者 曹建军 刁兴春 +2 位作者 吴建明 袁震 彭琮 《系统工程与电子技术》 EI CSCD 北大核心 2010年第11期2489-2492,共4页
缺失数据的处理是数据清洗的重要内容。提出了一种基于位运算的不完整记录分类检测方法。对不完整记录进行了界定,将记录分为完整、不完整合格、不完整修正和不完整删除四类,并给出了其层次分类流程。定义了记录的二进制表示,根据不完... 缺失数据的处理是数据清洗的重要内容。提出了一种基于位运算的不完整记录分类检测方法。对不完整记录进行了界定,将记录分为完整、不完整合格、不完整修正和不完整删除四类,并给出了其层次分类流程。定义了记录的二进制表示,根据不完整记录样本生成各类记录的标准二进制表示集,按在样本中出现的次数确定标准二进制表示的优先级,并对不完整删除标准二进制表示集中的二制表示进行了表达式合并。通过位运算实现记录的分类检测,并通过处理未检出二进制表示逐步完善二进制表示集。根据不完整记录二进制表示确定记录的进一步处理。应用实例验证了方法的有效性。 展开更多
关键词 数据质量 数据清洗 缺失数据 不完整记录 分类
下载PDF
“关于一个不完整记录的统计方法的讨论”读后感
2
作者 李建成 《气象》 CSCD 北大核心 2000年第8期57-57,共1页
关键词 地面气象观测规范 不完整记录 统计
下载PDF
数据清洗及其一般性系统框架 被引量:31
3
作者 曹建军 刁兴春 +1 位作者 陈爽 邵衍振 《计算机科学》 CSCD 北大核心 2012年第S3期207-211,共5页
数据清洗是提高数据质量的重要手段之一。从数据产品与传统的有形产品、软件产品相类比的视角,研究数据清洗及其系统框架。数据清洗是数据质量研究的起点,从数据质量发展的角度明确数据清洗的地位和作用,并将其类比为其他产品形式的故... 数据清洗是提高数据质量的重要手段之一。从数据产品与传统的有形产品、软件产品相类比的视角,研究数据清洗及其系统框架。数据清洗是数据质量研究的起点,从数据质量发展的角度明确数据清洗的地位和作用,并将其类比为其他产品形式的故障诊断与维修。对数据清洗做了10点说明,进一步澄清了其基本内涵;将数据清洗与数据集成进行了比较分析,指出二者是同等的数据质量概念。提出了数据清洗的一般性系统框架,其由准备、检测、定位、修正、验证5部分组成,允许在多处停止以完成不同的数据清洗任务,是一个柔性的、可扩展的、交互性好的、松耦合的框架。 展开更多
关键词 数据质量 数据清洗 相似重复记录 不完整记录 框架
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部