-
题名基于位运算的不完整记录分类检测方法
被引量:3
- 1
-
-
作者
曹建军
刁兴春
吴建明
袁震
彭琮
-
机构
南京电讯技术研究所
军械工程学院装备指挥与管理工程系
-
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2010年第11期2489-2492,共4页
-
基金
中国博士后科学基金(20090461425)
江苏省博士后科研资助计划项目(0901014B)资助课题
-
文摘
缺失数据的处理是数据清洗的重要内容。提出了一种基于位运算的不完整记录分类检测方法。对不完整记录进行了界定,将记录分为完整、不完整合格、不完整修正和不完整删除四类,并给出了其层次分类流程。定义了记录的二进制表示,根据不完整记录样本生成各类记录的标准二进制表示集,按在样本中出现的次数确定标准二进制表示的优先级,并对不完整删除标准二进制表示集中的二制表示进行了表达式合并。通过位运算实现记录的分类检测,并通过处理未检出二进制表示逐步完善二进制表示集。根据不完整记录二进制表示确定记录的进一步处理。应用实例验证了方法的有效性。
-
关键词
数据质量
数据清洗
缺失数据
不完整记录
分类
-
Keywords
data quality
data cleaning
missing data
incompleted record
classification
-
分类号
TN311
[电子电信—物理电子学]
-
-
题名“关于一个不完整记录的统计方法的讨论”读后感
- 2
-
-
作者
李建成
-
机构
上海市闵行区气象局
-
出处
《气象》
CSCD
北大核心
2000年第8期57-57,共1页
-
-
关键词
地面气象观测规范
不完整记录
统计
-
分类号
P412.1
[天文地球—大气科学及气象学]
-
-
题名数据清洗及其一般性系统框架
被引量:31
- 3
-
-
作者
曹建军
刁兴春
陈爽
邵衍振
-
机构
总参第
解放军理工大学指挥自动化学院
中国人民解放军
-
出处
《计算机科学》
CSCD
北大核心
2012年第S3期207-211,共5页
-
基金
中国博士后科学基金特别资助项目(201003797)
中国博士后科学基金项目(20090461425)
+1 种基金
江苏省博士后科研资助计划(0901014B)
解放军理工大学预研基金项目(20110604)资助
-
文摘
数据清洗是提高数据质量的重要手段之一。从数据产品与传统的有形产品、软件产品相类比的视角,研究数据清洗及其系统框架。数据清洗是数据质量研究的起点,从数据质量发展的角度明确数据清洗的地位和作用,并将其类比为其他产品形式的故障诊断与维修。对数据清洗做了10点说明,进一步澄清了其基本内涵;将数据清洗与数据集成进行了比较分析,指出二者是同等的数据质量概念。提出了数据清洗的一般性系统框架,其由准备、检测、定位、修正、验证5部分组成,允许在多处停止以完成不同的数据清洗任务,是一个柔性的、可扩展的、交互性好的、松耦合的框架。
-
关键词
数据质量
数据清洗
相似重复记录
不完整记录
框架
-
Keywords
Data quality
Data cleaning
Approximate duplicate records
Incompleted records
Framework
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-