期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
基于关联规则的条件函数依赖发现及数据修复 被引量:5
1
作者 张春生 图雅 +2 位作者 翁慧 李艳 魏国利 《计算机应用研究》 CSCD 北大核心 2016年第2期384-387,共4页
大数据时代,数据的来源复杂,数据质量存在严重问题,有些数据不准确、缺失或存在错误。不正确的数据严重影响了数据挖掘的质量,给决策造成重大的影响。关于缺失数据的修复方法很多,其中条件函数依赖就是一个有效的方法,在如何发现条件函... 大数据时代,数据的来源复杂,数据质量存在严重问题,有些数据不准确、缺失或存在错误。不正确的数据严重影响了数据挖掘的质量,给决策造成重大的影响。关于缺失数据的修复方法很多,其中条件函数依赖就是一个有效的方法,在如何发现条件函数依赖方面已经有了很多研究成果。提出一种应用关联规则构建条件函数依赖的方法,由于关联规则通过数据挖掘得到,具有一定的隐蔽性,不是一般的方法能够发现,所以,由关联规则构建的条件函数依赖具有一定的应用价值,给出了构建方法,并通过实验证明其有效性。 展开更多
关键词 关联规则 条件函数依赖 一致性 数据修复 大数据 缺失数据
下载PDF
一种扩展条件函数依赖的发现算法 被引量:5
2
作者 刘显敏 李建中 《计算机研究与发展》 EI CSCD 北大核心 2015年第1期130-140,共11页
扩展条件函数依赖(extended conditional functional dependency,eCFD)是一种描述数据一致性的语义规则,是条件函数依赖(conditional functional dependency,CFD)的扩展.相比于CFD,eCFD能够描述更多的模式从而表达更丰富的语义信息.然而... 扩展条件函数依赖(extended conditional functional dependency,eCFD)是一种描述数据一致性的语义规则,是条件函数依赖(conditional functional dependency,CFD)的扩展.相比于CFD,eCFD能够描述更多的模式从而表达更丰富的语义信息.然而,关注eCFD的研究工作并不多.从给定数据中发现eCFD规则是一个重要问题,据笔者所知,目前还没有这方面的工作.该问题的难点在于,给定数据中所有合法的eCFD规则之间存在不一致的情况,且包含大量冗余,而CFD和传统的函数依赖规则并没有这样的问题.为避免不一致,同时尽可能地消除冗余,定义了"强合法eCFD"和"近似无冗余eCFD".基于这些概念给出了eCFD发现问题的形式化定义,并给出了MeCFD算法.利用划分属性的方法,MeCFD首先生成所有的基本eCFD,然后,通过合并基本eCFD来构造"组合eCFD".使用先深序来搜索候选空间,使得MeCFD仅用常数的存储空间来维护数据划分,节省了大量的空间开销,有效的剪枝策略被用来改进MeCFD的性能.真实数据集上的实验结果显示出MeCFD良好的可扩展性以及剪枝策略和优化方法的有效性. 展开更多
关键词 扩展条件函数依赖 发现算法 搜索算法 剪枝策略 冗余
下载PDF
基于条件函数依赖的数据库一致性检测研究 被引量:9
3
作者 耿寅融 刘波 《计算机工程与应用》 CSCD 2012年第3期122-125,共4页
条件函数依赖是函数依赖在语义上的扩充,可以应用于数据清洗工作,在数据库一致性的修复上应用广泛。讨论了条件函数依赖的相关语义规则,重点研究了基于条件函数依赖对违反数据库一致性元组的检测工作,并引入置信度评价机制,对相关的检... 条件函数依赖是函数依赖在语义上的扩充,可以应用于数据清洗工作,在数据库一致性的修复上应用广泛。讨论了条件函数依赖的相关语义规则,重点研究了基于条件函数依赖对违反数据库一致性元组的检测工作,并引入置信度评价机制,对相关的检测规则进行了改进。改进后的检测方法在基于多个函数依赖的检测中显示出了优越性,使得检测工作更为精简,检测标准更加明确。 展开更多
关键词 条件函数依赖 函数依赖 结构化查询语言(SQL)
下载PDF
基于条件函数依赖的挖掘算法研究 被引量:6
4
作者 张方舟 高晓松 《计算机技术与发展》 2015年第5期56-59,共4页
由于采用函数依赖(Functional Dependency,FD)对数据库的检测和修复还不够充分,现提出了条件函数依赖(Conditional Functional Dependency,CFD),其是在FD的基础上加入了语义约束。条件函数依赖的挖掘是一种重要的数据库分析技术,CFD挖... 由于采用函数依赖(Functional Dependency,FD)对数据库的检测和修复还不够充分,现提出了条件函数依赖(Conditional Functional Dependency,CFD),其是在FD的基础上加入了语义约束。条件函数依赖的挖掘是一种重要的数据库分析技术,CFD挖掘是在FD挖掘的基础上通过条件分析进行更细粒度的信息挖掘,其时间复杂度较高。文中主要介绍了CFD的相关概念及CFD经典挖掘算法之一—CTANE,并对该算法效率进行改进。改进后的算法不仅可以提高数据挖掘过程中操作的效率,同时也将节省数据的存储空间。 展开更多
关键词 条件函数依赖 数据质量 数据清洗 CTANE算法
下载PDF
基于内容相关的条件函数依赖的一致性清洗方法 被引量:1
5
作者 杜岳峰 申德荣 +1 位作者 张亮 于戈 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第12期1683-1687,共5页
基于条件函数依赖提出了一种内容相关的条件函数依赖,并给出基于内容相关的条件函数依赖的一致性清洗方法.通过分析条件函数依赖之间的关系,将相关联的条件函数依赖合并组成内容相关的条件函数依赖.内容相关的条件函数依赖可以检测多条... 基于条件函数依赖提出了一种内容相关的条件函数依赖,并给出基于内容相关的条件函数依赖的一致性清洗方法.通过分析条件函数依赖之间的关系,将相关联的条件函数依赖合并组成内容相关的条件函数依赖.内容相关的条件函数依赖可以检测多条件值下的数据一致性问题并提供可用于一致性修复的参考值.同时,提出了一种一致性修复的代价模型.模型参考内容相关的条件函数依赖对应元组的实际情况进行修复,实现代价最优,同时保证数据一致性.通过在两组真实数据集上进行试验测试,证明提出的基于内容相关的条件函数依赖的一致性清洗方法能够准确地检测数据的一致性问题并加以修复. 展开更多
关键词 数据清洗 条件函数依赖 内容相关 数据一致性 修复代价模型
下载PDF
基于条件函数依赖的隐私保护模型 被引量:1
6
作者 陈伟鹤 陈霖 《计算机应用研究》 CSCD 北大核心 2012年第10期3838-3841,共4页
数据拥有者发布的数据中如果包含条件函数依赖会导致数据的隐私受到攻击,由条件函数依赖产生的属性间的关联会带来潜在的隐私泄露问题。针对现有的隐私保护方法均无法保护包含条件函数依赖的数据的隐私,形式化地定义了基于条件函数依赖... 数据拥有者发布的数据中如果包含条件函数依赖会导致数据的隐私受到攻击,由条件函数依赖产生的属性间的关联会带来潜在的隐私泄露问题。针对现有的隐私保护方法均无法保护包含条件函数依赖的数据的隐私,形式化地定义了基于条件函数依赖的隐私攻击,提出了隐私保护模型l-deduction来对包含条件函数依赖的数据进行隐私保护;并设计了相应的匿名算法来实现l-deduction模型。理论分析和实验结果表明,该方法既能保护包含条件函数依赖的数据的隐私,又具有较小的信息损失度。 展开更多
关键词 隐私保护 数据发布 条件函数依赖 l-deduction 信息损失
下载PDF
一种条件函数依赖挖掘算法的分析与实现 被引量:6
7
作者 周健昌 刘波 《计算机与数字工程》 2012年第9期8-11,共4页
条件函数依赖(Conditional Functional Dependence,CFD)的挖掘是一种重要的数据库分析技术,它是在函数依赖(FunctionalDependence,FD)挖掘的基础上加入条件分析功能扩展而来,当前被应用于数据质量检测。CFD挖掘是在FD挖掘的基础上通过... 条件函数依赖(Conditional Functional Dependence,CFD)的挖掘是一种重要的数据库分析技术,它是在函数依赖(FunctionalDependence,FD)挖掘的基础上加入条件分析功能扩展而来,当前被应用于数据质量检测。CFD挖掘是在FD挖掘的基础上通过条件分析进行更细粒度的信息挖掘,其时间复杂度较高。文章详细介绍一种经典的CFD挖掘方法(即CTANE算法),对其实现方法提出了优化措施,并通过实验比较了不同实现方法的效率,得出了优化措施改进效率的结论。 展开更多
关键词 数据挖掘 数据质量 一致性检测 数据清洗 条件函数依赖 CTANE算法
下载PDF
条件函数依赖及其在领域无关数据清洗中的应用 被引量:1
8
作者 周健昌 卜媛媛 《微型电脑应用》 2012年第9期23-26,30,共5页
条件函数依赖(Conditional Functional Dependeny,CFD)是对函数依赖(Functional Depencency,FD)加入语义约束扩展而来,它在数据库一致性检测、数据清洗方面更优于后者。讨论了条件函数依赖的相关概念及其基本性质,讨论如何将它应用于数... 条件函数依赖(Conditional Functional Dependeny,CFD)是对函数依赖(Functional Depencency,FD)加入语义约束扩展而来,它在数据库一致性检测、数据清洗方面更优于后者。讨论了条件函数依赖的相关概念及其基本性质,讨论如何将它应用于数据清洗,并对已提出的基于CFD的数据清洗方案提出改进措施,并通过实验说明改进措施的可行性。 展开更多
关键词 数据挖掘 数据清洗 条件函数依赖
下载PDF
条件函数依赖与数据质量控制 被引量:4
9
作者 程录庆 《信息系统工程》 2009年第11期106-108,共3页
提高数据质量对于企业管理信息系统意义重大,数据质量的提高涉及数据库的设计、数据的输入、数据的维护及数据清洗全过程。比较了条件函数依赖CFD与传统函数依赖FD;基于条件函数依赖框架对业务规则及领域知识的表达作了初步研究,对脏数... 提高数据质量对于企业管理信息系统意义重大,数据质量的提高涉及数据库的设计、数据的输入、数据的维护及数据清洗全过程。比较了条件函数依赖CFD与传统函数依赖FD;基于条件函数依赖框架对业务规则及领域知识的表达作了初步研究,对脏数据的识别和清洗提供可行的方法和思路。 展开更多
关键词 数据质量 条件函数依赖 业务规则 数据清洗
下载PDF
条件函数依赖的增量计算
10
作者 刘波 周健昌 《系统工程与电子技术》 EI CSCD 北大核心 2015年第11期2640-2647,共8页
条件函数依赖是对传统函数依赖的扩展,它通过引入条件模式,使其语义比函数依赖更精确、表达能力更强。然而,条件函数依赖的计算需要消耗较多的时间,为了提高条件函数依赖挖掘的效率,研究了条件函数依赖增量维护方法。针对数据集增加、... 条件函数依赖是对传统函数依赖的扩展,它通过引入条件模式,使其语义比函数依赖更精确、表达能力更强。然而,条件函数依赖的计算需要消耗较多的时间,为了提高条件函数依赖挖掘的效率,研究了条件函数依赖增量维护方法。针对数据集增加、删除、修改3种情况分别分析了条件函数依赖集变化规律,提出了条件函数依赖的增量计算算法,从而能够在数据库变化情况下,高效、动态地维护条件函数依赖。同时,在理论上对算法中关键步骤的正确性进行了论证,并通过实验验证了算法的有效性。 展开更多
关键词 增量计算 条件函数依赖 数据挖掘
下载PDF
数据约束表达研究——比较条件函数依赖与传统函数依赖
11
作者 程录庆 《洛阳师范学院学报》 2011年第11期61-64,共4页
在信息系统的范畴内,数据约束不同于业务流程和数据流程,数据约束是数据应遵循的语义限制,反映应用领域的信息规则,对数据约束的形式化表达是设计和管理数据库系统的基本任务.为了探讨数据约束的形式化表达问题,对条件函数依赖和传统函... 在信息系统的范畴内,数据约束不同于业务流程和数据流程,数据约束是数据应遵循的语义限制,反映应用领域的信息规则,对数据约束的形式化表达是设计和管理数据库系统的基本任务.为了探讨数据约束的形式化表达问题,对条件函数依赖和传统函数依赖这两种数据约束表达方法作了比较研究.通过比较分析两者的表达能力、表达形式、对数据约束规律的揭示以及应用范围,指出了数据约束表达的三个层次.研究对数据库系统的设计与管理有理论参考价值. 展开更多
关键词 数据约束 条件函数依赖 传统函数依赖
下载PDF
一种增量发现条件函数依赖的算法 被引量:1
12
作者 李丁月 刘建勋 翟海军 《计算机工程与科学》 CSCD 北大核心 2013年第8期149-155,共7页
数据库频繁更新会导致满足条件的条件函数依赖(CFDs)发生变化,为获取准确的条件函数依赖,可以在更新后的数据库上重新执行发现过程,但这种方法会导致大量时间都浪费在对原始数据集的重复处理上。针对这种情况,在CFINDER算法基础上,提出... 数据库频繁更新会导致满足条件的条件函数依赖(CFDs)发生变化,为获取准确的条件函数依赖,可以在更新后的数据库上重新执行发现过程,但这种方法会导致大量时间都浪费在对原始数据集的重复处理上。针对这种情况,在CFINDER算法基础上,提出了一个增量发现条件函数依赖的算法CFUP。当数据库中增加新数据集时,CFUP在已有的CFDs的基础上,去掉不满足条件的CFDs,发现满足条件的新CFDs。实验表明,该算法能有效地进行条件函数依赖的增量式更新,与重新运行CFINDER算法相比,减少了原始数据集的扫描次数,提高了更新CFDs的效率。 展开更多
关键词 条件函数依赖 增量式算法 数据库
下载PDF
基于内容感知发现XML条件函数依赖 被引量:1
13
作者 郑婷 段富 《计算机应用研究》 CSCD 北大核心 2014年第12期3655-3658,3662,共5页
针对XML函数依赖(XFD)不能充分检测XML局部数据源语义上的数据不一致,借鉴关系数据库中条件函数依赖(CFD)的概念,并根据XML自身结构和约束特性,提出了基于内容感知发现(CAD)XML条件函数依赖(XCFD),CAD使用隐藏在数据值中的内容发现局部... 针对XML函数依赖(XFD)不能充分检测XML局部数据源语义上的数据不一致,借鉴关系数据库中条件函数依赖(CFD)的概念,并根据XML自身结构和约束特性,提出了基于内容感知发现(CAD)XML条件函数依赖(XCFD),CAD使用隐藏在数据值中的内容发现局部XML文档的XCFDs,检测异构数据源中数据一致性,提高数据的质量,并给出了详细的算法,同时引入修剪规则集减少搜索点阵和候选的XCFD的数量,提高算法的效率,使得XCFD无冗余、最小化。通过案例研究表明,基于CAD方法发现的XCFD比现有XFD发现更多的函数依赖和语义约束。 展开更多
关键词 可扩展标记语言 条件函数依赖 语义约束 内容感知 数据一致性
下载PDF
基于条件函数依赖的CTANE算法研究与应用 被引量:1
14
作者 毛燠锋 钱振兴 +1 位作者 万定生 朱跃龙 《计算机工程与应用》 CSCD 北大核心 2017年第11期85-89,共5页
针对复杂庞大有研究价值的数据,查找其中蕴含的条件函数依赖可以有效地利用这些有价值的数据。但现有的条件函数依赖搜索算法在面对庞大的数据时查找效率较慢,所以对现有的算法的改进意义重大。针对水利普查数据的特点对查找条件函数依... 针对复杂庞大有研究价值的数据,查找其中蕴含的条件函数依赖可以有效地利用这些有价值的数据。但现有的条件函数依赖搜索算法在面对庞大的数据时查找效率较慢,所以对现有的算法的改进意义重大。针对水利普查数据的特点对查找条件函数依赖的算法进行了改进,在原有算法的基础上加入了剪枝策略。实验和理论证明,改进后的算法相比传统的搜索算法在保证搜索质量的前提下加快了搜索速度,使得查找数据中的条件函数依赖更加快捷便利。 展开更多
关键词 条件函数依赖 搜索算法 水利普查 剪枝策略
下载PDF
基于条件函数依赖的FastCFD算法研究与应用
15
作者 谭黎龙 万定生 钱振兴 《信息技术》 2018年第7期1-4,10,共5页
利用条件函数依赖能有效地对数据库进行检测和修复。但是面对大量且复杂的数据时,传统的条件函数依赖算法存在检测和修复速率慢,查找效率低等问题。以水利普查数据为研究对象,利用其复杂且庞大的特点,在原有的算法上引入一致集简化计算... 利用条件函数依赖能有效地对数据库进行检测和修复。但是面对大量且复杂的数据时,传统的条件函数依赖算法存在检测和修复速率慢,查找效率低等问题。以水利普查数据为研究对象,利用其复杂且庞大的特点,在原有的算法上引入一致集简化计算差集的过程,并根据深度优先的搜索策略搜索属性集的最小覆盖。改进后的算法相比传统的挖掘算法在保证搜索质量的前提下加快了搜索速率,并提高了复杂数据的挖掘效率。 展开更多
关键词 搜索算法 条件函数依赖 水利普查 深度优先 最小覆盖
下载PDF
基于常量条件函数依赖的冲突消解算法
16
作者 冯钦 曹建军 +1 位作者 郑奇斌 张磊 《计算机仿真》 北大核心 2020年第2期279-283,共5页
目前绝大部分冲突消解方法都是基于迭代计算数据源可靠度和事实可信度的机制。当数据源较少时,数据源的可靠度难于进行评估,仅凭投票来消解冲突往往会造成较大误差。针对数据源较少时的冲突消解问题,提出基于常量条件函数依赖的冲突消... 目前绝大部分冲突消解方法都是基于迭代计算数据源可靠度和事实可信度的机制。当数据源较少时,数据源的可靠度难于进行评估,仅凭投票来消解冲突往往会造成较大误差。针对数据源较少时的冲突消解问题,提出基于常量条件函数依赖的冲突消解算法。根据多个数据源之间的冲突,找出冲突匹配对及对应的冲突候选值集合。考虑常量条件函数依赖中具体到部分实例子集的约束关系,将常量条件函数依赖集作为先验知识,通过判断候选值是否符合常量条件函数依赖来选择正确的候选值,避免了错误数据比例较大时直接投票选择产生的误差。通过两个真实数据集上的对比实验验证了上述算法的有效性。 展开更多
关键词 数据清洗 数据质量 数据冲突 常量条件函数依赖 冲突消解
下载PDF
基于开项集剪枝的常量条件函数依赖挖掘 被引量:1
17
作者 周金陵 刁兴春 曹建军 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第3期253-261,共9页
为了减小常量条件函数依赖的搜索空间,提高挖掘效率,针对常量条件函数依赖挖掘算法CFDMiner,提出了一系列剪枝优化策略。理论研究发现,CFDMiner的输入——关系数据的全部开项集和闭项集对产生有效的常量条件函数依赖仍然存在很多无效、... 为了减小常量条件函数依赖的搜索空间,提高挖掘效率,针对常量条件函数依赖挖掘算法CFDMiner,提出了一系列剪枝优化策略。理论研究发现,CFDMiner的输入——关系数据的全部开项集和闭项集对产生有效的常量条件函数依赖仍然存在很多无效、冗余的项集。从理论上证明了通过合理剪枝,选取开项集的子集与对应的闭项集,能够得到与原算法一致的结果。实验表明:相比原始算法CFDMiner,优化后的算法搜索空间更小,实际数据集上平均挖掘效率提高4~5倍。 展开更多
关键词 条件函数依赖 函数依赖 开项集 闭项集 剪枝
原文传递
不完全信息下XML树的函数依赖强保持条件 被引量:1
18
作者 张广玲 郝忠孝 《哈尔滨理工大学学报》 CAS 2007年第4期41-44,共4页
DTD规范下,在XML完全树中引入不完全信息,定义了不完全信息树.在不完全信息树下讨论树中节点之间的关系,给出节点值等价、节点值相容的概念,并进一步讨论不完全信息树下树元组之间的关系及函数依赖的保持条件.
关键词 节点值等价 节点值相容 树元组等价 树元组相容 函数依赖保持条件
下载PDF
条件依赖理论及其应用展望 被引量:8
19
作者 胡艳丽 张维明 《计算机科学》 CSCD 北大核心 2009年第12期115-118,145,共5页
介绍了条件函数依赖理论及如何用于检测不一致数据。首先介绍了条件函数依赖的概念及其推理系统,以及如何通过依赖传播实现视图的规范化;阐述了条件函数依赖的一致性和蕴含判定问题,并在此基础上介绍了基于条件函数依赖检测关系数据库... 介绍了条件函数依赖理论及如何用于检测不一致数据。首先介绍了条件函数依赖的概念及其推理系统,以及如何通过依赖传播实现视图的规范化;阐述了条件函数依赖的一致性和蕴含判定问题,并在此基础上介绍了基于条件函数依赖检测关系数据库数据一致性的技术;最后讨论了条件函数依赖的扩展及应用。 展开更多
关键词 数据质量 数据清洗 条件函数依赖 推理规则 依赖传播 一致性判定 蕴含判定
下载PDF
基于水利普查数据的函数依赖关系算法 被引量:1
20
作者 钱振兴 万定生 +1 位作者 李士进 程习锋 《计算机与现代化》 2014年第8期96-100,共5页
条件函数依赖(Conditional Functional Dependencies,CFDs)在数据库一致性的检测上应用广泛。为检测水利普查数据的一致性,本文针对水利普查数据特点,将普查数据分为度量、维度2部分,并对度量数据进行聚类,引入条件函数依赖的概念,同时... 条件函数依赖(Conditional Functional Dependencies,CFDs)在数据库一致性的检测上应用广泛。为检测水利普查数据的一致性,本文针对水利普查数据特点,将普查数据分为度量、维度2部分,并对度量数据进行聚类,引入条件函数依赖的概念,同时重新定义条件函数依赖,改进发现条件函数依赖的算法(即CTANE算法);以水库工程数据为例,验证本文改进的算法能准确高效地发现水利普查数据中的条件函数依赖,为检测数据一致性做好准备。 展开更多
关键词 水利普查数据 条件函数依赖 度量 维度 CTANE算法
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部