期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
包含非数值型属性的交互式遗憾最小化查询
1
作者 王美静 郑吉平 《小型微型计算机系统》 CSCD 北大核心 2024年第3期513-520,共8页
近年来,遗憾最小化查询作为多准则决策的重要工具之一,逐渐成为数据查询的研究热点.遗憾最小化查询中,通过与用户进行交互,不断地学习用户的偏好,可以有效帮助降低查询的遗憾率.然而,已有的研究仅针对具有数值型属性的数据定义遗憾率并... 近年来,遗憾最小化查询作为多准则决策的重要工具之一,逐渐成为数据查询的研究热点.遗憾最小化查询中,通过与用户进行交互,不断地学习用户的偏好,可以有效帮助降低查询的遗憾率.然而,已有的研究仅针对具有数值型属性的数据定义遗憾率并据此进行遗憾最小化查询,当面对包含非数值型属性的数据时,这些方法不再适用.本文提出的遗憾率定义针对包含非数值型属性的数据,并给出新的交互式遗憾最小化查询问题的定义.在此基础上,采用“支配”的概念提出用于预处理的skyline删减算法,利用偏好矩阵帮助学习用户偏好,并提出用于解决交互式遗憾最小化的算法MECR_QS.最后,实验结果表明MECR_QS算法能有效处理包含非数值型属性的交互式遗憾最小化查询. 展开更多
关键词 遗憾最小化查询 交互 数值型属性 skyline筛选
下载PDF
基于样本分布与熵的数值型属性离散化 被引量:2
2
作者 林永民 吕震宇 +1 位作者 赵爽 朱卫东 《计算机工程与应用》 CSCD 北大核心 2008年第1期159-161,共3页
连续属性的离散化是数据预处理的重要工作。论文分析了基于熵的离散化方法的不足,从估计训练样本的概率分布的角度出发,提出基于样本分布与熵相结合的处理数值型属性的方法。基于UCI数据的实验结果表明,该方法不仅具有比较好的判决精度... 连续属性的离散化是数据预处理的重要工作。论文分析了基于熵的离散化方法的不足,从估计训练样本的概率分布的角度出发,提出基于样本分布与熵相结合的处理数值型属性的方法。基于UCI数据的实验结果表明,该方法不仅具有比较好的判决精度,而且具有更快的计算速度。 展开更多
关键词 数值型属性 样本分布 离散化
下载PDF
基于数值型属性约简的SVM网络故障诊断 被引量:2
3
作者 李爰媛 孟相如 +1 位作者 张立 庄凌屹 《计算机工程》 CAS CSCD 北大核心 2009年第7期273-276,共4页
网络故障的关联性传播可能导致网络故障数据包含大量冗余信息,影响诊断精度和处理效能。该文根据故障数据的特点,将粗糙集理论与支持向量机(SVM)相结合,采用基于邻域粗糙逼近的数值型属性约简算法进行快速高效的故障诊断,避免经典粗糙... 网络故障的关联性传播可能导致网络故障数据包含大量冗余信息,影响诊断精度和处理效能。该文根据故障数据的特点,将粗糙集理论与支持向量机(SVM)相结合,采用基于邻域粗糙逼近的数值型属性约简算法进行快速高效的故障诊断,避免经典粗糙集理论中离散化误差的影响,缩减数据存储空间,降低SVM训练模型的复杂度,提高训练速度。ROC性能曲线分析结果表明,该方法具有良好的泛化能力。 展开更多
关键词 网络故障诊断 支持向量机 数值型属性约简 邻域逼近
下载PDF
决策树中数值型属性分裂的研究 被引量:1
4
作者 刘友军 汪林林 《计算机科学》 CSCD 北大核心 2006年第5期241-243,共3页
在介绍了现有数值型属性分裂方法的基础上,引出了纯区间的概念,提出了一种基于纯区间归约的数值型属性分裂方法。该方法将属性值域用等宽直方图的方法划分为多个区间,对纯区间和非纯区间分别处理。理论分析和实验结果表明该方法在保证... 在介绍了现有数值型属性分裂方法的基础上,引出了纯区间的概念,提出了一种基于纯区间归约的数值型属性分裂方法。该方法将属性值域用等宽直方图的方法划分为多个区间,对纯区间和非纯区间分别处理。理论分析和实验结果表明该方法在保证了分裂精度的同时,减小了搜索空间。 展开更多
关键词 决策树 数值型属性 纯区间归约 Gini指数
下载PDF
时态数据库中非数值型属性周期规律的研究
5
作者 孙晓川 梁晓蕾 洪晓光 《山东师范大学学报(自然科学版)》 CAS 2008年第3期44-49,共6页
时间是数据本身固有的属性,将时间约束加在关联规则中能更好地说明事实.本文介绍的方法能够提取时态数据库中带时态信息的关联规则,而且能够计算时态数据库中某个非数值型属性(项)的周期,并通过执行改造了的Apriori算法提取该属性的周... 时间是数据本身固有的属性,将时间约束加在关联规则中能更好地说明事实.本文介绍的方法能够提取时态数据库中带时态信息的关联规则,而且能够计算时态数据库中某个非数值型属性(项)的周期,并通过执行改造了的Apriori算法提取该属性的周期规律.本文通过选取两个时间粒度,对时态数据库中的时间区间进行了两次划分和标记.第一次划分和标记的目的是计算选择出的某非数值型属性的周期;第二次划分和标记的目的是离散化时间区间,用标记集合代表原时间区间,进而根据标记集合求交的结果得到带时态信息的频繁项集.采用标记集合求交的方法能够使得Apriori算法的迭代迅速收敛,提高算法执行效率. 展开更多
关键词 关联规则 时间约束 数值型属性 周期规律 标记集合求交 时态数据库
下载PDF
一种基于关系数据库数值型属性特征的公开水印算法
6
作者 姜传贤 孙星明 刘林源 《科学技术与工程》 2005年第22期1724-1727,共4页
通过在关系型数据库中所嵌入的版权信息,从而实现数据库的版权保护。结合现有的关系型数据库水印算法基础上,引入混沌随机序列和哈希函数的方法,提出了一种在数据库中嵌入具有实际意义的水印信息的算法,该方法所嵌入的水印信息具有保密... 通过在关系型数据库中所嵌入的版权信息,从而实现数据库的版权保护。结合现有的关系型数据库水印算法基础上,引入混沌随机序列和哈希函数的方法,提出了一种在数据库中嵌入具有实际意义的水印信息的算法,该方法所嵌入的水印信息具有保密性强、能盲提取等特征。理论分析和仿真试验表明了该方法的有效性和可行性。 展开更多
关键词 数据库水印 数值型属性 混沌随机序列
下载PDF
时态数据库中非数值型属性周期规律挖掘以及关联规则提取 被引量:1
7
作者 梁晓蕾 张世栋 《计算机研究与发展》 EI CSCD 北大核心 2007年第z3期408-413,共6页
时态数据库中数值型属性(项)的周期规律挖掘已经得到了研究,提出的方法能够计算时态数据库中某个非数值型属性的周期,并通过执行改造了的Apriori算法挖掘该属性的周期规律,与此同时,算法也能够提取时态数据库中其他属性的带时态信息的... 时态数据库中数值型属性(项)的周期规律挖掘已经得到了研究,提出的方法能够计算时态数据库中某个非数值型属性的周期,并通过执行改造了的Apriori算法挖掘该属性的周期规律,与此同时,算法也能够提取时态数据库中其他属性的带时态信息的关联规则.提出的方法通过选取两个时间粒度,对时态数据库中的时间属性进行了两次划分和标记.通过划分和标记计算选出的某非数值型属性的周期;并用标记集合代替原时间区间,进行标记集合求交,根据求交的结果得到带时态信息的频繁项集.通过时间区间标记集合求交得到频繁项集的方法是一个特色.算法的这一特色使得Apriori算法的迭代过程迅速收敛,提高算法执行效率. 展开更多
关键词 关联规则 时间约束 数值型属性 周期规律 求交 标记集合 时态数据库
下载PDF
面向数值型敏感属性的分级l-多样性模型 被引量:23
8
作者 韩建民 于娟 +1 位作者 虞慧群 贾泂 《计算机研究与发展》 EI CSCD 北大核心 2011年第1期147-158,共12页
近年来,数据发布隐私保护问题受到了广泛关注,相继提出了多种隐私保护匿名模型.l-多样性模型是其中保护个体隐私的有效方法,但现有的l-多样性模型只适合处理分类型敏感属性,不适合处理数值型敏感属性.为此,提出面向数值型敏感属性的分... 近年来,数据发布隐私保护问题受到了广泛关注,相继提出了多种隐私保护匿名模型.l-多样性模型是其中保护个体隐私的有效方法,但现有的l-多样性模型只适合处理分类型敏感属性,不适合处理数值型敏感属性.为此,提出面向数值型敏感属性的分级l-多样性模型,包括分级相异l-多样性、分级信息熵l-多样性和分级递归(c,l)-多样性.所提出的模型首先将数值型敏感属性域分级,再基于分级信息实现数值型敏感属性的l-多样性.设计了实现这些模型的l-Incognito算法.并且从匿名表的多样性角度进行了比较,实验表明分级l-多样性表比未分级的l-多样性表具有更高的多样度,因此具有更强的抵制同质性攻击和背景知识攻击的能力. 展开更多
关键词 K-匿名 同质性攻击 背景知识攻击 l-多样性 数值敏感属性
下载PDF
面向近邻泄露的数值型敏感属性隐私保护方法
9
作者 谢静 张健沛 +1 位作者 杨静 张冰 《通信学报》 EI CSCD 北大核心 2015年第4期96-104,共9页
提出一种面向近邻泄露的数值型敏感属性隐私保护方法,该方法首先在保护准标识符属性和数值型敏感属性内在关系的前提下,将数值型敏感属性进行离散化划分;然后,提出一种面向近邻泄露的隐私保护原则——(k,ε)-proximity;最后,设计了最大... 提出一种面向近邻泄露的数值型敏感属性隐私保护方法,该方法首先在保护准标识符属性和数值型敏感属性内在关系的前提下,将数值型敏感属性进行离散化划分;然后,提出一种面向近邻泄露的隐私保护原则——(k,ε)-proximity;最后,设计了最大邻域优先算法MNF(maximal neighborhood first)来实现该原则。实验结果表明,提出的方法能在有效保护数值型敏感信息不泄露的同时保持较高的数据效用,并且保护了数据间的关系。 展开更多
关键词 隐私保护 数值敏感属性 近邻泄露 离散化
下载PDF
多维数值型敏感属性数据的个性化隐私保护方法 被引量:16
10
作者 张梅舒 徐雅斌 《计算机应用》 CSCD 北大核心 2020年第2期491-496,共6页
为了解决多维数值型敏感属性数据隐私保护方法中存在的准标识符属性信息损失大,以及不能满足用户对数值型敏感属性重要性排序的个性化需求问题,提出一种基于聚类和加权多维桶分组(MSB)的个性化隐私保护方法。首先,根据准标识符的相似程... 为了解决多维数值型敏感属性数据隐私保护方法中存在的准标识符属性信息损失大,以及不能满足用户对数值型敏感属性重要性排序的个性化需求问题,提出一种基于聚类和加权多维桶分组(MSB)的个性化隐私保护方法。首先,根据准标识符的相似程度,将数据集划分成若干准标识符属性值相近的子集;然后,考虑到用户对敏感属性的敏感程度不同,将敏感程度和多维桶的桶容量用于计算加权选择度和构建加权多维桶;最后,依此对数据进行分组和匿名化处理。选用UCI的标准Adult数据集中的8个属性进行实验,并与基于聚类和多维桶的数据隐私保护方法MNSACM和基于聚类和加权多维桶分组的个性化隐私保护方法WMNSAPM进行对比。实验结果表明,所提方法整体较优,并且在减少信息损失和运行时间方面明显优于对比方法,提高了数据质量和运行效率。 展开更多
关键词 隐私保护 多维数值敏感属性 聚类 匿名化 个性化
下载PDF
模糊决策粗糙集模型及其属性约简 被引量:6
11
作者 王莉 周献中 李华雄 《上海交通大学学报》 EI CAS CSCD 北大核心 2013年第7期1032-1035,1042,共5页
决策粗糙集基于严格的不可分辨等价关系,只能适用于离散型数据,文中研究了一种新的模糊决策粗糙集模型及相应的属性约简算法.该模型将不可分辨等价关系放松为高斯核模糊T-等价关系,从模糊隶属度角度定义了条件概率,能够直接对数值型数... 决策粗糙集基于严格的不可分辨等价关系,只能适用于离散型数据,文中研究了一种新的模糊决策粗糙集模型及相应的属性约简算法.该模型将不可分辨等价关系放松为高斯核模糊T-等价关系,从模糊隶属度角度定义了条件概率,能够直接对数值型数据进行属性约简.利用UCI标准数据集,将该模型与Pawlak经典粗糙集、决策粗糙集在属性约简能力上进行比较,仿真实验结果表明,该模型具有较好的性能. 展开更多
关键词 模糊决策粗糙集 条件概率 数值型属性 属性约简
下载PDF
面向数值型敏感属性的隐私保护方案
12
作者 王涛 温蜜 《计算机系统应用》 2019年第7期184-190,共7页
针对现有的个性化隐私匿名技术不能很好地解决数值型敏感属性容易遭受近邻泄漏的问题,提出了一种基于聚类技术的匿名模型——(εi,k)-匿名模型.该模型首先基于聚类技术将按升序排列的敏感属性值划分到几个值域区间内;然后,提出了针对数... 针对现有的个性化隐私匿名技术不能很好地解决数值型敏感属性容易遭受近邻泄漏的问题,提出了一种基于聚类技术的匿名模型——(εi,k)-匿名模型.该模型首先基于聚类技术将按升序排列的敏感属性值划分到几个值域区间内;然后,提出了针对数值型敏感属性抵抗近邻泄漏的(εi,k)-匿名原则;最后,提出了一种最大桶优先算法来实现(εi,k)-匿名原则.实验结果表明,与已有的面向数值型敏感属性抗近邻泄漏方案相比,该匿名方案信息损失降低,算法执行效率提高,可以有效地降低用户隐私泄露风险. 展开更多
关键词 隐私保护 数值敏感属性 近邻泄露 (εi k)-匿名模
下载PDF
一种新的无监督连续属性离散化方法 被引量:10
13
作者 花海洋 赵怀慈 《计算机工程与应用》 CSCD 北大核心 2011年第6期208-211,共4页
提出了一种基于聚类方法的无监督连续属性离散化算法,称为CAMNA(Clustering and Mergingon Numerical Attri-bute)算法。CAMNA算法通过聚类过程将数值值域划分为多个离散区间,根据类分布的指导信息优化合并相邻区间,实现理想的离散方案... 提出了一种基于聚类方法的无监督连续属性离散化算法,称为CAMNA(Clustering and Mergingon Numerical Attri-bute)算法。CAMNA算法通过聚类过程将数值值域划分为多个离散区间,根据类分布的指导信息优化合并相邻区间,实现理想的离散方案。通过实验证明该算法在保持执行效率较高的前提下,离散结果更加合理,生成的决策树结构简单,获得较少的分类规则,分类准确率也有提高。 展开更多
关键词 决策树 数值型属性 聚类区间 分类
下载PDF
模糊k-prototypes聚类算法的一种改进算法 被引量:11
14
作者 王宇 杨莉 《大连理工大学学报》 EI CAS CSCD 北大核心 2003年第6期849-852,共4页
模糊k-prototypes算法是当前聚类分析中最有效算法之一.简述了模糊k-prototypes算法的发展进程和主要性质;并在此基础上,指出它在处理数值型和分类型混合数据时的不足,进而提出一种改进算法;最后,将算法应用到英语借词之中,给出计算结果... 模糊k-prototypes算法是当前聚类分析中最有效算法之一.简述了模糊k-prototypes算法的发展进程和主要性质;并在此基础上,指出它在处理数值型和分类型混合数据时的不足,进而提出一种改进算法;最后,将算法应用到英语借词之中,给出计算结果.结果表明,改进算法具有较好的稳定性和较高的精确度. 展开更多
关键词 模糊k-prototypes聚类算法 数值型属性 分类属性 英语借词 数据挖掘
下载PDF
一种发现模糊关联规则的FTDA2算法 被引量:1
15
作者 钱增瑾 徐欢 鞠时光 《计算机工程》 CAS CSCD 北大核心 2009年第11期52-54,共3页
模糊关联规则在模糊集理论的基础上发现关联规则,频繁项集挖掘是数据挖掘的关键问题。Apriori算法在查找频繁项集时,需要对数据库进行多次扫描,通过模式匹配检查一个很大的候选集合,降低了算法执行效率。针对该问题提出FTDA2算法,该算... 模糊关联规则在模糊集理论的基础上发现关联规则,频繁项集挖掘是数据挖掘的关键问题。Apriori算法在查找频繁项集时,需要对数据库进行多次扫描,通过模式匹配检查一个很大的候选集合,降低了算法执行效率。针对该问题提出FTDA2算法,该算法对事务数据库进行一次扫描,记录对计算频繁项集支持度有贡献的事务。比较FTDA2算法与其他算法,通过实验证明其有效性。 展开更多
关键词 模糊集 关联规则 事务 数值型属性
下载PDF
基于PSO的模糊K-Prototypes聚类 被引量:2
16
作者 尹波 何松华 《计算机工程与设计》 CSCD 北大核心 2008年第11期2883-2885,共3页
模糊K-Prototypes(FKP)算法能够对包含数值属性和分类属性相混合的数据集进行有效聚类,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于粒子群优化(PSO)算法和FKP算法的混合聚类算法,先利用PSO算法确定... 模糊K-Prototypes(FKP)算法能够对包含数值属性和分类属性相混合的数据集进行有效聚类,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于粒子群优化(PSO)算法和FKP算法的混合聚类算法,先利用PSO算法确定FKP的初始聚类中心,再将PSO聚类结果作为后续FKP算法的初始值。实验结果表明,新算法具有良好的收敛性和稳定性,聚类效果优于单一使用FKP算法。 展开更多
关键词 聚类分析 粒子群优化算法 模糊聚类算法 数值型属性 分类属性 聚类中心
下载PDF
量子遗传算法的模糊K-prototypes聚类 被引量:1
17
作者 叶奇明 梁根 《计算机工程与应用》 CSCD 北大核心 2010年第1期112-115,共4页
聚类分析是数据挖掘中应用最多的一种技术,它在许多领域都有重要应用。模糊h-prototypes算法是当前聚类分析中最有效算法之一,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于量子遗传算法和FKP算法的... 聚类分析是数据挖掘中应用最多的一种技术,它在许多领域都有重要应用。模糊h-prototypes算法是当前聚类分析中最有效算法之一,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于量子遗传算法和FKP算法的混合聚类算法,首先利用量子遗传算法确定FKP的初始聚类中心,再将量子遗传算法聚类结果作为后续FKP算法的初始值。实验结果显示,算法具有良好的收敛性和稳定性,聚类效果优于单一使用FKP算法和相关改进的算法。 展开更多
关键词 聚类算法 量子遗传算法 模糊K-prototypes算法 数值型属性 数据挖掘
下载PDF
基于改进遗传算法的关联挖掘方法研究 被引量:2
18
作者 郑玉柱 李建 李珂 《重庆科技学院学报(自然科学版)》 CAS 2015年第5期72-76,共5页
数值型关联规则挖掘是最优化问题而不是简单的离散问题,在大型数据库中挖掘数值型属性的关联规则具有一定的难度。为解决该问题,提出一种基于改进遗传算法的数据挖掘方法。针对数值型属性和布尔型属性的混合数据,设计一种分类并分界的... 数值型关联规则挖掘是最优化问题而不是简单的离散问题,在大型数据库中挖掘数值型属性的关联规则具有一定的难度。为解决该问题,提出一种基于改进遗传算法的数据挖掘方法。针对数值型属性和布尔型属性的混合数据,设计一种分类并分界的编码方法;适应度函数采取范围收缩的策略,使属性边界向更精确的方向逼近;在此基础上设计出相应的交叉和变异算法,避免遗传算法的局部收敛和早熟问题;最后通过实例检验该算法的可行性。 展开更多
关键词 数据挖掘 关联规则 数值型属性 遗传算法 适应度函数
下载PDF
基于ReliefF算法的模糊聚类新算法 被引量:3
19
作者 张勇 《华南金融电脑》 2009年第1期43-46,共4页
模糊K-Prototype(sFKP)算法能够对数值型数据、分类型数据和混合型数据集进行有效聚类,但是算法假定数值型属性对分类的贡献是相同的。为了考虑样本矢量中各维特征对模式分类的不同影响,本文提出了一种基于特征加权的模糊聚类算法,利用R... 模糊K-Prototype(sFKP)算法能够对数值型数据、分类型数据和混合型数据集进行有效聚类,但是算法假定数值型属性对分类的贡献是相同的。为了考虑样本矢量中各维特征对模式分类的不同影响,本文提出了一种基于特征加权的模糊聚类算法,利用ReliefF算法对特征进行加权选择。 展开更多
关键词 聚类分析 模糊聚类算法 数值型属性 分类属性 特征加权
下载PDF
基于离散小波变换的数据库水印检测算法 被引量:2
20
作者 姜传贤 陈孝威 《控制与决策》 EI CSCD 北大核心 2009年第7期1078-1082,共5页
为了克服空域水印技术的不足,提出一种基于离散小波变换的关系数据库水印算法.根据过滤规则,从关系数据库中抽取某一类的数据,组成二维信号,将水印嵌入到二维信号的小波域中.使用该算法嵌入的数字水印具有很好的隐蔽性,对原始载体的影... 为了克服空域水印技术的不足,提出一种基于离散小波变换的关系数据库水印算法.根据过滤规则,从关系数据库中抽取某一类的数据,组成二维信号,将水印嵌入到二维信号的小波域中.使用该算法嵌入的数字水印具有很好的隐蔽性,对原始载体的影响很小.同时,嵌入的数字水印具有较好的鲁棒性,常规的数据库的处理方法对其影响较弱. 展开更多
关键词 关系数据库水印 离散小波变换 信息检测 数值型属性
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部