期刊文献+
共找到462篇文章
< 1 2 24 >
每页显示 20 50 100
一种安全的云存储数据确定性删除方法 被引量:1
1
作者 肜丽 姜明富 《信阳师范学院学报(自然科学版)》 CAS 北大核心 2014年第3期447-450,共4页
为解决云存储中的过期数据导致敏感信息泄漏的问题,提出了一种安全的数据确定性删除方法.该方法首先对文件F进行AON(All or Nothing)加密,将数据密文CF存储到云中,而将数据密文的存根C0与AON密钥参数一起进行广播加密,并将广播密文通过... 为解决云存储中的过期数据导致敏感信息泄漏的问题,提出了一种安全的数据确定性删除方法.该方法首先对文件F进行AON(All or Nothing)加密,将数据密文CF存储到云中,而将数据密文的存根C0与AON密钥参数一起进行广播加密,并将广播密文通过秘密共享算法分布式存储到DHT(Distributed Hash Table)网络中.DHT网络的动态更新将定期删除其中的广播密文,实现了AON密钥参数和存根C0的自动清除.在安全性方面,AON加密和广播加密使该方法能抵抗针对DHT网络中密钥信息的跳跃和嗅探攻击,以及针对数据密文CF的暴力攻击. 展开更多
关键词 云存储 数据确定性删除 跳跃攻击 嗅探攻击 暴力攻击
下载PDF
云数据共享中一种轻量级的数据确定性删除算法 被引量:2
2
作者 闫政伟 王晨 +2 位作者 黄秋波 李丽 徐光伟 《成都大学学报(自然科学版)》 2023年第3期255-261,共7页
云共享环境下,虽然现有的数据确定性删除算法保证了远程存储数据在停止共享后的安全性,但没有考虑到不同数据访问策略之间的差异.不同访问策略可能需要数据拥有者撤销全部属性才能实现数据删除,但大量的计算可能导致数据拥有者无法快速... 云共享环境下,虽然现有的数据确定性删除算法保证了远程存储数据在停止共享后的安全性,但没有考虑到不同数据访问策略之间的差异.不同访问策略可能需要数据拥有者撤销全部属性才能实现数据删除,但大量的计算可能导致数据拥有者无法快速完成数据删除,导致数据仍然能被访问.为此,在现有数据删除算法的基础上提出了一种轻量级的数据确定性删除算法,以降低数据拥有者的删除负担.该算法通过额外设置的关键属性及默克尔哈希树对云共享的数据执行删除和验证操作.实验结果表明,提出的算法是安全且高效的. 展开更多
关键词 云共享 属性加密 数据确定性删除
下载PDF
不确定大数据流分类的决策树模型构建仿真
3
作者 杨知玲 谭树杰 《计算机仿真》 2024年第5期532-535,542,共5页
在不确定大数据流分类过程中,受噪声和孤立点的干扰,导致处理效果和分类精度无法达到预期要求。为解决上述问题,提出一种基于决策树模型的不确定大数据流分类算法。通过采用在线字典学习算法,对不确定大数据流去噪处理,消除噪声对分类... 在不确定大数据流分类过程中,受噪声和孤立点的干扰,导致处理效果和分类精度无法达到预期要求。为解决上述问题,提出一种基于决策树模型的不确定大数据流分类算法。通过采用在线字典学习算法,对不确定大数据流去噪处理,消除噪声对分类过程产生的干扰。构建决策树,在剪枝过程中通过特征过滤算法,滤除不确定大数据流中掺杂的孤立点。将去噪后的不确定大数据流,输入决策树模型中,完成分类工作。实验结果表明,所提算法处理后的不确定大数据流振幅明显减小,且分类精度高,具有一定的应用价值。 展开更多
关键词 决策树模型 在线字典学习算法 特征过滤 确定数据 数据分类
下载PDF
基于最小二乘孪生支持向量机的不确定数据学习算法 被引量:1
4
作者 刘锦能 肖燕珊 刘波 《广东工业大学学报》 CAS 2024年第1期79-85,共7页
孪生支持向量机通过计算2个二次规划问题,得到2个不平行的超平面,用于解决二分类问题。然而在实际的应用中,数据通常包含不确定信息,这将会对构建模型带来困难。对此,提出了一种用于求解带有不确定数据的最小二乘孪生支持向量机模型。首... 孪生支持向量机通过计算2个二次规划问题,得到2个不平行的超平面,用于解决二分类问题。然而在实际的应用中,数据通常包含不确定信息,这将会对构建模型带来困难。对此,提出了一种用于求解带有不确定数据的最小二乘孪生支持向量机模型。首先,对于每个实例,该方法都分配一个噪声向量来构建噪声信息。其次,将噪声向量结合到最小二乘孪生支持向量机,并在训练阶段得到优化。最后,采用一个2步循环迭代的启发式框架求解得到分类器和更新噪声向量。实验表明,跟其他对比方法比较,本方法采用噪声向量对不确定信息进行建模,并将孪生支持向量机的二次规划问题转化为线性方程,具有更好的分类精度和更高的训练效率。 展开更多
关键词 最小二乘 孪生支持向量机 不平行平面学习 数据确定 分类
下载PDF
面向多源不确定性数据的往复压缩机决策级融合诊断方法
5
作者 张宇婷 段礼祥 +1 位作者 李兴涛 张馨月 《中国安全生产科学技术》 CAS CSCD 北大核心 2024年第9期112-119,共8页
为解决不确定性高的数据源使多源信息融合诊断模型精度降低的问题,提出1种面向不确定性数据的往复压缩机决策融合诊断方法。构建基于GRU-AlexNet网络的初步诊断模型,得到往复压缩机各传感器信号的初始诊断结果,并引入余弦相似度与置信... 为解决不确定性高的数据源使多源信息融合诊断模型精度降低的问题,提出1种面向不确定性数据的往复压缩机决策融合诊断方法。构建基于GRU-AlexNet网络的初步诊断模型,得到往复压缩机各传感器信号的初始诊断结果,并引入余弦相似度与置信熵的概念构建联合指标改进传统DS证据理论,结合初步诊断结果进行多源信号决策融合诊断。研究结果表明:在对往复压缩机故障的加速度、位移、压力信号(不确定性数据)融合诊断试验中,融合诊断准确率高达99.98%,相较于单一信号源诊断结果分别提高约9.27,5.13,48.30个百分点。该方法可在较大程度上降低不确定性信息对于融合诊断结果的影响,具有良好的容错性与稳定性,可有效提高往复压缩机使用过程中各类故障识别的准确性,进而提高设备的稳定性,保证其良好工作状态。研究结果对保障相关企业安全生产、提高设备产出能力具有重要参考意义。 展开更多
关键词 往复压缩机 智能诊断 确定数据 多源信息融合 DS证据理论
下载PDF
基于神经网络的不确定性数据流异常检测系统设计
6
作者 向权舟 关宇洋 +2 位作者 江海 杨海峰 祝海峰 《电子设计工程》 2024年第12期81-85,共5页
受非线性变化数据影响,导致数据流异常检测结果不精准,为此设计了基于神经网络的不确定性数据流异常检测系统。采集时间窗口数据,计算离散值,将计算结果存入综合数据库。提取不确定性数据流异常特征,结合神经网络检测数据流异常情况。... 受非线性变化数据影响,导致数据流异常检测结果不精准,为此设计了基于神经网络的不确定性数据流异常检测系统。采集时间窗口数据,计算离散值,将计算结果存入综合数据库。提取不确定性数据流异常特征,结合神经网络检测数据流异常情况。构建原始数据流序列和不确定性数据流序列,并以此为基础构建检测模型。引入递推算法,结合Lasso回归分析方法剔除非线性变化数据,分析不确定性数据的异常特性,通过神经网络锁定异常数据流,获取检测结果。由实验结果可知,该系统可将数据拟合在理想值附近,且样本数据在实际值上下限范围内,能够获取精准的检测结果。 展开更多
关键词 神经网络 确定数据 异常检测 Lasso回归 递推算法
下载PDF
不确定性数据管理技术研究综述 被引量:185
7
作者 周傲英 金澈清 +1 位作者 王国仁 李建中 《计算机学报》 EI CSCD 北大核心 2009年第1期1-16,共16页
随着数据采集和处理技术的进步,人们对数据的不确定性的认识也逐步深入.在诸如经济、军事、物流、金融、电信等领域的具体应用中,数据的不确定性普遍存在.不确定性数据的表现形式多种多样,它们可以以关系型数据、半结构化数据、流数据... 随着数据采集和处理技术的进步,人们对数据的不确定性的认识也逐步深入.在诸如经济、军事、物流、金融、电信等领域的具体应用中,数据的不确定性普遍存在.不确定性数据的表现形式多种多样,它们可以以关系型数据、半结构化数据、流数据或移动对象数据等形式出现.目前,根据应用特点与数据形式差异,研究者已经提出了多种针对不确定数据的数据模型.这些不确定性数据模型的核心思想都源自于可能世界模型.可能世界模型从一个或多个不确定的数据源演化出诸多确定的数据库实例,称为可能世界实例,而且所有实例的概率之和等于1.尽管可以首先分别为各个实例计算查询结果,然后合并中间结果以生成最终查询结果,但由于可能世界实例的数量远大于不确定性数据库的规模,这种方法并不可行.因此,必须运用排序、剪枝等启发式技术设计新型算法,以提高效率.文中介绍了不确定性数据管理技术的概念、特点与挑战,综述了数据模型、数据预处理与集成、存储与索引、查询处理等方面的工作. 展开更多
关键词 确定数据 可能世界模型 数据集成 世系 确定数据
下载PDF
不确定数据查询处理 被引量:21
8
作者 蒋涛 高云君 +2 位作者 张彬 周傲英 乐光学 《电子学报》 EI CAS CSCD 北大核心 2013年第5期966-976,共11页
数据的不确定性在现实世界中的经济、军事、物流、金融、电信等领域普遍存在.不确定数据广泛应用于环境维护、市场分析、基于位置的服务LBS以及数量经济研究等应用.由于这些应用的重要性以及收集和累积的不确定数据数量的快速增长,查询... 数据的不确定性在现实世界中的经济、军事、物流、金融、电信等领域普遍存在.不确定数据广泛应用于环境维护、市场分析、基于位置的服务LBS以及数量经济研究等应用.由于这些应用的重要性以及收集和累积的不确定数据数量的快速增长,查询这些数据已经成为一个重要的任务,并日益受到广大数据库研究者的关注.本文介绍了不确定数据查询的基本原理,并对不确定数据的近邻查询、逆向近邻查询、排序查询、Top-k查询以及连接查询进行了详细的讨论.同时对这些技术的优缺点进行了分析、对比.最后给出了未来的研究方向. 展开更多
关键词 确定数据 近邻 逆向近邻 连接 查询处理
下载PDF
不确定数据频繁项集挖掘方法综述 被引量:19
9
作者 汪金苗 张龙波 +2 位作者 邓齐志 王凤英 王勇 《计算机工程与应用》 CSCD 北大核心 2011年第20期121-125,共5页
近几年来,不确定数据广泛出现在传感器网络、Web应用等领域中。不确定数据挖掘已经成为了新的研究热点,主要包括聚类、分类、频繁项集挖掘、孤立点检测等方面,其中频繁项集挖掘是重点研究的问题之一。综述了传统的频繁项集挖掘的两类基... 近几年来,不确定数据广泛出现在传感器网络、Web应用等领域中。不确定数据挖掘已经成为了新的研究热点,主要包括聚类、分类、频繁项集挖掘、孤立点检测等方面,其中频繁项集挖掘是重点研究的问题之一。综述了传统的频繁项集挖掘的两类基本算法,分析了在此基础上提出的适用于不确定数据以及不确定数据流的频繁项集挖掘的方法,并探讨了今后可能的研究方向。 展开更多
关键词 确定数据 频繁项集 数据挖掘
下载PDF
基于不确定数据的频繁项查询算法 被引量:10
10
作者 王爽 杨广明 朱志良 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第3期344-347,共4页
频繁项的查询是一项非常重要的技术,但在新兴的不确定数据领域却是一项新的研究课题.基于不确定数据,提出了一种新的频繁项定义,并提出了两条过滤规则,可以有效地减少检测数据的数量.最后提出高效的频繁项查询算法UFI,该算法通过找到概... 频繁项的查询是一项非常重要的技术,但在新兴的不确定数据领域却是一项新的研究课题.基于不确定数据,提出了一种新的频繁项定义,并提出了两条过滤规则,可以有效地减少检测数据的数量.最后提出高效的频繁项查询算法UFI,该算法通过找到概率求解中的递推规律,极大提高了单点检测效率.实验结果显示:提出的方法可以有效地减少候选集,降低搜索空间,改善在不确定数据上的查询性能. 展开更多
关键词 频繁项 确定数据 剪枝规则 确定数据模型 查询处理
下载PDF
不确定数据查询技术研究 被引量:17
11
作者 王意洁 李小勇 +1 位作者 祁亚斐 孙伟东 《计算机研究与发展》 EI CSCD 北大核心 2012年第7期1460-1466,共7页
当前不确定数据广泛存在于诸如传感器网络、RFID网络、基于位置服务以及移动对象管理等各种现实的不确定性应用中.不确定数据查询作为不确定数据管理的重要组成部分,在信息检索、数据挖掘、决策制定和环境监控等众多应用中发挥重要作用... 当前不确定数据广泛存在于诸如传感器网络、RFID网络、基于位置服务以及移动对象管理等各种现实的不确定性应用中.不确定数据查询作为不确定数据管理的重要组成部分,在信息检索、数据挖掘、决策制定和环境监控等众多应用中发挥重要作用,目前已成为数据库和网络计算等领域的一个研究热点.从目前不确定数据查询研究的各种查询类型介绍和查询特点分析出发,主要综述了4种典型的不确定数据查询类型,即不确定Skyline查询、不确定Top-k查询、不确定最近邻(NN)查询以及不确定聚集查询;重点论述了各种不确定数据查询的定义,各类查询的特点,并分类介绍了当前各类不确定数据查询研究的现状和各种查询方法的优缺点;最后,基于当前不确定数据查询技术的最新研究动态指出了未来研究工作的趋势. 展开更多
关键词 确定数据 查询 SKYLINE TOP-K 最近邻 聚集 数据 概率
下载PDF
障碍空间中不确定数据聚类算法 被引量:11
12
作者 曹科研 王国仁 +3 位作者 韩东红 袁野 胡雅超 齐宝雷 《计算机科学与探索》 CSCD 2012年第12期1087-1097,共11页
近些年,由于数据采集的不精确和数据本身的不确定性,使不确定性在位置数据中普通存在。在障碍空间中,聚类不确定数据面临新的挑战。提出了障碍空间中聚类不确定数据的OBS-UK-means(obstacle uncertain K-means)算法,并提出了分别基于R树... 近些年,由于数据采集的不精确和数据本身的不确定性,使不确定性在位置数据中普通存在。在障碍空间中,聚类不确定数据面临新的挑战。提出了障碍空间中聚类不确定数据的OBS-UK-means(obstacle uncertain K-means)算法,并提出了分别基于R树和Voronoi图的两种剪枝策略和最近距离区域的概念,大大减少了计算量。通过实验验证了OBS-UK-means算法的高效性和准确性,同时证明了剪枝策略在不损害聚类有效性的情况下,能够有效地提高聚类效率。 展开更多
关键词 聚类 确定数据 障碍空间
下载PDF
UIDK-means:多维不确定性测量数据聚类算法 被引量:18
13
作者 彭宇 罗清华 彭喜元 《仪器仪表学报》 EI CAS CSCD 北大核心 2011年第6期1201-1207,共7页
在网络化测试测量信息体系的不确定性测量数据聚类方法研究中,普遍假定测量数据的概率密度函数或者概率分布函数等信息是已知的,这与实际应用系统中这些信息难以获取的情况是相悖的,鉴于此,利用区间数的方法,结合测量数据的统计值来合... 在网络化测试测量信息体系的不确定性测量数据聚类方法研究中,普遍假定测量数据的概率密度函数或者概率分布函数等信息是已知的,这与实际应用系统中这些信息难以获取的情况是相悖的,鉴于此,利用区间数的方法,结合测量数据的统计值来合理地表示多维不确定性测试测量数据,并采用低计算复杂度的不确定性数据距离计算方法,提出一种基于区间数的多维不确定性数据聚类方法——UIDK-means。实验结果表明,该方法具有较高的聚类精度和较低的计算复杂度。 展开更多
关键词 确定数据 确定数据挖掘 聚类算法
下载PDF
满足均匀分布的不确定数据关联规则挖掘算法 被引量:18
14
作者 陈爱东 刘国华 +3 位作者 费凡 周宇 万小妹 貟慧 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期186-195,共10页
云计算为大数据提供了展示和共享的平台.为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,如何挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布... 云计算为大数据提供了展示和共享的平台.为了防止隐私泄露,这些数据中往往包含人为添加的不确定因素,如何挖掘这些不确定数据是大数据共享亟待解决的问题.在用于共享的大数据中,不确定数据通过对精确数据的泛化处理来实现,具有均匀分布特性,这一特性不利于精确查询,但可为关联规则的挖掘提供便利条件.首先,依据泛化值之间可能的相交或包含关系,将泛化值进行分层聚类,为了保存与不确定数据集挖掘相关的重要信息,给出了构建不确定频繁模式树的算法,在此基础上,提出了频繁项集挖掘子算法(data mining algorithm for uncertain frequent item-sets,UFI-DM)和关联规则生成子算法(algorithm for generating association rules,GAR),分别用于挖掘频繁项集和生成关联规则,最后,通过理论分析和实验比对,论证了算法的可行性和有效性. 展开更多
关键词 数据 均匀分布不确定数据 数据挖掘 关联规则 频繁项集
下载PDF
不确定性数据流上频繁项集挖掘的有效算法 被引量:14
15
作者 刘殷雷 刘玉葆 陈程 《计算机研究与发展》 EI CSCD 北大核心 2011年第S3期1-7,共7页
在很多应用中,不确定性数据都是以流的形式产生,例如传感器网络数据,移动对象跟踪数据等等.已有的基于不确定性数据流的频繁项集挖掘算法往往具有数据流储存结构繁琐、维护困难以及算法的计算量大等缺点.针对这种情况,提出了一种有效的... 在很多应用中,不确定性数据都是以流的形式产生,例如传感器网络数据,移动对象跟踪数据等等.已有的基于不确定性数据流的频繁项集挖掘算法往往具有数据流储存结构繁琐、维护困难以及算法的计算量大等缺点.针对这种情况,提出了一种有效的数据结构SRUF-tree用于储存不确定性数据事务流的项集,该结构由全局树SRtree、临时表Table和窗口队列Queue三部分组成,其中全局树压缩着最近窗口容纳的所有的项集,临时表存储着每批项集的信息.基于该结构设计了一种新的算法SRUF-mine,它挖掘流频繁项集时只需要深度遍历全局树,动态维护SRUF-tree结构只需要处理窗口队列中最旧一批项集的临时表.理论和实验结果表明,SRUF-mine算法是一种有效的挖掘不确定性数据流频繁项集的算法,时空效率和扩展性均优于UF-streaming算法. 展开更多
关键词 确定数据 数据 频繁项集
下载PDF
不确定数据的决策树分类算法 被引量:12
16
作者 李芳 李一媛 王冲 《计算机应用》 CSCD 北大核心 2009年第11期3092-3095,共4页
经典决策树算法不能处理树构建和分类过程中的不确定数据。针对这一局限,将可用于不确定数据表达的证据理论与决策树分类算法相结合,把决策树分类技术扩展到含有不确定数据的环境中。为避免在决策树构建过程中出现组合爆炸问题,引入新... 经典决策树算法不能处理树构建和分类过程中的不确定数据。针对这一局限,将可用于不确定数据表达的证据理论与决策树分类算法相结合,把决策树分类技术扩展到含有不确定数据的环境中。为避免在决策树构建过程中出现组合爆炸问题,引入新的测量算子和聚集算子,提出了D-S证据理论决策树分类算法。实验结果表明,D-S证据理论决策树分类算法能有效地对不确定数据进行分类,有较好的分类准确度,并能有效避免组合爆炸。 展开更多
关键词 决策树 确定数据 证据理论 数据挖掘 分类
下载PDF
不确定数据聚类的U-PAM算法和UM-PAM算法的研究 被引量:7
17
作者 何云斌 张志超 +1 位作者 万静 李松 《计算机科学》 CSCD 北大核心 2016年第6期263-269,共7页
UK-means算法在处理不确定数据时对孤立点非常敏感,而且事先必须已知不确定数据的分布函数或概率密度,然而这在实际中往往很难获得。因此,针对UK-means在处理不确定测量数据时的不足,首先提出了基于区间数的PAM不确定聚类算法——U-PAM... UK-means算法在处理不确定数据时对孤立点非常敏感,而且事先必须已知不确定数据的分布函数或概率密度,然而这在实际中往往很难获得。因此,针对UK-means在处理不确定测量数据时的不足,首先提出了基于区间数的PAM不确定聚类算法——U-PAM,该算法用区间数和标准差合理地描述了不确定测量数据的不确定性,进而完成有效的聚类;其次,针对海量不确定测量数据难以聚类的问题,基于U-PAM聚类算法,采用抽样技术提出了处理海量不确定测量数据的算法——UM-PAM算法,该算法先抽样,对样本数据聚类,然后再总体聚类;最后,基于UPAM算法和CH聚类的有效性指标函数对聚类结果进行分析,以确定最佳聚类数。实验理论表明,所提算法聚类效果明显。关键词不确定数据,区间数,聚类算法,PAM算法和 CH 聚类的有效性指标函数对聚类结果进行分析,以确定最佳聚类数。实验理论表明,所提算法聚类效果明显。 展开更多
关键词 确定数据 区间数 聚类算法 PAM
下载PDF
一种不确定数据流聚类算法 被引量:33
18
作者 张晨 金澈清 周傲英 《软件学报》 EI CSCD 北大核心 2010年第9期2173-2182,共10页
提出了EMicro算法,以解决不确定数据流上的聚类问题.与现有技术大多仅考虑元组间的距离不同,EMicro算法综合考虑了元组之间的距离与元组自身不确定性这两个因素,同时定义新标准来描述聚类结果质量.还提出了离群点处理机制,系统同时维护... 提出了EMicro算法,以解决不确定数据流上的聚类问题.与现有技术大多仅考虑元组间的距离不同,EMicro算法综合考虑了元组之间的距离与元组自身不确定性这两个因素,同时定义新标准来描述聚类结果质量.还提出了离群点处理机制,系统同时维护两个缓冲区,分别存放正常的微簇与潜在的离群点微簇,以期得到理想的性能.实验结果表明,与现有工作相比,EMicro的效率更高,且效果良好. 展开更多
关键词 确定数据 聚类 离群点
下载PDF
在不确定数据集上挖掘优化的概率干预策略 被引量:6
19
作者 王悦 唐常杰 +4 位作者 杨宁 张悦 李红军 郑皎凌 朱军 《软件学报》 EI CSCD 北大核心 2011年第2期285-297,共13页
提出了不确定干预分析模型,主要工作包括:(1)建立了用于多维不确定数据分析的不确定监测点模型(uncertain surveillance);(2)建立了基于不确定监测点的不确定干预策略及挖掘评价算法;(3)在真实数据及仿真数据上对所提出的两种算法作了... 提出了不确定干预分析模型,主要工作包括:(1)建立了用于多维不确定数据分析的不确定监测点模型(uncertain surveillance);(2)建立了基于不确定监测点的不确定干预策略及挖掘评价算法;(3)在真实数据及仿真数据上对所提出的两种算法作了大量实验比较,验证了所提出的干预策略评价优化算法具有较高精度,效率比朴素方法高出3个数量级,适合在实际系统中处理海量干预评价. 展开更多
关键词 确定数据 概率干预策略 策略评价 数据挖掘 海量数据分析
下载PDF
基于模式增长的不确定数据的频繁模式挖掘算法 被引量:7
20
作者 王乐 常艳芬 王水 《计算机应用》 CSCD 北大核心 2015年第7期1921-1926,共6页
为提高不确定数据频繁模式(FP)挖掘算法的时空效率,提出了基于最大概率的不确定频繁模式挖掘(UFPM-MP)算法。首先,利用事务项集中的最大概率值预估期望支持数;然后,使用该期望支持数与最小期望支持数阈值进行比较,以确定某一项集是... 为提高不确定数据频繁模式(FP)挖掘算法的时空效率,提出了基于最大概率的不确定频繁模式挖掘(UFPM-MP)算法。首先,利用事务项集中的最大概率值预估期望支持数;然后,使用该期望支持数与最小期望支持数阈值进行比较,以确定某一项集是否为候选频繁项集,并对候选项集建立子树以递归挖掘频繁模式。实验中,UFPMMP算法与AT-Mine算法进行了对比,并在6个典型的数据集上进行实验验证。实验结果表明,UFPM-MP算法的时空效率得到了提高,稀疏数据集上提高约30%,稠密数据集上的效率提高更为明显(约3~4倍)。预估期望支持数的策略有效地减少了子树和头表项的数量,从而提高了算法的时空效率;且最小期望支持数越小,或需要挖掘的频繁模式越多的时候,算法的时间效率提高越多。 展开更多
关键词 确定数据 频繁模式 频繁项集 模式增长
下载PDF
上一页 1 2 24 下一页 到第
使用帮助 返回顶部