期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于事务拆分的超团挖掘算法
1
作者 卓鹏 肖波 蔺志青 《计算机工程》 CAS CSCD 北大核心 2009年第20期62-65,共4页
为发现处在低支持度下的潜在有趣模式,针对传统基于支持度策略的模式发现算法存在的问题,提出一种基于改进Relim算法的超团模式挖掘算法,将一个事务拆分为2个或多个事务,把相同事务进行压缩,并用Relim算法的思想进行超团模式挖掘。仿真... 为发现处在低支持度下的潜在有趣模式,针对传统基于支持度策略的模式发现算法存在的问题,提出一种基于改进Relim算法的超团模式挖掘算法,将一个事务拆分为2个或多个事务,把相同事务进行压缩,并用Relim算法的思想进行超团模式挖掘。仿真实验结果表明,该算法能有效提高超团模式的挖掘效率。 展开更多
关键词 数据挖掘 关联规则 超团模式 事务拆分 Relim算法
下载PDF
一种面向数据流top-k频繁模式发布的差分隐私保护方案 被引量:4
2
作者 梁文娟 陈红 +1 位作者 赵素云 李翠平 《计算机学报》 EI CAS CSCD 北大核心 2021年第4期741-760,共20页
频繁模式挖掘是事务数据分析的常用技术,面向数据流的频繁模式挖掘具有重要的应用价值.然而当事务为敏感信息时,直接发布频繁模式及支持度会导致个体隐私泄露.差分隐私是一种严格且可证明的隐私保护模型,目前虽然已有基于差分隐私的频... 频繁模式挖掘是事务数据分析的常用技术,面向数据流的频繁模式挖掘具有重要的应用价值.然而当事务为敏感信息时,直接发布频繁模式及支持度会导致个体隐私泄露.差分隐私是一种严格且可证明的隐私保护模型,目前虽然已有基于差分隐私的频繁模式发布方案,但它们大都是面向静态数据做一次性发布的隐私保护.本文是面向数据流频繁模式发布的隐私保护,旨在设计一种兼顾可用性和发布效率的持续发布的差分隐私保护方案.与静态发布方案不同,面向数据流的隐私保护处理面临两大挑战:一是持续发布过程中隐私预算的累计消耗会造成发布结果可用性较低;二是候选模式集增大会造成发布结果误差较大和发布效率较低.为解决隐私预算的累计消耗问题,方案设计了满足event级差分隐私的保护机制.该机制可以最大化隐私预算利用率,提高发布结果可用性.为降低候选模式集大小,从而提高发布结果可用性和发布效率,方案首先设计了一种基于模式估计的长事务拆分预处理策略,并对拆分所致的信息丢失率进行了分析和弥补.然后在持续发布阶段,在基于Cantree的挖掘中,先基于支持度阈值对候选模式集进一步缩减.基于缩减后的候选模式集,本文设计了一种蓄水池抽样和指数机制(EM)相结合的持续更新发布策略,该策略通过一遍扫描抽样集,在保证可用性和隐私保护级别的前提下提高了发布效率.最后,理论证明了该方案满足ε-差分隐私,实验结果验证了该方案具有较好的可用性和较高的工作效率. 展开更多
关键词 模式估计 隐私 蓄水池抽样 频繁模式挖掘 事务拆分
下载PDF
大数据量多进程环境下生产者消费者模式实现研究 被引量:3
3
作者 陈勇 《电脑编程技巧与维护》 2015年第24期80-82,共3页
针对在实际项目中出现的大数据量多进程环境下生产者消费者模式应用场景,分析了传统生产者消费者模式实现方案中并行性不高的问题,提出一种改进方案。通过事务拆分,把原先一个必须串行的事务拆分成两个事务,利用数据库多粒度锁的机制以... 针对在实际项目中出现的大数据量多进程环境下生产者消费者模式应用场景,分析了传统生产者消费者模式实现方案中并行性不高的问题,提出一种改进方案。通过事务拆分,把原先一个必须串行的事务拆分成两个事务,利用数据库多粒度锁的机制以减少锁的粒度、增加并行性。实验结果表明,在保证正确性的同时,显著提高了性能。 展开更多
关键词 生产者消费者模式 大数据量 锁的粒度 事务拆分
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部