-
题名基于FP-Tree的反向频繁项集挖掘
被引量:20
- 1
-
-
作者
郭宇红
童云海
唐世渭
杨冬青
-
机构
北京大学计算机科学技术系
北京大学视觉与听觉信息处理国家重点实验室
-
出处
《软件学报》
EI
CSCD
北大核心
2008年第2期338-350,共13页
-
基金
Supported by the National Natural Science Foundation of China under Grant No.60403041 (国家自然科学基金)
-
文摘
在拓展现有反向频繁挖掘问题定义,探索反向频繁项集的3个具体应用后,提出了一种基于FP-tree的反向频繁项集挖掘方法.该方法首先采用分治思想,将目标约束划分为若干子约束,每步求解一个子线性约束问题,经过若干步迭代后找到一个满足整个给定约束的目标FP-tree;然后根据目标FP-tree生成一个仅含频繁项的临时事务数据库TempD;最后通过向TempD中撒入非频繁项得到目标数据集.理论分析和实验表明该方法是正确的、高效的,且与现有方法仅能输出1个目标数据集相比,该方法能够输出较多的目标数据集.
-
关键词
反向挖掘
FP树
频繁项集
隐私保护
知识隐藏
-
Keywords
inverse mining
FP-tree
frequent itemset
privacy preserving
knowledge hiding
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名隐私保护频繁项集挖掘中的分组随机化模型
被引量:4
- 2
-
-
作者
郭宇红
童云海
-
机构
国际关系学院信息科技学院
北京大学智能科学系
-
出处
《华侨大学学报(自然科学版)》
CAS
北大核心
2020年第2期230-236,共7页
-
基金
国际关系学院中央高校基本科研业务费专项资金资助项目(3262017T48,3262018T02)。
-
文摘
通过对隐私保护频繁项集挖掘问题的研究,发现现有的单参数随机化回答模型调控的数据范围宽、粒度粗,导致无法实现精细化、差异化的隐私保护的问题.在沃纳模型、单参数等随机化模型的基础上,提出个体分组多参随机化PN/g模型,给出其在隐私保护频繁项集挖掘中的支持度重构方法.研究结果表明:该模型面向多样化、差异化的隐私保护需求,将N个不同个体分为若干组,每组设置不同的随机化参数,可实现差异化的隐私保护效果.实例分析表明:结合所提出的支持度重构方法,可实现基于分组随机化的隐私保护频繁项集挖掘,在保护不同群体隐私的同时,挖掘到有效的频繁项集与关联规则.
-
关键词
随机化回答
隐私保护
频繁项集
支持度重构
数据挖掘
沃纳模型
-
Keywords
randomized response
privacy preserving
frequent item set
support reconstruction
data mining
Warner model
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名近似反频繁集挖掘可计算复杂度分析与研究
- 3
-
-
作者
吕品
董武世
-
机构
武汉工程大学计算机科学与工程学院
湖北师范学院计算机系
-
出处
《计算机工程与应用》
CSCD
北大核心
2006年第24期179-180,186,共3页
-
基金
:湖北省自然科学基金资助项目(编号:2004ADA023)
-
文摘
数据挖掘作为应用于数据分析的工具,往往会从大型数据库中毫无保留地揭露某些重要信息,这些重要信息由于一定的原因不能向外界透露。所以可以通过构造具有与原始的频繁集一样的特征的虚拟数据集来替代频繁集挖掘结果。文章给出了一种近似的反频繁集挖掘方法,分析了它的可计算复杂度,得出了近似反频繁集挖掘是一个NP完全问题,提出了近似的反频繁集挖掘的下一步研究重点。
-
关键词
隐私保持
反频繁集挖掘
近似性
-
Keywords
preserve privacy,inverse frequent set mining,apporximation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名反频繁集挖掘可计算复杂性问题研究
- 4
-
-
作者
吕品
陈年生
董武世
-
机构
武汉工程大学计算机科学与工程学院
湖北师范学院计算机系
-
出处
《计算机技术与发展》
2006年第4期25-27,共3页
-
基金
湖北省自然科学基金资助项目(2004ADA023)
-
文摘
频繁集挖掘是总结二进制数据的重要技术,但如何找到一个二进制数据集与频繁集挖掘结果相一致却十分困难。文中从可计算复杂度的观点研究了频繁集的隐私保持。特别分析了反频繁挖掘问题的可计算复杂度。给出了决定是否存在与一个已知频繁集兼容的数据集是一个NP难度问题;当原始数据集d由6个集合组成时计算与已知频繁集兼容的数据集的数量是一个P类完全问题。
-
关键词
反频繁集挖掘
隐私保持
投影
-
Keywords
inverse frequent set mining
preserve privacy
projection
-
分类号
TP301.5
[自动化与计算机技术—计算机系统结构]
-
-
题名隐私保护的一站多表跨多表频繁项集挖掘
被引量:1
- 5
-
-
作者
林瑞
钟诚
华蓓
-
机构
广西大学计算机与电子信息学院
-
出处
《计算机应用》
CSCD
北大核心
2013年第12期3437-3440,共4页
-
基金
广西自然科学基金资助项目(2011GXNSFA018152)
-
文摘
从多方合作挖掘分布存储在不同计算站点上多个数据库表而不泄露各方原始数据信息的目的出发,对于每个站点拥有多个数据表的分布式计算环境,基于三方安全协议,运用生成随机数扰乱方法,采取各站点并行挖掘频繁项集,将站点间各表数据公共连接属性作等值连接,以安全协议计算全局站间跨表频繁项集支持数的策略,提出了一站多表的3站点跨多表频繁项集挖掘隐私保护算法。实验结果表明,该算法在高效地联合挖掘出跨多表频繁项集的同时保护了各站点的敏感信息。
-
关键词
跨表挖掘
频繁项集
并行挖掘
隐私保护
多方安全协议
-
Keywords
cross multi-table mining
frequent item set
parallel mining
privacy preserving
secure multi-party protocol
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-