-
题名基于本地化差分隐私保护的频繁项目挖掘算法
被引量:2
- 1
-
-
作者
朱美琪
杨庚
白云璐
-
机构
南京邮电大学计算机学院、网络空间安全学院
江苏省大数据安全和智能处理重点实验室
南京市医药大学信息技术学院
-
出处
《计算机技术与发展》
2021年第8期92-99,168,共9页
-
基金
国家自然科学基金项目(61872197,61972209)。
-
文摘
频繁项目挖掘是数据挖掘的研究热点之一,若数据集包含敏感信息,不作处理地发布挖掘结果会有隐私泄露的风险。目前已有本地化差分隐私的频繁项目挖掘算法,但还无法满足处理大数据时的实时性和数据可用性要求。针对这些问题,该文提出了一种新的面向本地化差分隐私保护的频繁项目挖掘算法—GFIM(group-based frequent items mining)。该算法把用户随机划分为不相交且大小相等的两组用户,整个运行过程分为两个阶段。第一阶段主要根据全部用户提交的信息挖掘出频繁项目的候选集C,而在第二阶段,两组用户分别通过设置冗余项把自身修剪为O(k)发送给数据收集者,最终的top-k频繁项目将利用上述两个阶段的结果。采用分阶段的思想减少了计算时遍历数据集的次数,加快了整体的运行速度。通过理论证明了该算法满足ε-本地化差分隐私,在多个真实数据集上的实验也验证了该方法的性能。
-
关键词
频繁项目挖掘
本地化差分隐私
集值数据
隐私保护
随机响应
-
Keywords
frequent items mining
local differential privacy
set-valued data
privacy protection
randomized response
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-