一种满足差分隐私的图赌博机算法被引量：1

Differentially Private Algorithm for Graphical Bandits

下载PDF

导出

摘要图赌博机是一种重要的不确定性环境下的序列决策模型,在社交网络、电子商务和推荐系统等领域都得到了广泛的应用.目前,针对图赌博机的工作都只关注如何快速识别最优摇臂从而最小化累积遗憾,而忽略了在很多应用场景中存在的隐私保护问题.为了克服现有图赌博机算法的缺陷,提出了一种满足差分隐私的图赌博机算法GAP(图反馈下的差分隐私摇臂消除策略).一方面,GAP算法阶段性地根据摇臂的经验平均奖赏更新摇臂选取策略,并在计算摇臂的经验平均奖赏时引入拉普拉斯噪声,从而确保恶意攻击者难以根据算法输出推算摇臂奖赏数据,保护了隐私.另一方面,GAP算法在每个阶段根据精心构造的反馈图的独立集探索摇臂集合,有效地利用了图形式的反馈信息.证明了GAP算法满足差分隐私性质,具有与理论下界相匹配的遗憾界.在仿真数据集上的实验结果表明:GAP算法在有效保护隐私的同时取得了与现有无隐私保护的图赌博机算法相当的累积遗憾. Graphical bandit is an important model for sequential decision making under uncertainty and has been applied in various realworld scenarios such as social network, electronic commerce, and recommendation system. Existing work on graphical bandits only investigates how to identify the best arm rapidly so as to minimize the cumulative regret while ignoring the privacy protection issue arising in many real-world applications. To overcome this deficiency, a differentially private algorithm is proposed, termed as graph-based arm elimination with differential privacy(GAP), for graphical bandits. On the one hand, GAP updates the arm selection strategy based on empirical mean rewards of arms in an epoch manner. The empirical mean rewards are perturbed by Laplace noise, which makes it hard for malicious attackers to infer rewards of arms from the output of the algorithm, and thus protects the privacy. On the other hand, in each epoch, GAP carefully constructs an independent set of the feedback graph and only explores arms in the independent set, which effectively utilize the information in the graph feedback. It is proved that GAP is differential private and its regret bound matches the theoretical lower bound. Experimental results on synthetic datasets demonstrate that GAP can effectively protect the privacy and achieve cumulative regret comparable to that of existing non-private graphical bandits algorithm.

作者卢世银王广辉邱梓豪张利军 LU Shi-Yin;WANG Guang-Hui;QIU Zi-Hao;ZHANG Li-Jun(State Key Laboratory for Novel Software Technology(Nanjing University),Nanjing 210023,China)

机构地区计算机软件新技术国家重点实验室(南京大学)

出处《软件学报》 EI CSCD 北大核心 2022年第9期3223-3235,共13页 Journal of Software

基金国家自然科学基金(61976112) 江苏省自然科学基金(BK20200064)。

关键词图赌博机差分隐私不确定性环境下的序列决策独立集拉普拉斯噪声 graphical bandits differential privacy sequential decision making under uncertainty independent set Laplace noise

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献4

1王黎明,黄厚宽,柴玉梅.基于信任和K臂赌博机问题选择多问题协商对象[J].软件学报,2006,17(12):2537-2546. 被引量：14
2叶青青,孟小峰,朱敏杰,霍峥.本地化差分隐私研究综述[J].软件学报,2018,29(7):1981-2005. 被引量：68
3张啸剑,王淼,孟小峰.差分隐私保护下一种精确挖掘top-k频繁模式方法[J].计算机研究与发展,2014,51(1):104-114. 被引量：29
4王金艳,刘陈,傅星珵,罗旭东,李先贤.差分隐私的数据流关键模式挖掘方法[J].软件学报,2019,30(3):648-666. 被引量：11

二级参考文献25

1郭庆,陈纯.基于整合效用的多议题协商优化[J].软件学报,2004,15(5):706-711. 被引量：27
2Agrawal R, Srikant R. Fast algorithms for mining association rules in large databases [C]//Proc of the 20th Int Conf on Very Large Data Bases (VLDB'94). New York: ACM, 1994: 487-499.
3Sweeney L. k-anonymity: A model for protecting privacy [J]. International Journal on Uncertainty, Fuzziness and Knowledge-based Systems, 2002, 10(5): 557-570.
4Atzori M, Bonchi F, Giannotti F, et al. Anonymity preserving pattern discovery [J]. The VLDB Journal, 2008, 17(4) : 703-727.
5Ganta S R, Kasiviswanathan S P, Smith A. Composition attacks and auxiliary information in data privacy [C]//Proc of the 14th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining (KDD08). New York: ACM, 2008: 265- 273.
6WongR C W, Fu A, Wang K, et al. Can the utility of anonymi:ed data be used for privacy breaches[J]. ACM Trans on Knowledge Discovery from Data, 2011, 5(3) : 16- 39.
7Dwork C. Differential privacy [C] //Proc of the 33th Colloquium on Automata, Languages and Programming (ICALP06). Berlin: Springer, 2006:1-12.
8Dwork C. Differential privacy: A survey of results [C] // Proc of the 5th Int Conf on Theory and Applications of Models of Computation (TAMC08). Berlin: Springer, 2008: 1-19.
9Dwork C, Lei J. Differential privacy and robust statistics [C] //Proc of the 41st Annual ACM Syrup on Theory of Computing (STOC09). New York: ACM, 2009:371-380.
10Dwork C. The differential privacy frontier (extended abstract)[C] //Proe of the 6th Theory of Cryptography Conf (TCC09). Berlin: Springer, 2009:496-502.

共引文献115

1刘丹青,高瑜,吴振强.基于距离贡献率的隐私保护框架下k-medoids算法研究[J].青海师范大学学报（自然科学版）,2022,38(1):4-13.
2孟小峰,王雷霞,刘俊旭.人工智能时代的数据隐私、垄断与公平[J].大数据,2020,6(1):35-46. 被引量：16
3孙慧中,杨健宇,程祥,苏森.一种基于随机投影的本地差分隐私高维数值型数据收集算法[J].大数据,2020,6(1):3-11. 被引量：4
4马彦,刘莉,杨金霞,蔡军卫,田中彬.基于Agent的双边多议题协商算法[J].计算机工程与应用,2008,44(1):216-218. 被引量：1
5资武成.一种基于信任的多Agent供应链协商关系网[J].计算机工程与应用,2008,44(21):245-248. 被引量：1
6王黎明,李琨.基于GAI多属性依赖的协商模型[J].模式识别与人工智能,2008,21(5):569-576. 被引量：6
7程昱,高济,古华茂,傅朝阳.基于机器学习的自动协商决策模型[J].软件学报,2009,20(8):2160-2169. 被引量：17
8童向荣,黄厚宽,张伟.一种基于案例的Agent多议题协商模型[J].计算机研究与发展,2009,46(9):1508-1514. 被引量：9
9赵翔,黄厚宽,邵羽中.基于Agent信任机制的一体化协商研究[J].北京交通大学学报,2009,33(5):95-98. 被引量：1
10柴玉梅,谷明,王黎明.基于效用图的依赖关系与协商策略研究[J].计算机工程与设计,2010,31(3):586-590. 被引量：3

同被引文献15

1王金艳,刘陈,傅星珵,罗旭东,李先贤.差分隐私的数据流关键模式挖掘方法[J].软件学报,2019,30(3):648-666. 被引量：11
2张啸剑,付楠,孟小峰.基于本地差分隐私的键-值数据精确收集方法[J].计算机学报,2020,43(8):1479-1492. 被引量：5
3方晨,郭渊博,王娜,甄帅辉,唐国栋.基于生成对抗网络的差分隐私数据发布方法[J].电子学报,2020,48(10):1983-1992. 被引量：10
4陈思,付安民,柯海峰,苏铓,孙怀江.MCDP:基于神经网络的多集群分布式差分隐私数据发布方法[J].电子学报,2020,48(12):2297-2303. 被引量：9
5田丰,吴振强,鲁来凤,刘海,桂小林.面向轨迹数据发布的个性化差分隐私保护机制[J].计算机学报,2021,44(4):709-723. 被引量：14
6梁文娟,陈红,赵素云,李翠平.一种面向数据流top-k频繁模式发布的差分隐私保护方案[J].计算机学报,2021,44(4):741-760. 被引量：6
7陆佳炜,吴涵,张元鸣,梁倩卉,肖刚.融合功能语义关联计算与密度峰值检测的Mashup服务聚类方法[J].计算机学报,2021,44(7):1501-1515. 被引量：8
8王腾,杨新宇,任雪斌,赵俊.面向数据流发布的数据自适应隐私保护机制[J].中国科学：信息科学,2021,51(7):1199-1216. 被引量：4
9欧阳佳,印鉴,肖政宏,赵慧民,刘少鹏,梁鹏,肖茵茵.面向频繁项集挖掘的本地差分隐私事务数据收集方法[J].软件学报,2021,32(11):3541-3562. 被引量：7
10刘艺菲,王宁,王志刚,谷峪,魏志强,张啸剑,于戈.混洗差分隐私下的多维类别数据的收集与分析[J].软件学报,2022,33(3):1093-1110. 被引量：5

引证文献1

1蒋伟进,陈艺琳,韩裕清,吴玉庭,周为,王海娟.K-Modes聚类数据收集和发布过程中的混洗差分隐私保护方法[J].通信学报,2024,45(1):201-213.

1杨彤,秦进.基于平均序列累计奖赏的自适应ε-greedy策略[J].计算机工程与应用,2021,57(11):148-155. 被引量：5
2张明华,杨桐舒,王畅.求同还是存异?内容产品相似度与大屏消费者留存[J].新经济,2022(9):77-82.
3李静晨,史豪斌,黄国胜.基于自注意力机制和策略映射重组的多智能体强化学习算法[J].计算机学报,2022,45(9):1842-1858. 被引量：4
4谭丽平.宁高宁写诗挥别[J].中国企业家,2022(9):24-29.
5王洪燕,张莉.教师刻板印象对幼儿的负面影响及消除策略[J].教育观察,2022,11(21):70-73. 被引量：1
6赵尚维康,孙君.工业物联网中基于SMDP的协同卸载方案[J].计算机技术与发展,2022,32(9):76-81. 被引量：1
7周丰丰,朱海洋.基于三段式特征选择策略的脑电情感识别算法SEE[J].吉林大学学报（工学版）,2022,52(8):1834-1841. 被引量：1
8马楠,许魁,夏晓晨,谢威,徐键卉,申麦英.基于K-臂赌博机的多无人机空地网络动态资源分配方法[J].电子与信息学报,2022,44(9):3117-3125. 被引量：2
9丁天娇,张慧,叶小红.幼儿从众行为研究综述[J].幼儿教育,2022(27):51-56.
10徐韩,李惠,陆光华.经颅直流电刺激对烟草成瘾干预研究进展[J].精神医学杂志,2022,35(2):217-220.

软件学报

2022年第9期

浏览历史

内容加载中请稍等...

一种满足差分隐私的图赌博机算法被引量：1

参考文献4

二级参考文献25

共引文献115

同被引文献15

引证文献1

相关作者

相关机构

相关主题

浏览历史

一种满足差分隐私的图赌博机算法 被引量：1

参考文献4

二级参考文献25

共引文献115

同被引文献15

引证文献1

相关作者

相关机构

相关主题

浏览历史

一种满足差分隐私的图赌博机算法被引量：1