期刊文献+
共找到167篇文章
< 1 2 9 >
每页显示 20 50 100
PFKD:综合考虑数据异构和模型异构的个性化联邦学习框架 被引量:1
1
作者 陈学斌 任志强 《南京信息工程大学学报》 CAS 北大核心 2024年第4期513-519,共7页
联邦学习是解决机器学习中数据共享和隐私保护两个关键难题的重要方法.然而,联邦学习本身也面临着数据异构和模型异构的挑战.现有研究往往只专注于解决其中一个方面的问题,忽视了两者之间的关联性.为此,本文提出了一个名为PFKD的框架,... 联邦学习是解决机器学习中数据共享和隐私保护两个关键难题的重要方法.然而,联邦学习本身也面临着数据异构和模型异构的挑战.现有研究往往只专注于解决其中一个方面的问题,忽视了两者之间的关联性.为此,本文提出了一个名为PFKD的框架,该框架通过知识蒸馏技术解决模型异构问题,通过个性化算法解决数据异构问题,以实现更具个性化的联邦学习.通过实验分析验证了所提出框架的有效性.实验结果显示,该框架能够突破模型的性能瓶颈,提高模型精度约1个百分点.此外,在调整适当的超参数后,该框架的性能得到进一步提升. 展开更多
关键词 联邦学习 数据异构 模型异构
下载PDF
基于联邦集成算法对不同脱敏数据的研究
2
作者 罗长银 陈学斌 +3 位作者 张淑芬 尹志强 石义 李风军 《应用科学学报》 CAS CSCD 北大核心 2024年第1期94-102,共9页
针对联邦学习中存在梯度更新导致本地数据可能泄露的问题,提出基于本地脱敏数据上的联邦集成算法。该算法用变异率与适应度阈值的不同取值对原始数据进行脱敏,且使用不同类型的模型在经不同程度脱敏的数据上进行本地模型训练,以确定适... 针对联邦学习中存在梯度更新导致本地数据可能泄露的问题,提出基于本地脱敏数据上的联邦集成算法。该算法用变异率与适应度阈值的不同取值对原始数据进行脱敏,且使用不同类型的模型在经不同程度脱敏的数据上进行本地模型训练,以确定适合的联邦集成算法参数。实验结果表明,与联邦平均算法和传统集中式训练相比,stacking联邦集成算法与voting联邦集成算法的准确率要优于基线准确率。在实际应用中,可根据不同的需求设置不同的脱敏参数来保护数据,以此提升数据的安全性。 展开更多
关键词 联邦学习 梯度更新 联邦集成算法 集成算法
下载PDF
面向多源数据的个性化联邦学习框架
3
作者 裴浪涛 陈学斌 +1 位作者 任志强 翟冉 《计算机工程与应用》 CSCD 北大核心 2024年第19期278-287,共10页
在联邦学习中,中心服务器聚合来自不同的客户端经过差分隐私扰动后的模型,其中差分隐私噪声添加的大小和隐私预算的分配直接影响到模型的可用性,现有的研究大多基于平衡的数据和固定的隐私预算,在处理多源不平衡数据时难以权衡精度与隐... 在联邦学习中,中心服务器聚合来自不同的客户端经过差分隐私扰动后的模型,其中差分隐私噪声添加的大小和隐私预算的分配直接影响到模型的可用性,现有的研究大多基于平衡的数据和固定的隐私预算,在处理多源不平衡数据时难以权衡精度与隐私保护水平,针对该问题提出了一种具有自适应差分隐私噪声添加的联邦学习框架,采取基于沙普利值的贡献度证明算法计算不同数据来源的客户端的贡献度,并依据贡献度为不同客户端在梯度更新的过程中添加差异化的差分隐私噪声,继而实现个性化的隐私保护。理论和实验分析表明该框架面对多源不平衡数据时不仅可以为不同参与方提供更加细化的隐私保护水平,同时在模型性能方面也比传统的FL-DP算法高出1.3个百分点。 展开更多
关键词 联邦学习 差分隐私 沙普利值 不平衡数据
下载PDF
数据科学专业实验课程教学改革的思考 被引量:2
4
作者 陈学斌 阎少宏 宁学斌 《产业与科技论坛》 2018年第18期183-184,共2页
本文给出了数据科学实验课程教学改革的几点思考建议,结合专业发展方向和目标定位,形成了具有显著时代特色的课程体系设置方案,以提升学生动手能力为目标,从加强教师队伍建设以及提高教学责任心入手,采用学评教与同行评价相结合的办法... 本文给出了数据科学实验课程教学改革的几点思考建议,结合专业发展方向和目标定位,形成了具有显著时代特色的课程体系设置方案,以提升学生动手能力为目标,从加强教师队伍建设以及提高教学责任心入手,采用学评教与同行评价相结合的办法来提高教学质量,并将实验教学方法与考核办法配套结合,成效明显。 展开更多
关键词 数据科学 教学改革 实验课程
下载PDF
不完备数据集的邻域容差互信息选择集成分类算法
5
作者 李丽红 董红瑶 +2 位作者 刘文杰 李宝霖 代琪 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期106-117,共12页
针对不完备混合信息系统的分类问题,结合粒计算中的邻域容差关系和互信息理论,定义邻域容差互信息的概念,并利用集成学习的思想,提出不完备数据集的邻域容差互信息选择集成分类算法.该算法首先根据缺失属性得到信息粒,划分粒层构建粒空... 针对不完备混合信息系统的分类问题,结合粒计算中的邻域容差关系和互信息理论,定义邻域容差互信息的概念,并利用集成学习的思想,提出不完备数据集的邻域容差互信息选择集成分类算法.该算法首先根据缺失属性得到信息粒,划分粒层构建粒空间,在不同的粒层上使用以BP神经网络作为基分类器的集成算法,构建新的基分类器;然后,根据每个信息粒的缺失属性计算出关于类属性的邻域容差互信息,来衡量各个信息粒的重要度,并根据基分类器预测准确率以及邻域容差互信息重新定义基分类器权重;最后,根据预测样本对基分类器加权集成预测分类结果,并与传统的集成分类算法进行对比分析.对于部分不完备混合型数据集,新提出的集成分类算法能有效提升分类准确率. 展开更多
关键词 不完备混合信息系统 邻域容差互信息 集成学习 分类
下载PDF
基于KPCA的不平衡数据欠抽样算法
6
作者 王晓玲 金永超 +1 位作者 刘威伟 王希胤 《应用数学进展》 2024年第9期4108-4118,共11页
在现实世界的分类任务中,不平衡数据通常呈现非线性分布的特点,而传统的抽样方法难以有效处理这些非线性,导致分类效果不佳。为了解决这个问题,本文提出了一种基于核主成分分析(KPCA)的欠抽样方法。该方法通过使用非线性核函数将原始数... 在现实世界的分类任务中,不平衡数据通常呈现非线性分布的特点,而传统的抽样方法难以有效处理这些非线性,导致分类效果不佳。为了解决这个问题,本文提出了一种基于核主成分分析(KPCA)的欠抽样方法。该方法通过使用非线性核函数将原始数据映射到适当的高维空间使其线性化,然后根据每个样本在核主成分上的得分来选择性地删除多数类样本,从而实现欠抽样。在9组具有不同平衡率的数据集上,采用本文提出的方法进行了欠抽样预处理,并使用逻辑回归(Logistic Regression)分类器进行分类。实验结果表明,在Accuracy、F1-measure和AUC值三个指标中,本文方法分别在7组、8组和9组数据集上取得了最高评分。这表明该方法在不平衡数据集上具有良好的分类性能。The unbalanced data in the real classification task are mostly characterized by nonlinear distribution, and the traditional sampling method is not good at dealing with this kind of nonlinearity resulting in unsatisfactory sample classification effect. Aiming at this problem, an under-sampling method based on KPCA is proposed. The method maps the original data to a suitable high-dimensional space to make it linearly divisible by nonlinearly transforming the kernel function, and de-redundantly removes the majority class by calculating the scores of individual samples on the kernel principal components in order to achieve the purpose of under-sampling. After the under-sampling preprocessing of nine datasets with different balance rates, the classification is performed using Logistic Regression classifier model. The experimental results show that the algorithm of this paper obtains the highest evaluation metrics under Accuracy, F1-measure and AUC value scores under 7, 8 and 9 groups of datasets, respectively, which shows that the method has a good classification performance on unbalanced datasets. 展开更多
关键词 不平衡数据 欠抽样 核主成分分析 分类
下载PDF
基于云模型的三支决策方法及应用
7
作者 李丽红 李航 《华北理工大学学报(自然科学版)》 CAS 2024年第2期124-132,共9页
针对决策过程中的随机性、模糊性和不确定性,将云模型与“三分而治”的思想进行结合,提出一种融合云模型的三支决策模型。首先构建评价指标体系,利用熵权法计算指标权重;其次,确定每个等级的取值范围,根据云模型隶属度函数确定隶属度;... 针对决策过程中的随机性、模糊性和不确定性,将云模型与“三分而治”的思想进行结合,提出一种融合云模型的三支决策模型。首先构建评价指标体系,利用熵权法计算指标权重;其次,确定每个等级的取值范围,根据云模型隶属度函数确定隶属度;然后构造条件概率以及综合损失函数,从而得到三支决策规则,实现三个域的划分。将模型应用于长江经济带水资源承载力分析,并根据决策结果进行分析。 展开更多
关键词 云模型 条件概率 综合损失函数 三支决策 水资源承载力
下载PDF
数据预处理技术在异构数据中的应用 被引量:5
8
作者 罗长银 陈学斌 +1 位作者 宋尚文 刘洋 《软件》 2020年第5期6-13,共8页
数据预处理成为数据挖掘与分析最重要的一环,针对多源数据中数据冗余和数据缺失以及浪费算力的问题,本文采用系数对重复性的数值型数据进行检测和基于传统的字段匹配算法,提出了系数能够解决相同的字段在不同的字符串中的相似程度的问题... 数据预处理成为数据挖掘与分析最重要的一环,针对多源数据中数据冗余和数据缺失以及浪费算力的问题,本文采用系数对重复性的数值型数据进行检测和基于传统的字段匹配算法,提出了系数能够解决相同的字段在不同的字符串中的相似程度的问题,对缺失值数据采用频率分布和牛顿插值法来填充缺失值,使数据也具有基本的安全性和有效性,采用马氏距离可以有效的去除异常值,最后通过数据约简的方法来减少数据规模。经实验验证,经过预处理后的数据建立的模型的准确度没有太大影响,但处理时间以及安全性得到了大幅度的提升。 展开更多
关键词 数据预处理 频率分布 马氏距离
下载PDF
面向区块链应用的密码算法研究 被引量:3
9
作者 阎红灿 陈子昂 刘盈 《华北理工大学学报(自然科学版)》 CAS 2023年第2期76-83,共8页
密码学是解决信息安全机密性、完整性和可用性的核心技术,密码算法为区块链实现去中心化、防篡改、匿名化等特性提供技术支撑,而现代密码学中已有的加密算法不能直接应用到区块链中,亟需对其优化改进。在全面分析密码学系统模型的基础上... 密码学是解决信息安全机密性、完整性和可用性的核心技术,密码算法为区块链实现去中心化、防篡改、匿名化等特性提供技术支撑,而现代密码学中已有的加密算法不能直接应用到区块链中,亟需对其优化改进。在全面分析密码学系统模型的基础上,剖析对称密码DES、非对称密码RSA和哈希算法的关键技术,采用矩阵迭代加密、优化算法函数等方法提高其加密速度和安全性能,提出了在区块链中应用的AES算法和ECC算法,同时将二者结合给出一种能够在区块链场景下应用的混合密码算法。 展开更多
关键词 区块链 密码学 密码算法 对称密码 非对称密码 AES ECC
下载PDF
基于区块链的医疗数据存储和共享方法对比与分析 被引量:1
10
作者 阎红灿 窦桂梅 郭小雨 《物联网技术》 2023年第7期41-45,50,共6页
医疗数据面临存储难、共享难、数据获得感较低问题,而区块链技术具有去中心化、防篡改、匿名化的特性,可以解决这些问题,实现医疗数据的安全存储和共享。通过梳理在区块链技术下医疗数据的存储和共享过程,给出了以医疗数据走向为中心的... 医疗数据面临存储难、共享难、数据获得感较低问题,而区块链技术具有去中心化、防篡改、匿名化的特性,可以解决这些问题,实现医疗数据的安全存储和共享。通过梳理在区块链技术下医疗数据的存储和共享过程,给出了以医疗数据走向为中心的区块链存储和共享框架;首先概述了两种存储平台;然后根据数据流向将区块链中的加密技术分为数据存储中、数据共享中、数据交易中加密技术三类,并做了综述对比,从理论上分析了数据共享中加密技术的优劣和适用范围,并给出结论;总结了数字签名技术应用在区块链中的3个改进方式。本文研究为给医疗数据选择合理的存储共享方式和加密方法提供了方向。 展开更多
关键词 区块链 隐私保护技术 智能合约 数据共享 数据存储 医疗数据
下载PDF
基于雷达数据的飞行受限区形变及方位预测
11
作者 樊立艳 赵鹤宇 +1 位作者 常锦才 李印凤 《华东交通大学学报》 2023年第2期71-78,共8页
强对流天气是影响飞机飞行的重要原因之一。为了有效减少飞机改航的经济浪费,同时降低遇到危险的概率,需要准确划设飞行受限区并进行预测。首先提取出影响飞机飞行的雷雨点数据,采用Graham算法划设静态飞行限制区的初始多边形,提出距离... 强对流天气是影响飞机飞行的重要原因之一。为了有效减少飞机改航的经济浪费,同时降低遇到危险的概率,需要准确划设飞行受限区并进行预测。首先提取出影响飞机飞行的雷雨点数据,采用Graham算法划设静态飞行限制区的初始多边形,提出距离均值方法对飞行限制区的几何形状变化进行预测。然后引入Markov思想通过类状态转移矩阵预测飞行限制区的中心点位置变化,提出角度增量的方法预测飞行限制区中心点角度变化。实例结果表明,对于时间分辨率较低的雷达气象数据,该方法预测精确度较高且偏差度较低,并且可以实时更新预测区域。在静态飞行限制区的基础上实现了动态预测,使预测结果更贴近实际变化情况。 展开更多
关键词 飞行受限区 Graham算法 Markov理论 动态预测
下载PDF
基于本地差分隐私的BIRCH混合数据算法
12
作者 王豪石 张淑芬 +1 位作者 董燕灵 徐超 《华北理工大学学报(自然科学版)》 CAS 2023年第1期89-98,共10页
BIRCH算法是一种适合处理大规模数值型的聚类算法,但现实生活中的数据往往是混合型数据,导致了BIRCH算法的局限性;此外,在使用BIRCH算法进行聚类分析的过程中存在隐私泄露的风险,而传统的中心化差分隐私算法存在需要可信第三方的缺点。... BIRCH算法是一种适合处理大规模数值型的聚类算法,但现实生活中的数据往往是混合型数据,导致了BIRCH算法的局限性;此外,在使用BIRCH算法进行聚类分析的过程中存在隐私泄露的风险,而传统的中心化差分隐私算法存在需要可信第三方的缺点。针对以上缺陷,提出了基于本地差分隐私的BIRCH混合数据(LDP-BIRCH)算法,对混合型数据中的非数值型数据进行编码处理,并使用本地差分隐私对数据集进行扰动,将扰动后的数据集发给第三方进行BIRCH算法聚类分析。研究结果表明,LDP-BIRCH算法在adult和Facebook Live Sellers in Thailand数据集上满足隐私保护性和聚类可用性。 展开更多
关键词 本地差分隐私 BIRCH算法 混合数据 随机响应机制
下载PDF
满足个性化差分隐私的社交网络图生成方法 被引量:1
13
作者 高瑞 陈学斌 +1 位作者 谷铮 邹元怀 《太原理工大学学报》 北大核心 2024年第1期163-171,共9页
【目的】针对现有本地化差分隐私社交网络图生成算法中直接扰动邻居列表的方法会导致引入过多噪声且隐私保护程度不均衡的问题,提出了一种满足个性化的本地差分隐私社交网络图生成方法(GPDP)。【方法】首先,使用传统的社区发现算法Louv... 【目的】针对现有本地化差分隐私社交网络图生成算法中直接扰动邻居列表的方法会导致引入过多噪声且隐私保护程度不均衡的问题,提出了一种满足个性化的本地差分隐私社交网络图生成方法(GPDP)。【方法】首先,使用传统的社区发现算法Louvain对原始社交网络图进行划分,保留社区信息;其次,对于划分后的社区根据其社区内部平均权重度比值作为新的隐私预算参数分配给每个节点;然后,每个节点根据新的隐私预算各自扰动其邻居列表,同时利用随机邻接位向量(RABV)方法降低通讯成本;最后合并邻居列表形成生成图。【结果】通过在真实数据集上的实验结果表明,该算法在发布合成图数据时保证了数据隐私性和可用性的均衡,同时保留了更多的社区结构信息。 展开更多
关键词 个性化差分隐私 社交网络 隐私保护 合成图生成
下载PDF
基于集成学习的入侵检测模型 被引量:2
14
作者 李铂初 阎红灿 《华北理工大学学报(自然科学版)》 CAS 2024年第1期122-132,共11页
入侵检测系统通过对网络上的恶意行为检测,来保证网络安全和计算机系统的稳定,随着人工智能技术的发展,机器学习与深度学习算法被广泛应用在入侵检测系统中。以入侵检测模型为研究目标,针对网络异常行为检测中的不平衡数据多分类问题,... 入侵检测系统通过对网络上的恶意行为检测,来保证网络安全和计算机系统的稳定,随着人工智能技术的发展,机器学习与深度学习算法被广泛应用在入侵检测系统中。以入侵检测模型为研究目标,针对网络异常行为检测中的不平衡数据多分类问题,对现有的网络异常行为检测多分类模型进行优化,提出了一种基于卷积神经网络、LSTM(Long Short-Term Memory)神经网络与XGBoost(eXtreme Gradient Boosting)算法集成的检测模型(CNN+LSTM-In-XGBoost)。该模型包括数据预处理、长短期神经网络模型训练、数据降维、采样后XGBoost模型训练3个部分,通过对UNSW-NB15数据集进行实验分析,发现其准确率和分类平均f1-score均高于基准算法,特别少数类样本的分类准确率相比基准机器学习算法与神经网络模型有较大提升。 展开更多
关键词 异常行为检测 长短期记忆网络 极端梯度提升树 特征提取 多折交叉验证 采样方法
下载PDF
基于个性化差分隐私的联邦学习方法 被引量:1
15
作者 徐超 张淑芬 +1 位作者 彭璐璐 张帅华 《华北理工大学学报(自然科学版)》 CAS 2024年第2期133-144,共12页
联邦学习的模型参数可能导致用户隐私信息泄露,为解决此问题,将联邦学习和差分隐私进行结合的方法被广泛使用,但目前大多数方法只关注统一的隐私预算分配,忽略了由于用户数据分布不平衡带来的不同隐私预算需求。针对上述问题,提出一种... 联邦学习的模型参数可能导致用户隐私信息泄露,为解决此问题,将联邦学习和差分隐私进行结合的方法被广泛使用,但目前大多数方法只关注统一的隐私预算分配,忽略了由于用户数据分布不平衡带来的不同隐私预算需求。针对上述问题,提出一种基于数据分布的个性化差分隐私的联邦学习方法,根据用户间数据分布的差异,提出一种基于信息熵的隐私预算分配方案,依据信息熵为用户分配不同的隐私预算,信息熵越大的用户分配的隐私预算越高,从而量化了用户的隐私需求,实现对用户隐私的个性化保护。实验结果表明,在数据分布不平衡的场景下,相比基于统一的隐私预算分配方法,基于信息熵的隐私预算分配方法的模型准确率在不同的隐私预算下均有提高。 展开更多
关键词 联邦学习 差分隐私 信息熵 数据分布 个性化差分隐私
下载PDF
基于深度森林的多类型DDoS攻击检测方法 被引量:1
16
作者 徐精诚 陈学斌 董燕灵 《软件导刊》 2024年第2期106-112,共7页
分布式拒绝服务攻击(DDoS)是网络安全的主要威胁之一。近年来,基于多种不同DDoS攻击方式的混合攻击数量大幅增长,如何在保证精度的前提下同时检测多种类型的DDoS攻击成为亟待解决的问题。为此,提出一种基于深度森林的多类型DDoS攻击检... 分布式拒绝服务攻击(DDoS)是网络安全的主要威胁之一。近年来,基于多种不同DDoS攻击方式的混合攻击数量大幅增长,如何在保证精度的前提下同时检测多种类型的DDoS攻击成为亟待解决的问题。为此,提出一种基于深度森林的多类型DDoS攻击检测方法。该方法首先使用基于平均不纯度的特征选择算法对多类型异常流量数据集进行特征排序与特征筛选;然后使用多粒度扫描对DDoS训练集进行特征提取,并使用级联森林分层训练模型,最终生成可用于DDoS恶意流量检测与分类的深度森林模型。实验结果表明,与6种主流树类集成学习模型相比,基于改进深度森林的DDoS攻击检测方法训练得到的分类器准确率最低提升了0.8%,召回率最低提升了0.9%;与改进前相比,改进后模型准确率提升了1.3%,加权召回率提高了1.3%,训练时间减少了29.7%。模型整体性能有明显提升。 展开更多
关键词 多类型攻击检测 分布式拒绝服务攻击 深度森林 多粒度扫描 级联森林 平均不纯度
下载PDF
基于超混沌系统与DNA编码的图像加密研究 被引量:1
17
作者 张瑶 王希胤 《软件导刊》 2024年第2期120-128,共9页
针对图像加密方案中密钥敏感性弱、相邻位置像元相关性强等问题,提出一种基于超混沌系统置乱、扩散及DNA编码的彩色图像加密算法。首先,将原图像经R、G、B通道分层得到的3个二维灰度图像矩阵进行补零操作后划分为16个子块;然后,对各模... 针对图像加密方案中密钥敏感性弱、相邻位置像元相关性强等问题,提出一种基于超混沌系统置乱、扩散及DNA编码的彩色图像加密算法。首先,将原图像经R、G、B通道分层得到的3个二维灰度图像矩阵进行补零操作后划分为16个子块;然后,对各模块进行扩散得到一个随机矩阵,利用多混沌系统产生的4条混沌序列值确定DNA编码与运算规则,分别对补零后的矩阵和随机矩阵进行DNA运算。为获得更好的扩散效果,在对两个矩阵子块进行DNA运算及解码操作后,由Logistic混沌映射迭代的两条混沌序列对其进行行列位置置乱,重新组合图像子块得到彩色加密图像。仿真表明,改进后的加密算法密钥空间达到10128数量级,在图像水平、垂直及对角方向上相关性系数平均达到-0.0043,计算得到的UACI值为33.3687%,NPCR值为99.6956%,对降低图像相邻位置像素数值相关性及各种攻击的能力更强。 展开更多
关键词 图像加密 超混沌系统 LOGISTIC混沌映射 DNA编码 DNA运算
下载PDF
膜内麻雀优化ELM的软件缺陷预测算法
18
作者 唐宇 代琪 +1 位作者 杨梦园 陈丽芳 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第2期643-654,共12页
原始麻雀搜索算法存在寻优精度低、迭代后期容易陷入局部极值的问题,结合高效寻优性能的改进麻雀搜索算法和具有并行计算能力的膜计算,提出一种膜内麻雀优化算法(IMSSA)。在10个CEC2017测试函数上的实验结果表明,IMSSA具有更高的寻优精... 原始麻雀搜索算法存在寻优精度低、迭代后期容易陷入局部极值的问题,结合高效寻优性能的改进麻雀搜索算法和具有并行计算能力的膜计算,提出一种膜内麻雀优化算法(IMSSA)。在10个CEC2017测试函数上的实验结果表明,IMSSA具有更高的寻优精度。为进一步验证IMSSA的性能,使用IMSSA优化极限学习机(ELM)参数,提出一种膜内麻雀优化ELM(IMSSA-ELM)算法,并将其应用于软件缺陷预测领域。实验结果表明:在15个公开的软件缺陷数据集中,IMSSA-ELM算法预测性能在G-mean、MCC这2个评价指标下明显优于其他4种先进的对比算法,表明IMSSA-ELM算法具有更好的预测精度和稳定性,其实验结果在Friedman ranking和Holm’s post-hoc test非参数检验中具有明显的统计显著性。 展开更多
关键词 改进麻雀搜索算法 膜计算 极限学习机 优化算法 软件缺陷预测
下载PDF
一种多素数和公共模数联合的Paillier优化算法
19
作者 马莉莉 阎红灿 谷建涛 《信息安全研究》 CSCD 北大核心 2024年第10期952-957,共6页
Skyline查询旨在大量数据点中选择出一组符合要求的点集合,为面向位置对象的多目标优化问题提供了关键技术.明文的Skyline查询会引发数据泄露,采取同态加密Paillier对数据进行保护,实现密文上的Skyline查询.针对Paillier加解密效率低的... Skyline查询旨在大量数据点中选择出一组符合要求的点集合,为面向位置对象的多目标优化问题提供了关键技术.明文的Skyline查询会引发数据泄露,采取同态加密Paillier对数据进行保护,实现密文上的Skyline查询.针对Paillier加解密效率低的问题,提出了多素数和公共模数联合的MPGPaillier(multiple primegenerator Paillier)算法,对算法的正确性和安全性进行证明.实验对比分析表明,在加解密效率方面,MP-GPaillier比Paillier和MP-Paillier(multiple primePaillier)算法有显著提升. 展开更多
关键词 SKYLINE查询 同态加密 Paillier 多素数 公共模数
下载PDF
基于差分隐私的直方图发布方法综述
20
作者 陈学斌 单丽洋 郭如敏 《计算机应用》 CSCD 北大核心 2024年第10期3114-3121,共8页
在数字经济时代,数据发布是数据共享的重要环节。直方图数据发布是数据发布的常见方式,但它面临着隐私泄露的问题。为此,对基于差分隐私(DP)的直方图数据发布方法进行了研究。首先,介绍了DP和直方图的相关性质,以及近5年国内外针对静态... 在数字经济时代,数据发布是数据共享的重要环节。直方图数据发布是数据发布的常见方式,但它面临着隐私泄露的问题。为此,对基于差分隐私(DP)的直方图数据发布方法进行了研究。首先,介绍了DP和直方图的相关性质,以及近5年国内外针对静态数据集和流数据的直方图发布方法的研究,并讨论了静态数据下直方图分组数、分组方式、噪声误差和分组误差的均衡,以及隐私预算分配问题。其次,探讨了动态数据下数据采样、数据预测以及滑动窗口实现分组的问题;同时针对面向区间树结构的DP直方图发布方法,将原始数据与树结构进行转化,并讨论了树结构数据的加噪、基于树结构的优化、树结构的隐私预算的分配等;此外,还讨论了直方图发布数据的可用性和隐私性、查询范围和查询精度问题。最后,通过对相关算法进行对比分析,总结了各算法的优缺点,以及部分算法的定量分析比较及适用场景,展望了未来基于DP的直方图在不同数据场景中的研究方向。 展开更多
关键词 数据发布 直方图发布 差分隐私 隐私预算 均方误差
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部