纵向联邦学习(Vertical federated learning,VFL)是一种新兴的分布式机器学习技术,在保障隐私性的前提下,利用分散在各个机构的数据实现机器学习模型的联合训练.纵向联邦学习被广泛应用于工业互联网、金融借贷和医疗诊断等诸多领域中,...纵向联邦学习(Vertical federated learning,VFL)是一种新兴的分布式机器学习技术,在保障隐私性的前提下,利用分散在各个机构的数据实现机器学习模型的联合训练.纵向联邦学习被广泛应用于工业互联网、金融借贷和医疗诊断等诸多领域中,因此保证其隐私安全性具有重要意义.首先,针对纵向联邦学习协议中由于参与方交换的嵌入表示造成的隐私泄漏风险,研究由协作者发起的通用的属性推断攻击.攻击者利用辅助数据和嵌入表示训练一个攻击模型,然后利用训练完成的攻击模型窃取参与方的隐私属性.实验结果表明,纵向联邦学习在训练推理阶段产生的嵌入表示容易泄漏数据隐私.为了应对上述隐私泄漏风险,提出一种基于最大−最小策略的纵向联邦学习隐私保护方法(Privacy preservation method for vertical federated learning based on max-min strategy,PPVFL),其引入梯度正则组件保证训练过程主任务的预测性能,同时引入重构组件掩藏参与方嵌入表示中包含的隐私属性信息.最后,在钢板缺陷诊断工业场景的实验结果表明,相比于没有任何防御方法的VFL,隐私保护方法将攻击推断准确度从95%下降到55%以下,接近于随机猜测的水平,同时主任务预测准确率仅下降2%.展开更多
混合属性数据流聚类是数据流挖掘中的重要问题.针对现存聚类方法在处理混合属性数据流聚类时存在聚类精度低和实时性差的问题,提出一种基于密度的混合属性数据流聚类算法HDSDen(Heterogeneous Data Stream based on Density Clustering ...混合属性数据流聚类是数据流挖掘中的重要问题.针对现存聚类方法在处理混合属性数据流聚类时存在聚类精度低和实时性差的问题,提出一种基于密度的混合属性数据流聚类算法HDSDen(Heterogeneous Data Stream based on Density Clustering Algorithm),算法由在线聚类/离线优化两部分组成,在线聚类快速完成距离计算与聚类,离线优化实现二次聚类提高聚类精度.针对现存混合型属性计算距离方式精度低的问题,本文设计属性占优分析预先确定混合属性数据流中分类或数值属性占优的,随即选择对应的相似度计算公式,从而保证了混合属性的相似度计算满足属性重要性平衡,降低非占优属性数据对整体数据聚类的影响,在线聚类最终通过给定参数ε和μ确定当前窗口到达的数据点中的核心数据点.离线部分从核心数据点出发将所有密度可达的数据点聚成一个自然类,并将未被聚类的数据点存入暂存区,若暂存区内数据点达到一定数量,将暂存区的数据再聚类优化整体的聚类效果,从而实现了离群点的二次聚类,保证了聚类的精度.最后HDSDen算法对真实数据集进行聚类实验,验证HDSDen算法比现有几种典型数据流聚类方法具有更高的聚类质量,并能给出任意时间的聚类结果,能够有效地处理混合属性数据流聚类问题.展开更多
量子粒子群算法在优化过程中需要权衡局部探索性和全局开拓性,进化后期由于全局开拓能力的丧失使得种群多样性减少,设计了一种基于欧式距离的混合量子粒子群算法,通过计算粒子的种群多样性,当种群多样性低于阈值范围时加入基于欧式距离...量子粒子群算法在优化过程中需要权衡局部探索性和全局开拓性,进化后期由于全局开拓能力的丧失使得种群多样性减少,设计了一种基于欧式距离的混合量子粒子群算法,通过计算粒子的种群多样性,当种群多样性低于阈值范围时加入基于欧式距离的种群划分策略划分子种群,从而保证获得全局最优解。利用标准测试函数验证提出的混合量子群算法有效性。提出了基于混合量子粒子群的Mean Shift算法(HQPSO Mean Shift)完成目标快速跟踪,克服传统Mean Shift算法的在跟踪快速移动目标时出现"跟丢"的问题。展开更多
文摘纵向联邦学习(Vertical federated learning,VFL)是一种新兴的分布式机器学习技术,在保障隐私性的前提下,利用分散在各个机构的数据实现机器学习模型的联合训练.纵向联邦学习被广泛应用于工业互联网、金融借贷和医疗诊断等诸多领域中,因此保证其隐私安全性具有重要意义.首先,针对纵向联邦学习协议中由于参与方交换的嵌入表示造成的隐私泄漏风险,研究由协作者发起的通用的属性推断攻击.攻击者利用辅助数据和嵌入表示训练一个攻击模型,然后利用训练完成的攻击模型窃取参与方的隐私属性.实验结果表明,纵向联邦学习在训练推理阶段产生的嵌入表示容易泄漏数据隐私.为了应对上述隐私泄漏风险,提出一种基于最大−最小策略的纵向联邦学习隐私保护方法(Privacy preservation method for vertical federated learning based on max-min strategy,PPVFL),其引入梯度正则组件保证训练过程主任务的预测性能,同时引入重构组件掩藏参与方嵌入表示中包含的隐私属性信息.最后,在钢板缺陷诊断工业场景的实验结果表明,相比于没有任何防御方法的VFL,隐私保护方法将攻击推断准确度从95%下降到55%以下,接近于随机猜测的水平,同时主任务预测准确率仅下降2%.
文摘混合属性数据流聚类是数据流挖掘中的重要问题.针对现存聚类方法在处理混合属性数据流聚类时存在聚类精度低和实时性差的问题,提出一种基于密度的混合属性数据流聚类算法HDSDen(Heterogeneous Data Stream based on Density Clustering Algorithm),算法由在线聚类/离线优化两部分组成,在线聚类快速完成距离计算与聚类,离线优化实现二次聚类提高聚类精度.针对现存混合型属性计算距离方式精度低的问题,本文设计属性占优分析预先确定混合属性数据流中分类或数值属性占优的,随即选择对应的相似度计算公式,从而保证了混合属性的相似度计算满足属性重要性平衡,降低非占优属性数据对整体数据聚类的影响,在线聚类最终通过给定参数ε和μ确定当前窗口到达的数据点中的核心数据点.离线部分从核心数据点出发将所有密度可达的数据点聚成一个自然类,并将未被聚类的数据点存入暂存区,若暂存区内数据点达到一定数量,将暂存区的数据再聚类优化整体的聚类效果,从而实现了离群点的二次聚类,保证了聚类的精度.最后HDSDen算法对真实数据集进行聚类实验,验证HDSDen算法比现有几种典型数据流聚类方法具有更高的聚类质量,并能给出任意时间的聚类结果,能够有效地处理混合属性数据流聚类问题.
文摘量子粒子群算法在优化过程中需要权衡局部探索性和全局开拓性,进化后期由于全局开拓能力的丧失使得种群多样性减少,设计了一种基于欧式距离的混合量子粒子群算法,通过计算粒子的种群多样性,当种群多样性低于阈值范围时加入基于欧式距离的种群划分策略划分子种群,从而保证获得全局最优解。利用标准测试函数验证提出的混合量子群算法有效性。提出了基于混合量子粒子群的Mean Shift算法(HQPSO Mean Shift)完成目标快速跟踪,克服传统Mean Shift算法的在跟踪快速移动目标时出现"跟丢"的问题。