在数据发布过程中,为了防止隐私泄露,需要对数据的准标识符属性进行匿名化,以降低链接攻击风险,实现对数据所有者敏感属性的匿名保护.现有数据匿名方法都建立在数据无缺失的假设基础上,在数据存在缺失的情况下会直接丢弃相关的记录,造...在数据发布过程中,为了防止隐私泄露,需要对数据的准标识符属性进行匿名化,以降低链接攻击风险,实现对数据所有者敏感属性的匿名保护.现有数据匿名方法都建立在数据无缺失的假设基础上,在数据存在缺失的情况下会直接丢弃相关的记录,造成了匿名化前后数据特性不一致.针对缺失数据匿名方法进行研究,基于k-匿名模型提出面向缺失数据的数据匿名方法 KAIM(k-anonymity for incomplete mircrodata),在保留包含缺失记录的前提下,使在同一属性上缺失的记录尽量被分配到同一分组参与泛化.该方法将分组泛化前后的信息熵变化作为距离,基于改进的k-member算法对数据进行聚类分组,最后通过基于泛化层次的局部泛化算法对组内数据进行泛化.实际数据集的大量实验结果表明,KAIM造成信息缺损仅为现有算法的43.8%,可以最大程度地保障匿名化前后数据特性不变.展开更多
针对相似攻击所造成隐私泄露的问题,提出(H,p,k)-匿名模型,通过对敏感属性分级,使等价类中元组不同敏感级别的个数满足设定阈值H,并设计满足该模型的匿名算法MAA-SLIE(Micro-aggregation Algorithm based on Sensitive Level Informatio...针对相似攻击所造成隐私泄露的问题,提出(H,p,k)-匿名模型,通过对敏感属性分级,使等价类中元组不同敏感级别的个数满足设定阈值H,并设计满足该模型的匿名算法MAA-SLIE(Micro-aggregation Algorithm based on Sensitive Level Information Entropy)。该算法基于贪心聚类思想,在聚类过程中保证等价类隐私安全指数最大,提高等价类中敏感属性多样性,降低隐私泄露风险,减少信息损失,通过实验验证了算法的合理性和有效性。展开更多
文摘在数据发布过程中,为了防止隐私泄露,需要对数据的准标识符属性进行匿名化,以降低链接攻击风险,实现对数据所有者敏感属性的匿名保护.现有数据匿名方法都建立在数据无缺失的假设基础上,在数据存在缺失的情况下会直接丢弃相关的记录,造成了匿名化前后数据特性不一致.针对缺失数据匿名方法进行研究,基于k-匿名模型提出面向缺失数据的数据匿名方法 KAIM(k-anonymity for incomplete mircrodata),在保留包含缺失记录的前提下,使在同一属性上缺失的记录尽量被分配到同一分组参与泛化.该方法将分组泛化前后的信息熵变化作为距离,基于改进的k-member算法对数据进行聚类分组,最后通过基于泛化层次的局部泛化算法对组内数据进行泛化.实际数据集的大量实验结果表明,KAIM造成信息缺损仅为现有算法的43.8%,可以最大程度地保障匿名化前后数据特性不变.
文摘针对相似攻击所造成隐私泄露的问题,提出(H,p,k)-匿名模型,通过对敏感属性分级,使等价类中元组不同敏感级别的个数满足设定阈值H,并设计满足该模型的匿名算法MAA-SLIE(Micro-aggregation Algorithm based on Sensitive Level Information Entropy)。该算法基于贪心聚类思想,在聚类过程中保证等价类隐私安全指数最大,提高等价类中敏感属性多样性,降低隐私泄露风险,减少信息损失,通过实验验证了算法的合理性和有效性。