-
题名基于非定长编码和滑动窗口的隐私保护记录链接方法
- 1
-
-
作者
叶晓东
赵迎迎
孙永奇
赵思聪
刘真
-
机构
北京交通大学计算机与信息技术学院
交通大数据与人工智能教育部重点实验室
北京航天晨信科技有限责任公司
-
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第2期154-164,共11页
-
基金
科技创新2030—“新一代人工智能”重大项目(2021ZD0113002)。
-
文摘
隐私保护记录链接(PPRL)是一种跨不同数据库高效识别同一实体对象对应的记录而不泄露记录所代表实体对象的敏感或机密信息的方法。布隆过滤器(BF)广泛应用于PPRL,其将记录中的敏感信息进行编码并使用字符q-gram实现近似匹配。但是,BF编码容易遭受密码分析攻击,且由于对q-gram位置不敏感,会导致记录匹配的精确率较低。提出一种基于非定长编码和滑动窗口的PPRL方法,其采用的非定长编码记录生成方式不仅使记录具有位置敏感性,而且通过对有效位前后添加随机位数组隐藏了实体的位数组频率信息,从而能够有效防御频率攻击。此外,设计一种基于滑动窗口的记录链接方式,先通过快速过滤筛除大量不匹配的记录,再使用双向滑动窗口的精确匹配策略对剩余记录进行匹配,提高隐私保护记录的匹配效率。在公开数据集上的实验结果表明,相比BF方法,该方法在编码速度上快100倍左右,其同时具有更高的匹配精度,在跨数据库PPRL方面的安全性也更强。
-
关键词
布隆过滤器
字符串比较
隐私保护
记录链接
安全实体对齐
-
Keywords
Bloom Filter(BF)
string comparison
privacy protection
record linkage
secure entity alignment
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-