基于敏感信息度量的t-保密脱敏技术改良被引量：7

An improvement of t-closeness technology based on sensitive information metric

下载PDF

导出

摘要随着大数据的运用不断发展,数据中的个人敏感信息面对的泄露风险越来越大。在发布数据时,可以通过数据脱敏来保护个人敏感信息。当前主流的脱敏技术有k-匿名、l-多样性和t-保密三种,都没有对数据语义的考虑。为了更好地保护复杂语义下高敏感度的敏感属性值,文中选用t-保密脱敏技术,以海林格距离作为度量方式,通过敏感属性值分类加权引入铭感信息度量。数据分析及实验结果表明,该方法在可接受的脱敏时间开销增长下,加强了对复杂语义的敏感数据的保护能力。同时分类加权方式方便灵活,可以满足实际使用中的不同需求。 With the continuous development of the application of big data,the risk of disclosure of sensitive personal information in data is increasing.Data masking can be used to protect sensitive personal information when releasing data.Currently,there are three mainstream data masking tech-nologies,k-anonymity,l-diversity and t-closeness,none of which takes data semantics into consideration.In order to protect the sensitive attribute values with high sensitivity under complex semantics,t-closeness technology is selected in this paper,and Helinger distance is used as the measurement method to introduce the measurement of sensitivity information by classifying and weighting the sensitive attribute values.The data analysis and experimental results show that this method enhances the ability to protect sensitive data with complex semantics under the increase of acceptable desensitization time cost.At the same time,the method of classification weighting is convenient and flexible,which can better meet the different needs in actual use.

作者吴克河朱海李为崔文超张晓亮程瑞 WU Ke-he;ZHU Hai;LI Wei;CUI Wen-chao;ZHANG Xiao-liang;CHENG Rui(North China Electric Power University,Beijing 102206,China)

机构地区华北电力大学

出处《信息技术》 2019年第11期5-9,共5页 Information Technology

基金国家电网科技项目(521304190004)

关键词数据脱敏 t-保密脱敏技术海林格距离隐私保护 data masking t-closeness Hellinger distance privacy preservation

分类号 TP309.2 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献4

1詹婉荣,于海.基于Hellinger距离的判断矩阵排序方法[J].洛阳师范学院学报,2017,36(11):4-7. 被引量：2
2陈炜,陈志刚,邓小鸿,黄伟琦.抵抗背景知识攻击的电子病历隐私保护新算法[J].计算机工程,2012,38(11):251-253. 被引量：7
3杨挺,薛质,施勇.基于K-匿名的隐私保护关键技术研究[J].信息技术,2016,40(12):6-9. 被引量：4
4韩建民,于娟,虞慧群,贾泂.面向数值型敏感属性的分级l-多样性模型[J].计算机研究与发展,2011,48(1):147-158. 被引量：23

二级参考文献34

1王应明.判断矩阵排序方法综述[J].决策与决策支持系统,1995(3):101-114. 被引量：100
2雷功炎.关于将相对熵用于层次分析的简单注记[J].系统工程理论与实践,1995,15(3):65-68. 被引量：31
3杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
4Samarati P, Sweeney L. Generalizing data to provide anonymity when disclosing information (abstract)[C] //Proc of the 17th ACM SIGMOD-SIGACT SIGART Syrup on the Principles of Database Systems. Piscataway, NJ: IEEE, 1998:188-3.88.
5Samarati P. Protecting respondents' identities in microdata release [J]. IEEE Trans on Knowledge and Data Engineering. 2001, 13 (6) : 1010-1027.
6Fung B C M, Wang K, Chen R, et al. Privacy-preserving data publishing: A survey on recent developments [J]. ACM Computing Surveys, 2010, 42(4): 1-53.
7Machanavajjhala A, Gehrke J, Kifer D. L-diversity: Privacy beyond k-anonymity [C] //Proc of the 22nd Int Conf on Data Engineering. Piscataway, NJ: IEEE, 2006. 24-36.
8Wong C R, Li J, Fu A, et al. (a, k)-anonymity: An enhanced k anonymity model for privacy preserving data publishing [C] //Proe of the 12th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2006, 754-759.
9Ye Xiaojun, Zhang Y W, Liu M. A personalized (a, k) anonymity model [C] //Proe of the 9th Int Conf on Web-Age Information Management. Berlin: Springer, 2008:341-348.
10Xiao Xiaokui, Tao Yufen. Personalized privacy preservation [C] //Proc of the 25th ACM SIGMOD Int Conf on Management of Data. New York: ACM, 2006:229-240.

共引文献32

1方炜炜,周长胜,贾艳萍,刘亚辉.基于SMC的分布式隐私保护数据发布研究[J].系统工程与电子技术,2012,34(11):2390-2395. 被引量：1
2杨静,王波.一种基于最小选择度优先的多敏感属性个性化l-多样性算法[J].计算机研究与发展,2012,49(12):2603-2610. 被引量：9
3李迎涛,马春光,杨文文.基于区域划分和排序的K-匿名算法[J].信息安全与通信保密,2013,11(4):76-80.
4刘晓娜,杜永文,蔺国梁.移动数据库中组合视图对隐私保护的应用[J].计算机光盘软件与应用,2013,16(13):13-14. 被引量：1
5刘晓娜,蔺国梁,杜永文.组合视图在移动数据库中隐私保护的应用[J].计算机光盘软件与应用,2013,16(12):273-274. 被引量：2
6刘晓娜,马少斌,王栋.移动数据库中基于k-匿名的隐私保护模型研究[J].计算机光盘软件与应用,2013,16(14):149-150.
7薄怀霞.数字图书馆个性化信息服务隐私保护技术研究[J].图书馆学刊,2014,36(2):112-115. 被引量：10
8杨静,原永滨,于旭.基于聚类的增强L-多样性模型实现算法[J].小型微型计算机系统,2014,35(8):1848-1851. 被引量：2
9杨静,王超,张健沛.基于敏感属性熵的微聚集算法[J].电子学报,2014,42(7):1327-1337. 被引量：13
10刘明辉,张尼,张云勇,胡坤,宫雪,曲大林.云环境下的敏感数据保护技术研究[J].电信科学,2014,30(11):1-8. 被引量：40

同被引文献65

1吴欢,应俊,王逸飞,胡华宇,徐洪丽,郑一琼.乳腺癌病理文本的结构化信息提取[J].解放军医学院学报,2020,41(7):746-751. 被引量：8
2李雅琪,余雪松,温晓君.加强智能网联汽车数据安全管理刻不容缓[J].数字经济,2021(6):66-69. 被引量：3
3杨晓春,刘向宇,王斌,于戈.支持多约束的K-匿名化方法[J].软件学报,2006,17(5):1222-1231. 被引量：60
4王珊,王会举,覃雄派,周烜.架构大数据:挑战、现状与展望[J].计算机学报,2011,34(10):1741-1752. 被引量：614
5邓雪,李家铭,曾浩健,陈俊羊,赵俊峰.层次分析法权重计算方法分析及其应用研究[J].数学的实践与认识,2012,24(7):93-100. 被引量：2052
6熊平,朱天清,王晓峰.差分隐私保护及其应用[J].计算机学报,2014,37(1):101-122. 被引量：172
7阮鹤瑞,刘晓明,金疆山,刘海涛,窦蕾,苏晓津.病案首页填写缺陷分析及对策建议[J].中国病案,2015,16(2):20-24. 被引量：46
8郭珉江,代涛,万艳丽,黄薇.加拿大卫生信息化建设经验及启示[J].中国数字医学,2015,10(7):15-19. 被引量：11
9查雅行,罗守山,卞建超,李伟.基于多分支认证树的多用户多副本数据持有性证明方案[J].通信学报,2015,36(11):80-91. 被引量：10
10代涛.健康医疗大数据发展应用的思考[J].医学信息学杂志,2016,37(2):2-8. 被引量：62

引证文献7

1叶久峰,陈新磊,钟炜.健康大数据平台中数据脱敏技术的研究[J].科学大众（科技创新）,2020,0(4):88-89. 被引量：2
2高文辉.大数据平台下敏感数据保护模型探讨[J].IT经理世界,2020(1):78-79.
3叶琳,罗铁清.医疗数据治理综述[J].计算机时代,2021(5):10-12. 被引量：11
4王辉,廉芳芳,申自浩.结合四叉树划分的差分隐私位置发布算法[J].小型微型计算机系统,2021,42(11):2394-2399. 被引量：1
5佟玲玲,李鹏霄,段东圣,任博雅,李扬曦.面向异构大数据环境的数据脱敏模型[J].北京航空航天大学学报,2022,48(2):249-257. 被引量：11
6王虹.基于DP-FIM的社区医疗物联网敏感数据保护方法[J].信息技术,2022,46(11):106-110.
7葛欣,董建阔,陈滏媛,董振江.智能网联汽车数据安全检测研究现状[J].现代交通与冶金材料,2023,3(3):30-42.

二级引证文献25

1叶琳,罗铁清.医疗数据治理综述[J].计算机时代,2021(5):10-12. 被引量：11
2徐李阳,李慧芹,赵文华,谢瑞楠,王蕾.基于DCGAN反馈的大数据安全静态脱敏系统设计[J].信息与电脑,2022,34(2):120-122.
3陈毫博,董曲文.基于行为分阶段转变模型的个体健康干预信息系统设计和开发[J].中国卫生产业,2022,19(1):136-139.
4唐凯,张国明,楚胜翔.基于数据脱敏技术的大数据隐私安全应用与实践[J].中国卫生信息管理杂志,2022,19(3):436-442. 被引量：6
5尚诗,袁骏毅,岑星星.基于EMPI心肌病专病数据库的构建[J].中国医疗设备,2022,37(6):115-118. 被引量：4
6陈志涛,金波,郭铭雅,李苗苗.大数据平台数据脱敏技术问题探究[J].通信与信息技术,2022(4):31-33. 被引量：1
7林伟,周耀铭.国内外数据治理研究述评[J].数字图书馆论坛,2022(6):65-72. 被引量：13
8张弘政,刘迷迷,李琳,承垠林,周毅.基于通用数据模型的健康医疗大数据平台数据治理研究[J].医学信息学杂志,2022,43(6):2-7. 被引量：12
9吴龙,严晓明,陈秀娟,麦尔丹·吐鲁甫,黎美秀,刘立宇,张帆,高云鹤,梁会营,杨小红.医疗数据湖建设及医疗数据治理探索[J].医学信息学杂志,2022,43(6):8-13. 被引量：9
10何仲廉,刘少堃,冯晨阳,刘迷迷,周毅,李超峰.基于双闭环模式的医院数据质量提升方法研究与实践[J].医学信息学杂志,2022,43(6):24-29.

1每月读评[J].人才资源开发,2019(20).
2王生贵.节能要求对建筑施工技术改良的探究[J].城镇建设,2019,0(7):51-51.
3金焕.血液透析患者并发感染的相关因素分析及护理干预[J].医学信息（医学与计算机应用）,2014,0(18):320-321.
4王中,王崇霞,张安玲.泛洪攻击下链路网络敏感数据防篡改仿真[J].计算机仿真,2019,36(10):285-288. 被引量：4
5杨青.甲醇制氢在工业应用中的工艺改良研究[J].云南化工,2019,46(9):162-163. 被引量：2
6车满.“十一”黄金周跨境消费迅速增长[J].计算机与网络,2019,45(20):13-13.
7理财/经济[J].理财周刊,2019,0(27):6-6.
8张凯.9月直销行业舆情报告[J].知识经济．中国直销,2019,0(11):100-106.
9万义飞,苏蓝天.探究大数据安全和隐私保护技术的架构[J].现代信息科技,2019,0(15):165-166.
10王炳棋.组合式变户关系测试箱设计与应用研究[J].电子测试,2019,0(21):120-122.

信息技术

2019年第11期

浏览历史

内容加载中请稍等...

基于敏感信息度量的t-保密脱敏技术改良被引量：7

参考文献4

二级参考文献34

共引文献32

同被引文献65

引证文献7

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

基于敏感信息度量的t-保密脱敏技术改良 被引量：7

参考文献4

二级参考文献34

共引文献32

同被引文献65

引证文献7

二级引证文献25

相关作者

相关机构

相关主题

浏览历史

基于敏感信息度量的t-保密脱敏技术改良被引量：7