期刊文献+

面向网络搜索日志的发布方法研究 被引量:1

Search Log Anonymity Publish Based on Differential Privacy and Classification Technique
下载PDF
导出
摘要 搜索日志分析是数据挖掘和机器学习的重要研究内容,网络搜索日志中的隐私数据安全成为当前面临的重大挑战,提出一种分类匿名化技术与差分隐私相结合的搜索日志匿名化发布方法.首先,将k-匿名的思想与分类匿名化技术扩展到聚类方法中,分类概化准标识属性引导形成簇,所提出的查询项相似度计算方法有效改善聚类精度;其次,在簇中分别添加指数噪音数据,且使发布的数据满足差分隐私保护;最后发布处理后的数据.实验表明:该方法有效地防止搜索日志中敏感信息泄露,并提高了数据的实用性. The search logs analysis is the important research area of data mining and machine learning,the data privacy preserving of network search logs has been a big challenge at home and abroad,this paper proposed a search log anonymous publish method based on classification anonymous technique and differential privacy.First we combine the k-anonymity and classification anonymous into cluster method,classifying the quasi-identifier attribute to cluster.In order to improve the data accuracy,we introduce the search similarity calculate method;Then we add exponent noise to the cluster and make sure it satisfies the differential privacy protection;Finally we release the protection result data set.The experiments shows that it can prevent the loss of sensitive information,protecting the network search log's privacy data and improving the data availability.
出处 《信息安全研究》 2016年第3期251-257,共7页 Journal of Information Security Research
基金 北京市社会科学基金项目(15JGB099) 北京市优秀人才培养资助项目(2013E005007000001) 国家自然科学基金项目(61370139)
关键词 差分隐私 隐私保护 网络搜索日志 数据发布 分类技术 differential privacy privacy preserving search log data publish classification technique
  • 相关文献

参考文献5

二级参考文献56

  • 1余刚,裴仰军,朱征宇,陈华月.基于词汇语义计算的文本相似度研究[J].计算机工程与设计,2006,27(2):241-244. 被引量:25
  • 2余慧佳,刘奕群,张敏,茹立云,马少平.基于大规模日志分析的搜索引擎用户行为分析[J].中文信息学报,2007,21(1):109-114. 被引量:117
  • 3程涛,施水才,王霞,吕学强.基于同义词词林的中文文本主题词提取[J].广西师范大学学报(自然科学版),2007,25(2):145-148. 被引量:11
  • 4关毅,王晓龙.基于统计的汉语词汇间语义相似度计算[C]//全国第七届计算语言学联合学术会议论文集,哈尔滨,2003:221-227.
  • 5YU Sheng-quan,HE Ke-kang.The Research of Adaptive Learning System Based on Internet[C] ∥The Third Global Chinese Computer Application Conference Analects.Macao,China:Macao University Press,1999:34-40.
  • 6梅家驹,竺一鸣,高蕴琦,等.同义词词林[M].上海:上海辞书出版社,1993:106-108.
  • 7刘群,李素建.基于"知网"的词汇语义相似度计算[C] ∥计算语言学与中文语言处理--第三届汉语词汇语义学研讨会论文集.台北:台北市中研院语言学研究所,2002:59-76.
  • 8Cockburn,A.,& Jones,S.Which way now? Analyzing and easing inadequacies in WWW navigation[J].International Journal of Human-Computer Studies,1996,45,105-129.
  • 9Catledge,L.D.,& Pitkow,J.E.Characterizing Browsing Strategies in the World-Wide Web[J].Computer Networks and ISDN Systems,1995,27,1065-1073.
  • 10Tauscher,L.,& Greenberg,S.How people revisit web pages:Empirical findings and implications for the design of history systems[J].International Journal of Human-Computer Studies,1997,47,97-137.

共引文献306

同被引文献9

引证文献1

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部