-
题名加密云数据下基于Simhash的模糊排序搜索方案
被引量:27
- 1
-
-
作者
杨旸
杨书略
柯闽
-
机构
福州大学数学与计算机科学学院
网络系统信息安全福建省高校重点实验室
福州大学物理与信息工程学院
-
出处
《计算机学报》
EI
CSCD
北大核心
2017年第2期431-444,共14页
-
基金
国家自然科学基金(61402112,61472307,61472309,61303198)
福建省教育厅科技项目(JA12028)
+1 种基金
福建省重大科技项目(2015H6013)
福州大学科技发展基金项目(2012-XY-17)资助
-
文摘
为了保护数据隐私,数据拥有者会将敏感数据的密文外包到云服务器,这使得传统明文搜索技术难以使用.因此可搜索加密技术被用于对密文数据进行搜索,实现高效的数据利用.然而目前在加密云数据中,关键词模糊搜索方案主要是通过构造关键词模糊集合来实现,其需要大量的计算和存储开销.本文提出的搜索方案,无需构造关键词模糊集合,而是基于Simhash的降维思想,将文档关键词做n-gram处理并得到Simhash指纹来实现模糊搜索.该文结合汉明距离和关键词相关度分数,设计了双因子排序算法对查询结果进行排序.使用树索引结构和新型遍历方法进一步提高了搜索效率.通过新型遍历方法,即使树的节点值与期望值不相等,也能够对树进行遍历.理论分析和实验结果表明:该方案实现了加密云数据下的关键词模糊搜索,同时极大地节约了时间和空间成本.
-
关键词
云计算
加密云数据
隐私保护
可搜索加密
模糊排序搜索
Simhash
-
Keywords
cloud computing
encrypted cloud data
privacy-preserving
searchable encryption
ranked fuzzy keyword search
Simhash
-
分类号
TP309
[自动化与计算机技术—计算机系统结构]
-