期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Minwise Hash动态双重阈值过滤器
1
作者
袁鑫攀
曹阳
+1 位作者
龙军
赵贵虎
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2016年第7期1075-1081,共7页
结合二项分布和小概率原理进行理论推导,提出了Minwise Hash的动态双重阈值过滤器,将比对过程划分为多个比对点,并设置各比对点的动态阈值,过滤相似度低于下界阈值TL(k)的文档,输出相似度高于上界阈值TU(k)的文档.该提前过滤的方法减少...
结合二项分布和小概率原理进行理论推导,提出了Minwise Hash的动态双重阈值过滤器,将比对过程划分为多个比对点,并设置各比对点的动态阈值,过滤相似度低于下界阈值TL(k)的文档,输出相似度高于上界阈值TU(k)的文档.该提前过滤的方法减少了后续的比对次数,降低了工作量,并设计了多组实验,结果显示过滤器在选取了适当的参数时,计算时间仅为原Minwise Hash的31%或原b位Minwise Hash的36%,较大地提升了原算法的时间效率.动态双重阈值过滤器不仅能应用于Minwise Hash,也能用于它的变种算法(如b位Minwise Hash),乃至所有符合二项分布的估计子.
展开更多
关键词
动态双重阈值
相似性检测
哈希
小概率事件
下载PDF
职称材料
题名
Minwise Hash动态双重阈值过滤器
1
作者
袁鑫攀
曹阳
龙军
赵贵虎
机构
湖南工业大学计算机与通信学院
中南大学信息科学与工程学院
出处
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2016年第7期1075-1081,共7页
基金
国家自然科学基金面上项目(No.61402165)
湖南省自然科学基金面上项目(No.2015JJ3058)
+2 种基金
湖南工业大学自然科学基金(No.2014HZX17)
湖南省教育厅科技研究项目(No.14C0325)
湖南省教育厅科学研究基金(No.15C1288)
文摘
结合二项分布和小概率原理进行理论推导,提出了Minwise Hash的动态双重阈值过滤器,将比对过程划分为多个比对点,并设置各比对点的动态阈值,过滤相似度低于下界阈值TL(k)的文档,输出相似度高于上界阈值TU(k)的文档.该提前过滤的方法减少了后续的比对次数,降低了工作量,并设计了多组实验,结果显示过滤器在选取了适当的参数时,计算时间仅为原Minwise Hash的31%或原b位Minwise Hash的36%,较大地提升了原算法的时间效率.动态双重阈值过滤器不仅能应用于Minwise Hash,也能用于它的变种算法(如b位Minwise Hash),乃至所有符合二项分布的估计子.
关键词
动态双重阈值
相似性检测
哈希
小概率事件
Keywords
dynamic double-threshold
similarity detection
Hash
small probability event
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Minwise Hash动态双重阈值过滤器
袁鑫攀
曹阳
龙军
赵贵虎
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2016
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部