期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
ES_SSE:一种文本重复检测方法
1
作者 杨荣 李兵 +2 位作者 王电化 吴谋 邓树文 《计算机应用与软件》 北大核心 2018年第7期286-289,333,共5页
对集合的相似性进行高效估计,在计算机的很多应用中都是要解决的一个核心问题。基于原始最小哈希算法,提出一种压缩二进制解决框架ES_SSE(Even Sketch for Set Similarity Estimation)来对集合间的杰卡德相似系数进行估计。对ES_SSE和b-... 对集合的相似性进行高效估计,在计算机的很多应用中都是要解决的一个核心问题。基于原始最小哈希算法,提出一种压缩二进制解决框架ES_SSE(Even Sketch for Set Similarity Estimation)来对集合间的杰卡德相似系数进行估计。对ES_SSE和b-bit进行了模型介绍,并详细描述了ES_SSE的构造原理;分析了Jaccard similarity估计所利用的理论模型基础,并建立了估计量模型;通过实验验证了ES_SSE的高效性能,当J值大于80%时,ES_SSE比b-bit的性能优势更加明显。 展开更多
关键词 相似性 哈希算法 杰卡德相似性 b位最小哈希 估计量
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部