期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于分区索引的集合相似连接 被引量:3
1
作者 洪银杰 陈刚 陈珂 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第2期286-293,共8页
针对传统的索引和过滤算法处理在线相似连接时的不足,提出新的索引方法和过滤算法.在采用倒排索引的基础上,将索引按照位置和长度的相关信息进行划分,以减少查询空间,加强倒排索引的执行效率.此外,设计加权签名过滤算法,用来估计2个集... 针对传统的索引和过滤算法处理在线相似连接时的不足,提出新的索引方法和过滤算法.在采用倒排索引的基础上,将索引按照位置和长度的相关信息进行划分,以减少查询空间,加强倒排索引的执行效率.此外,设计加权签名过滤算法,用来估计2个集合交的长度的上限,提高过滤的效率.集合的相似连接通常应用于过滤-验证的工作框架里,主要采用2个步骤:先产生候选结果集合;再对候选集合进行验证.通过对真实数据集的实验,结果表明,该过滤算法可以和其他过滤算法一起协同应用于过滤-验证的工作框架里,对数据进行在线相似连接处理,同时在计算效率上也有显著的提升. 展开更多
关键词 相似连接 分区 加权签名 过滤 相似函数
下载PDF
不确定集值数据的高效相似查询
2
作者 陈珂 洪银杰 陈刚 《软件学报》 EI CSCD 北大核心 2012年第6期1588-1601,共14页
基于可能世界的不确定集合的相似查询,从语义上或者从计算方法的角度来看,都有别于传统的确定型集合上的技术.由于集合中的项存在不确定性,即一个项出现在集合中是有一定概率的,使得传统处理集合的技术不再适用.提出了一个基于可能世界... 基于可能世界的不确定集合的相似查询,从语义上或者从计算方法的角度来看,都有别于传统的确定型集合上的技术.由于集合中的项存在不确定性,即一个项出现在集合中是有一定概率的,使得传统处理集合的技术不再适用.提出了一个基于可能世界的集合期望相似度的度量公式.在期望的度量公式中,如果一对集合(X,Y)的期望相似度大于给定的阈值(0,1),则被称为相似集合对.一般的算法,在基于可能世界的情况下计算不确定集合的期望相似度,其复杂度是指数级的.提出了利用动态规划来计算集合期望相似度的算法,该算法的复杂度是多项式级别,极大地减少了计算时间.实验结果表明了基于该算法查询的可用性和高性能. 展开更多
关键词 相似查询 期望相似度 动态规划 不确定集值
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部