不确定集值数据的高效相似查询

Efficient Processing of Similarity Search on Uncertain Set-Valued Data

下载PDF

导出

摘要基于可能世界的不确定集合的相似查询,从语义上或者从计算方法的角度来看,都有别于传统的确定型集合上的技术.由于集合中的项存在不确定性,即一个项出现在集合中是有一定概率的,使得传统处理集合的技术不再适用.提出了一个基于可能世界的集合期望相似度的度量公式.在期望的度量公式中,如果一对集合(X,Y)的期望相似度大于给定的阈值(0,1),则被称为相似集合对.一般的算法,在基于可能世界的情况下计算不确定集合的期望相似度,其复杂度是指数级的.提出了利用动态规划来计算集合期望相似度的算法,该算法的复杂度是多项式级别,极大地减少了计算时间.实验结果表明了基于该算法查询的可用性和高性能. Setting similarity search on possible worlds is semantically and computationally different from the traditional technique for sets of certain data. Considering the uncertainty of items of set, i.e. there is a certain probability for an item appearing in a set, the traditional technique used for processing sets is not applicable. This paper brings forward the formulas to measure the expected similarity of the sets based on possible worlds＇ semantics. In the expected contexts, if the expected similarity of a pair of sets （X, Y） is larger than a given threshold value τ∈（0,1）, this pair could be called as similar set pair. In the normal algorithm, the complexity of the expected similarity of uncertain sets based on possible worlds is of exponential order. This paper has provided new algorithms to calculate expected similarity by dynamic programming. The complexity of these algorithms is of polynomial order and they reduce execution time greatly. The final experiments have indicated the usability and the high performance of the new algorithms.

作者陈珂洪银杰陈刚

机构地区浙江大学计算机科学与技术系

出处《软件学报》 EI CSCD 北大核心 2012年第6期1588-1601,共14页 Journal of Software

基金国家自然科学基金(60803003 60970124)

关键词相似查询期望相似度动态规划不确定集值 similarity search expected similarity dynamic programming uncertain set

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1高庆狮,高小宇,胡月.概率论基本部分与模糊集合理论的统一定义[J].大连理工大学学报,2006,46(1):141-150. 被引量：15

二级参考文献4

1高庆狮.Zadeh模糊集合理论存在问题证明及其改进——一个满足全部经典集合公式的C-模糊集合系统[J].大连理工大学学报,2005,45(5):772-780. 被引量：13
2DUBOIS D, PRADE H. Fuzzy Sets and Systems:Theory and Applications [M], New York;Academic Press, 1980.
3DEVORE J L. Probability and Statistics, For Engineering and the Sciences [M]. Beijing:Thomson Learning Asia Pte Ltd, 2000.
4ZADEH L A. Fuzzy sets[J].Inf and Control,1965,8: 338-353.

共引文献14

1李丽莉.浅谈模糊集测度与概率[J].中国科教创新导刊,2008(32):53-54.
2苏发慧.清晰数的运算及应用[J].吉首大学学报（自然科学版）,2010,31(4):10-14. 被引量：4
3汪洋.关于Zadeh模糊集合论基础的一个注记[J].西南民族大学学报（自然科学版）,2008,34(1):57-60. 被引量：2
4田一鸣,黄友锐,黄宜庆.对模糊集、Vague集和C^＊-模糊集的比较研究[J].安徽理工大学学报（自然科学版）,2008,28(3):38-41.
5马振明.C-模糊拓扑空间及其应用[J].临沂师范学院学报,2009,31(3):22-25.
6胡劲松,闫伟,王磊.离散模糊需求报童问题的可信性模型研究[J].运筹与管理,2009,18(4):10-15. 被引量：3
7万中,梁文冬,卢宗娟.决策模糊集覆盖系数的实用计算方法[J].经济数学,2010,27(4):22-27.
8万中,梁文冬,卢宗娟.模糊数的隶属度区间分布函数[J].重庆理工大学学报（自然科学）,2011,25(1):107-112. 被引量：25
9王琳,刘保东.随机可变模糊识别模型在清洁生产评价中的应用[J].山东大学学报（工学版）,2013,43(1):54-62. 被引量：1
10苏发慧.清晰数的比较[J].安徽建筑大学学报,2015,23(2):79-81.

1许统德.基于改进LLE的高维数据离散化方法[J].计算机科学,2015,42(S1):146-150 157. 被引量：2
2莫红枝,吴兰岸.Word的"邮件合并"功能在中小学教学中的妙用[J].电脑知识与技术（过刊）,2007(14).
3张佩,张清华.基于变精度粗糙集的FCM聚类算法[J].山西大学学报（自然科学版）,2016,39(3):342-348.
4王金凤,侯德文,刘明明.一种基于SSIM的非局部均值图像去噪算法[J].山东师范大学学报（自然科学版）,2014,29(3):17-20.
5张清华,薛玉斌,王国胤.粗糙集的最优近似集[J].软件学报,2016,27(2):295-308. 被引量：32
6刘晓锋,吴亚娟,李明东.一种基于模糊聚类的资源发现策略[J].计算机应用,2007,27(9):2227-2229. 被引量：3
7杨晓霞,王建立,孟浩然.自适应光学中的控制算法设计与仿真[J].光学与光电技术,2012,10(2):25-31. 被引量：1
8李晓宇,张新峰,沈兰荪.中医舌象信息融合方法的研究[J].测控技术,2007,26(5):26-28. 被引量：3
9荣垂田,徐天任,杜小勇.基于划分的集合相似连接[J].计算机研究与发展,2012,49(10):2066-2076. 被引量：7
10马晨明,黄德才,吴天虹,翁挺.基于QoS的网格资源聚类管理[J].浙江工业大学学报,2009,37(4):421-425. 被引量：2

软件学报

2012年第6期

浏览历史

内容加载中请稍等...

不确定集值数据的高效相似查询

参考文献1

二级参考文献4

共引文献14

相关作者

相关机构

相关主题

浏览历史