高维空间中数据的相似性度量被引量：20

Similarity Measurement Of Data In High-dimensional Spaces

导出

摘要高维空间中数据之间的相似性度量是目前数据挖掘、信息处理与检索等领域所面临的一个重要问题.文章在总结分析了高维数据的特点以及现有的一些度量方法的基础上,提出了一种新的度量方式,该方法在对高维数据进行相似性度量之前,首先对原始数据空间进行网格划分.文章的最后对其有效性作了定量分析,实验证明,该方式是行之有效的. Similarity measurement of data in high-dimensional spaces is an important problem in most current research domains such as data mining, information processing ＆ searching, etc.. After the summarization and analysis of the characteristics of high-dimensional data and existing typical measurement methods, this paper proposes a new measurement approach based on a special grid splitting strategy. In order to illustrate the efficiency of the proposed method in high-dimensional spaces, a quantitative analysis is given in the paper. Experiment indicates that this method is efficacious,

作者贺玲吴玲达蔡益朝

机构地区国防科技大学信息系统与管理学院

出处《数学的实践与认识》 CSCD 北大核心 2006年第9期189-194,共6页 Mathematics in Practice and Theory

基金国家自然科学基金(60473117)

关键词维度灾难相似度量距离度量 curse of dimensionality similarity measurement distance measurement

分类号 O241 [理学—计算数学]

引文网络
相关文献

参考文献7

1Yannis Sismanis. Nick Roussopoulos. The dwarf data cube eliminates the high dimensionality eurse[R]. TR-CS4552. University of Maryland, 2003.
2Pitor Indyk. Rajeev Motvani. Approximate nearest neighbo::s: Toward removing the curse of dimensionality[C].In ACM Symposium on Theory of Computing. 1998.
3Bellmann R. Adaptive Control Processes: A Guided Tour[M]. Princeton University Press. 1961.
4Jerome H Friedman. Flexible metric nearest neighbor classification [R]. Technical Report, Department of Statistics, Stanford University, 1994.
5汪祖媛,庄镇泉,王煦法.逐维聚类的相似度索引算法[J].计算机研究与发展,2004,41(6):1003-1009. 被引量：5
6Ishikawa Y, Suhramanya R, Faloustos C. Minder Reader: Query database through multiple examples[C]. In Proc of VLDB 1998.
7Beyer K. Goldstein J. Ramarkrishnan R. When is nearest neighbor meaningful?[C]. Proc of the Int Conf Database Theorie. 1999.

二级参考文献9

1M Flickner, H Sawhney, W Niblack, et al. Query by image and video content: The QBIC system. IEEE Computer, 1995, 28(9): 23～32
2A Guttman. R-tree: A dynamic index structure for spatial searching. ACM SIGMOD, Boston, MA, 1984
3N Bechmann, H P Kriegel, R Schneider, et al. The R * -tree: An efficient and robust access method for points and rectangles. In:Proc of ACM SIGMOD. Atlantic: ACM Press, 1990. 322～331
4K Norio, Shin' ichi Scaoh. The SR-tree: An index structure for high-dimensional nearest neighbor queries. In: Proc of the 16th ACM SIGACT-SIGMOD-SIGART Symp on PODS. New York:ACM Press, 1997. 369～380
5D A White, R Jain. Similarity indexing with the SS-tree. The 12th Int'l Conf on Data Engineering, New Orleans, LA, 1996
6J T Robinson. The K-D-B-tree: A searching structure for large multidimensional dynamic indexes. ACM SIGMOD, Ann Arbor,USA, 1981
7S Berchtold, D A Keim, H P Kriegel. The X-tree: An index structure for high-dimensional data. The 22nd V1DB Conf,Bombay, India, 1996
8R Weber, S Blott. An approximation-based data structure for similarity search. Institute of Information System, ETHZ, Tech Rep: 24, 1997
9J H Friedman. Flexible metric nearest neighbor classification.Department of Statistics, Stanford University, Tech Rep: 113,1994

共引文献4

1贺玲,吴玲达,蔡益朝,谢毓湘,雷震.多媒体数据挖掘中数据间的相似性度量研究[J].国防科技大学学报,2006,28(1):77-80. 被引量：5
2詹棠森,林卫中.基于数据最优分区间相似度算法及应用[J].数学的实践与认识,2009,39(20):31-34. 被引量：6
3邵昌昇,楼巍,严利民.高维数据中的相似性度量算法的改进[J].计算机技术与发展,2011,21(2):1-4. 被引量：23
4贺玲,蔡益朝,杨征.高维数据空间的一种网格划分方法[J].计算机工程与应用,2011,47(5):152-153. 被引量：4

同被引文献207

1宋运红,李振祥,孙连辉,贾大成,部雪娇.马氏距离与欧氏距离方法在地球化学异常处理中的对比[J].吉林地质,2008,27(4):117-120. 被引量：16
2张婷,徐守余.储层地质建模技术研究与展望[J].长春理工大学学报（高教版）,2009(4):191-192. 被引量：12
3苏静,赵毅强,何家骥,刘沈丰.旁路信号主成分分析的欧式距离硬件木马检测[J].微电子学与计算机,2015,32(1):1-4. 被引量：13
4李红莲,王春花,袁保宗,朱占辉.针对大规模训练集的支持向量机的学习策略[J].计算机学报,2004,27(5):715-719. 被引量：53
5Sen Wu,Xuedong Gao Management School, University of Science and Technology Beijing, Beijing 100083, China.CABOSFV algorithm for high dimensional sparse data clustering[J].Journal of University of Science and Technology Beijing,2004,11(3):283-288. 被引量：7
6汪祖媛,庄镇泉,王煦法.逐维聚类的相似度索引算法[J].计算机研究与发展,2004,41(6):1003-1009. 被引量：5
7冯守平.平面上有限个点到直线的距离和最小的问题[J].大学数学,2004,20(4):79-83. 被引量：11
8王源华.非阿基米德局部域上的最小二乘法与最小距离和(英文)[J].中国科学院研究生院学报,2004,21(4):447-450. 被引量：2
9李少华,张昌民,彭裕林,张尚锋,陈新民,姚凤英.储层不确定性评价[J].西安石油大学学报（自然科学版）,2004,19(5):16-19. 被引量：13
10李德毅,刘常昱,杜鹢,韩旭.不确定性人工智能[J].软件学报,2004,15(11):1583-1594. 被引量：394

引证文献20

1文贵华.面向机器学习的相对变换[J].计算机研究与发展,2008,45(4):612-618. 被引量：10
2黄斯达,陈启买.基于相似性度量的高维聚类算法的研究[J].微计算机信息,2009,25(27):187-188. 被引量：4
3黄斯达,陈启买.一种基于相似性度量的高维数据聚类算法的研究[J].计算机应用与软件,2009,26(9):102-105. 被引量：13
4詹棠森,林卫中.基于数据最优分区间相似度算法及应用[J].数学的实践与认识,2009,39(20):31-34. 被引量：6
5赵兹,马江洪.信息检索中的两个数据融合方法比较[J].计算机应用,2010,30(A01):54-56. 被引量：1
6邵昌昇,楼巍,严利民.高维数据中的相似性度量算法的改进[J].计算机技术与发展,2011,21(2):1-4. 被引量：23
7武森,叶俞飞,俞晓莉.拓展集合差异度高维数据聚类[J].计算机应用研究,2011,28(9):3253-3255.
8孙启林,方宏彬,张健,刘明术.一种基于相似度量的离群点检测方法[J].重庆工商大学学报（自然科学版）,2012,29(10):96-100. 被引量：2
9刘明术,方宏彬,张建,孙启林.属性相似度在聚类算法中的有效性研究[J].计算机应用与软件,2012,29(9):146-147. 被引量：4
10詹棠森,赵微,汤可宗.基于向量值有理插值的最优预测算法研究及陶瓷需求量预测的应用[J].数学的实践与认识,2012,42(21):78-82. 被引量：1

二级引证文献88

1张杰鑫,庞建民,张铮.拟态构造的Web服务器异构性量化方法[J].软件学报,2020,31(2):564-577. 被引量：10
2杨晟,李学军,刘涛,王珏.高分辨率遥感影像匹配中的相似性度量综述[J].测绘与空间地理信息,2013,36(5):16-21. 被引量：2
3廖松博,何震瀛.HDCH:MapReduce平台上的音频数据聚类系统[J].计算机研究与发展,2011,48(S3):472-475. 被引量：3
4文贵华,陆庭辉,江丽君,文军.基于相对流形的局部线性嵌入[J].软件学报,2009,20(9):2376-2386. 被引量：5
5贺杨成,王士同,江南,王亮.一种面向GIS系统的高维数据双层聚类方法[J].微计算机信息,2010,26(34):179-181.
6易淼,刘小兰.基于相对变换的半监督分类算法[J].计算机应用,2011,31(10):2793-2795. 被引量：2
7唐德权,张悦,贺永恒,肖自红.基于图数据挖掘算法的犯罪规律研究及应用[J].计算机技术与发展,2011,21(11):89-91. 被引量：2
8王俊,刘刚.基于粒子群优化聚类的温室无线传感器网络节能方法[J].农业工程学报,2012,28(7):172-177. 被引量：8
9石怀涛,刘建昌,张羽,李龙.基于相对变换PLS的故障检测方法[J].仪器仪表学报,2012,33(4):816-822. 被引量：23
10谢明霞,王家耀,郭建忠,陈科.不等距划分的高维相似性度量方法研究[J].武汉大学学报（信息科学版）,2012,37(7):780-783. 被引量：3

1侯淑莲,王广新,赵强,谢寰彤,李石玉.磁共振成像中数据空间与k空间转化的推导及讨论[J].物理通报,2011,40(12):16-19. 被引量：3
2Ru-xu LIAN,Ming-jie LI.Stability of Weak Solutions for the Compressible Navier-Stokes-Poisson Equations[J].Acta Mathematicae Applicatae Sinica,2012,28(3):597-606. 被引量：1
3方又超.公理化定义的欧氏空间的教学探析[J].德宏师范高等专科学校学报,2014,23(1):101-103.
4LI HaiLiang,ZHANG Ting.Large time behavior of solutions to 3D compressible Navier-Stokes-Poisson system[J].Science China Mathematics,2012,55(1):159-177. 被引量：7
5谢玉霞,刘晶.含三体相互作用海森堡链的几何量子失谐[J].西安邮电大学学报,2016,21(4):83-87.
6吴润民,张晓华,秦克云.粗糙模糊集的若干区别度度量探讨[J].西南民族大学学报（自然科学版）,2009,35(6):1139-1142.
7TAO XueTao,WANG Bin,ZHANG LiMing.A new approach based on orthogonal bases of data space to decomposition of mixed pixels for hyperspectral imagery[J].Science in China(Series F),2009,52(5):843-857.
8赵志祥,刘彤.带有不确定性的多元变量的最小二乘分析方法[J].原子能科学技术,1995,29(2):185-188.
9钟延生.Hausdorff维数与Fractal维数等价范数下的不变性[J].宁德师范学院学报（自然科学版）,2013,25(4):337-341.
10于德介,雷慧.一种基于神经网络的结构参数识别方法[J].湖南大学学报（自然科学版）,1999,26(4):39-43. 被引量：13

数学的实践与认识

2006年第9期

浏览历史

内容加载中请稍等...

高维空间中数据的相似性度量被引量：20

参考文献7

二级参考文献9

共引文献4

同被引文献207

引证文献20

二级引证文献88

相关作者

相关机构

相关主题

浏览历史

高维空间中数据的相似性度量 被引量：20

参考文献7

二级参考文献9

共引文献4

同被引文献207

引证文献20

二级引证文献88

相关作者

相关机构

相关主题

浏览历史

高维空间中数据的相似性度量被引量：20