基于模糊数学的高维稀疏数据聚类统计方法设计

Design of Clustering Statistics Method for High-dimensional Sparse Data based on Fuzzy Mathematics

下载PDF

导出

摘要传统的数据聚类统计方法仅适用于低维数据聚类问题,为此,设计了基于模糊数据的高维稀疏数据聚类统计方法,以期提升高维稀疏数据的聚类统计效果.以模糊C均值聚类算法为基础,通过优化初始聚类中心解决局部最优问题,缩短聚类统计时间;然后引入权重机制,令该方法适用于高维稀疏数据聚类统计.基于此,以余弦距离替换原有的欧几里德距离,提高高维稀疏数据聚类统计效果.实验证明:在数据维度不同时,该方法均有较优的聚类统计效果.当数据维度较低时,分块比例为10%时聚类统计效果最优;当数据维度较高时,分块比例为40%时聚类统计效果最优.在不同稀疏度等级时,该方法的命中率和聚类统计效率均较高. Traditional data clustering statistics method is only applicable to low dimensional data clustering problem,therefore,this study designed a high-dimensional sparse data clustering based on fuzzy data statistical method,the clustering of high-dimensional sparse data statistics results.Based on the fuzzy C-means clustering algorithm,by optimizing the initial clustering center,solve the problem of local optimum,shorten the clustering statistics time;Then weighting mechanism are introduced,the method is suitable for high-dimensional sparse data clustering statistics.Based on this,in order to replace the original Euclidean distance,cosine distance to improve the effect of high-dimensional sparse data clustering statistics.Experiments show:the data dimension is not at the same time,this method has a better clustering effect of statistics.When data dimension is low,partitioned clustering statistics result when compared with 10%of the optimal;When high dimension data,block ratio is 40%when the optimal clustering statistics effect.In the sparse degree of different grade,the shooting and cluster statistical efficiency of the method are high.

作者周燕茹 ZHUO Yanru(School of Mathematics and Statistics,Chaohu University,Chaohu 238000,China)

机构地区巢湖学院数学与统计学院

出处《吉林化工学院学报》 CAS 2021年第9期107-111,共5页 Journal of Jilin Institute of Chemical Technology

关键词模糊数学高维稀疏数据聚类统计模糊C均值聚类中心余弦距离 fuzzy mathematics high-dimensional sparse data clustering statistics fuzzy C-means the clustering center cosine distance

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1钱雪忠,姚琳燕.面向稀疏高维大数据的扩展增量模糊聚类算法[J].计算机工程,2019,45(6):75-81. 被引量：18
2万静,吴凡,何云斌,李松.新的降维标准下的高维数据聚类算法[J].计算机科学与探索,2020,14(1):96-107. 被引量：18
3仇功达,何明,祝朝政,杨杰,刘勇.基于稀疏交界最大密度连通的模糊聚类方法[J].计算机工程与应用,2018,54(14):82-88. 被引量：3
4朱毅,杨航,吕泽华,陈传波,邹小威.一种基于禁忌搜索的全局最优化模糊聚类算法[J].电子学报,2019,47(2):289-295. 被引量：15
5邵俊健,王士同.具有抗噪性能适用高维数据的增量式聚类算法[J].计算机科学与探索,2019,13(9):1553-1566. 被引量：10
6武森,何慧霞,范岩岩.拓展差异度的高维数据聚类算法[J].计算机工程与应用,2020,56(23):38-44. 被引量：7
7陈俊芬,张明,赵佳成.复杂高维数据的密度峰值快速搜索聚类算法[J].计算机科学,2020,47(3):79-86. 被引量：12
8黄珊,黎明,陈昊,李军华,张聪炫.基于维度扩展和重排的类圆映射可视化聚类方法[J].模式识别与人工智能,2019,32(4):326-335. 被引量：2
9寇广,汤光明,何嘉婧,张恒巍.一种基于变异蝙蝠算法的高维聚类方法[J].系统仿真学报,2018,30(4):1253-1259. 被引量：4
10杨波,杨文忠,殷亚博,何雪琴,袁婷婷,刘泽洋.基于词向量和增量聚类的短文本聚类算法[J].计算机工程与设计,2019,40(10):2985-2990. 被引量：14

二级参考文献86

1Sen Wu,Xuedong Gao Management School, University of Science and Technology Beijing, Beijing 100083, China.CABOSFV algorithm for high dimensional sparse data clustering[J].Journal of University of Science and Technology Beijing,2004,11(3):283-288. 被引量：7
2陈子宁.BP算法在手写体脱机字符识别中的应用[J].现代计算机,2004,10(12):88-90. 被引量：4
3张惟皎,刘春煌,李芳玉.聚类质量的评价方法[J].计算机工程,2005,31(20):10-12. 被引量：60
4齐红,刘大有,胡成全,卢明,赵亮.基于搜索空间划分的概念生成算法[J].软件学报,2005,16(12):2029-2035. 被引量：15
5陈卓,贺明霞,刘相双.基于扩展凝聚点和网格的增量聚类算法[J].哈尔滨工业大学学报,2006,38(8):1382-1385. 被引量：5
6朱胜利,朱善安.基于卡尔曼滤波器组的Mean Shift模板更新算法[J].中国图象图形学报,2007,12(3):460-465. 被引量：20
7孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1060
8刘希宋,喻登科,李玥.基于客户知识的客户CABOSFV聚类[J].情报杂志,2008,27(2):7-9. 被引量：3
9王威娜,陈巨龙,温宇鹏.自适应的模糊C均值聚类算法[J].吉林化工学院学报,2008,25(2):80-82. 被引量：5
10何光普,李敏,武斌,武小红.基于非欧氏距离的广义噪声聚类(英文)[J].北京交通大学学报,2008,32(6):98-101. 被引量：3

共引文献97

1郑洪清.改进的蝴蝶优化聚类算法[J].计算机系统应用,2020(10):217-221. 被引量：2
2王瑞,孙晓伟,毛忠阳,张钊源.基于遗传禁忌搜索的时隙分配算法[J].电子测量技术,2022,45(10):82-86. 被引量：1
3穆永强,王勇,康广有,王征,姜涛,叶鹏.基于风电场检修周期不确定性的电网结构优化模型研究[J].可再生能源,2019,37(7):1028-1033. 被引量：2
4许德刚,赵萍.蝙蝠算法研究及应用综述[J].计算机工程与应用,2019,55(15):1-12. 被引量：31
5王飞,田刚,吴澎.智能制造模式下多维数据分析方法研究[J].信息与电脑,2019,0(13):128-129. 被引量：2
6张勇,陈菊.基于决策树的网络高维数据软子空间聚类方法研究[J].现代电子技术,2019,42(20):81-83. 被引量：4
7万静,吴凡,何云斌,李松.新的降维标准下的高维数据聚类算法[J].计算机科学与探索,2020,14(1):96-107. 被引量：18
8郑毅,马盈仓,杨小飞,续秋霞.基于k-近邻与局部相似度的稀疏子空间聚类[J].计算机工程与应用,2020,56(4):99-108. 被引量：7
9王雨思,路德杨,李海洋.基于分式函数约束的稀疏子空间聚类方法[J].计算机工程与应用,2020,56(7):39-47. 被引量：1
10朱恒东,马盈仓,杨婷,张要.基于ε-邻域和拉普拉斯矩阵秩约束的谱聚类算法[J].纺织高校基础科学学报,2020,33(1):88-94. 被引量：5

1田学敏.例析求函数值域的几种方法[J].语数外学习（高中版）（下）,2021(5):50-50.
2于海鹏,李博,王旭辉.基于卷积神经网络视觉融合的动态手势识别[J].河南工程学院学报（自然科学版）,2021,33(3):63-67. 被引量：1
3田力,刘杨,李梦昊,刘焱雄.基于GNSS技术的波浪浮标测波方法研究[J].海岸工程,2021,40(3):206-213. 被引量：2
4罗歆,闫建平,王敏,钟光海,王军,黄毅.FMI测井图像井壁复原方法优化及应用[J].测井技术,2021,45(4):386-393. 被引量：2

吉林化工学院学报

2021年第9期

浏览历史

内容加载中请稍等...

基于模糊数学的高维稀疏数据聚类统计方法设计

参考文献15

二级参考文献86

共引文献97

相关作者

相关机构

相关主题

浏览历史