基于深度信念网络的K-means聚类算法研究被引量：13

Research on K-means clustering algorithm based on deep belief network

下载PDF

导出

摘要针对传统K-means聚类算法对高维非线性数据聚类效果不佳、聚类时间消耗大的问题,文中对高维数据的预处理进行研究,提出一种基于深度信念网络(DBN)的K-means聚类算法(DBNOK)。此算法首先使用多层受限玻尔兹曼机(RBM)对数据进行特征学习,并将学习到的隐含特征进行K-means相关参数和初始聚类中心进行交叉迭代优化。用DBNOK算法分别在低维数据集和高维数据集上进行实验,结果表明,DB-NOK算法聚类准确率优于标准的K-means算法和模糊均值聚类(FCM)算法。 In allusion to the problems that the traditional K-means clustering algorithm has poor clustering effect and long clustering time consumption for the high-dimensional nonlinear data,the preprocessing of the high-dimensional data is studied,and a K-means clustering(DBNOK)algorithm based on deep belief network(DBN)is proposed. In the algorithm,the multi-level restricted Boltzmann machine is used to conduct feature learning of the data. The K-means clustering is conducted for the learned implicit features. The initial learning parameters and clustering center are saved. The DBN is used to conduct cross iterative optimization of the relevant parameters and initial clustering center. An experiment was carried out with the low-dimensional dataset and high-dimensional dataset by using the DBNOK algorithm. The results show that the clustering accuracy of the DBNOK algorithm is superior to that of the standard K-means algorithm and fuzzy C-means(FCM)algorithm.

作者杨慧婷杨文忠殷亚博许超英 YANG Huiting;YANG Wenzhong;YIN Yabo;XU Chaoying(College of Information Science and Engineering,Xinjiang University,Urumqi 830046,China;College of Software,Xinjiang University,Urumqi 830046,China)

机构地区新疆大学信息科学与工程学院新疆大学软件学院

出处《现代电子技术》北大核心 2019年第8期145-150,共6页 Modern Electronics Technique

基金国家自然科学基金资助项目(U1603115) 国家自然科学基金资助项目(61262087) 国家自然科学基金重点项目(U1435215) 国家"973"计划项目(2014CB340500)~~

关键词 K-MEANS算法深度信念网络受限玻尔兹曼机高维数据聚类分析 FCM算法 K-means algorithm DBN restricted Boltzmann machine high-dimensional data clustering analysis FCM algorithm

分类号 TN915-34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献4

1应劭霖.数据挖掘中的聚类算法的综述[J].江西化工,2014,30(2):21-24. 被引量：9
2李晓瑜,俞丽颖,雷航,唐雪飞.一种K-means改进算法的并行化实现与应用[J].电子科技大学学报,2017,46(1):61-68. 被引量：50
3王千,王成,冯振元,叶金凤.K-means聚类算法研究综述[J].电子设计工程,2012,20(7):21-24. 被引量：308
4余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：616

二级参考文献46

1MarkoffJ. How many computers to identify a cat?[NJ The New York Times, 2012-06-25.
2MarkoffJ. Scientists see promise in deep-learning programs[NJ. The New York Times, 2012-11-23.
3李彦宏.2012百度年会主题报告:相信技术的力量[R].北京:百度,2013.
410 Breakthrough Technologies 2013[N]. MIT Technology Review, 2013-04-23.
5Rumelhart D, Hinton G, Williams R. Learning representations by back-propagating errors[J]. Nature. 1986, 323(6088): 533-536.
6Hinton G, Salakhutdinov R. Reducing the dimensionality of data with neural networks[J]. Science. 2006, 313(504). Doi: 10. 1l26/science. 1127647.
7Dahl G. Yu Dong, Deng u, et a1. Context-dependent pre?trained deep neural networks for large vocabulary speech recognition[J]. IEEE Trans on Audio, Speech, and Language Processing. 2012, 20 (1): 30-42.
8Jaitly N. Nguyen P, Nguyen A, et a1. Application of pretrained deep neural networks to large vocabulary speech recognition[CJ //Proc of Interspeech , Grenoble, France: International Speech Communication Association, 2012.
9LeCun y, Boser B, DenkerJ S. et a1. Backpropagation applied to handwritten zip code recognition[J]. Neural Computation, 1989, I: 541-551.
10Large Scale Visual Recognition Challenge 2012 (ILSVRC2012)[OLJ.[2013-08-01J. http://www. image?net.org/challenges/LSVRC/2012/.

共引文献979

1贾彦哲.论人工智能研发者过失犯的注意义务[J].华中师范大学研究生学报,2020(2):40-46.
2马燕,余海军,钟发生,刘丰林.基于残差编解码网络的CT图像金属伪影校正[J].仪器仪表学报,2020,41(8):160-169. 被引量：18
3谢皓,孙小东,何海熙.基于K-means聚类的高炉操作炉型研究[J].冶金自动化,2023,47(S01):88-91. 被引量：1
4毕思文,Henri Jaffrès,Chandra Sekhar Roychoudhuri.量子遥感发展新态势——世界首次量子遥感国际会议评述[J].全球变化数据学报（中英文）,2019,3(4):317-325. 被引量：1
5高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
6范敏,胥小波,聂小明.基于字符级扩张卷积网络的Web攻击检测方法[J].计算机应用研究,2020,37(S02):234-237. 被引量：4
7孟威,尉永清,刘文锋.基于CRT机制混合神经网络的特定目标情感分析[J].计算机应用研究,2020,37(2):360-364. 被引量：1
8华夏,王新晴,马昭烨,王东,邵发明.基于递归神经网络的视频多目标检测技术[J].计算机应用研究,2020,37(2):615-620. 被引量：8
9张文杰,蒋烈辉.基于MapReduce并行化计算的大数据聚类算法[J].计算机应用研究,2020,37(1):53-56. 被引量：21
10刘树霄,衣立,张苏平,时晓曚,薛允传.基于全卷积神经网络方法的日间黄海海雾卫星反演研究[J].海洋湖沼通报,2019(6):13-22. 被引量：12

同被引文献109

1钱晓东,王正欧.基于改进KNN的文本分类方法[J].情报科学,2005,23(4):550-554. 被引量：19
2杨立,左春,王裕国.基于语义距离的K-最近邻分类方法[J].软件学报,2005,16(12):2054-2062. 被引量：31
3杨淑媛,焦李成,刘芳.量子进化算法[J].工程数学学报,2006,23(2):235-246. 被引量：34
4李胜后,钟蕾.一种改进的支持向量机分类器[J].信息技术,2008,32(3):55-57. 被引量：1
5高颖慧,沈振康.角度编码染色体量子遗传算法[J].计算机工程与科学,2009,31(3):75-79. 被引量：13
6张建方,王秀祥.直方图理论与最优直方图制作[J].应用概率统计,2009,25(2):201-214. 被引量：27
7朱连江,马炳先,赵学泉.基于轮廓系数的聚类有效性分析[J].计算机应用,2010,30(12):139-141. 被引量：120
8熊忠阳,陈若田,张玉芳.一种有效的K-means聚类中心初始化方法[J].计算机应用研究,2011,28(11):4188-4190. 被引量：86
9谢娟英,马箐,谢维信.一种确定最佳聚类数的新算法[J].陕西师范大学学报（自然科学版）,2012,40(1):13-18. 被引量：11
10齐名军,王鹏宇.量子人工鱼群算法[J].安徽农业科学,2012,40(8):4469-4472. 被引量：1

引证文献13

1韩存鸽,刘长勇.一种改进的K-Means算法[J].闽江学院学报,2019,40(5):49-54. 被引量：6
2张日新,朱跃龙,万定生,毛燠锋.基于特征向量的两阶段异常检测方法研究[J].信息技术,2019,43(11):67-71. 被引量：2
3曹亚丽,余牧舟,杨俊峰,宋昕.一种改进的人工蜂群算法研究[J].现代电子技术,2020,43(12):133-137. 被引量：7
4石煌雄,胡洋,蒋作,潘文林,杨凡,张瑞祥.基于深度学习的电气铭牌可变区域识别方法的研究[J].云南民族大学学报（自然科学版）,2020,29(4):350-355. 被引量：4
5郑辉.基于全局相似度的在线资源个性化推荐算法研究[J].常熟理工学院学报,2021,35(5):75-80. 被引量：2
6王喆,宋晓峰,王玉芳.基于关联规则的网络数据动态聚类方法研究[J].电脑知识与技术,2021,17(32):51-52.
7皮小明.基于深度学习的无线传感器网络数据压缩算法研究[J].科技经济市场,2021(10):37-39. 被引量：3
8高静,王钢.基于知识图谱的k-modes文本聚类研究[J].南京理工大学学报,2022,46(1):76-82. 被引量：1
9白丽丽,宋初一,许丽艳,宋泽瑞,姜静清.基于改进量子旋转门人工鱼群算法的K-means聚类算法及其应用[J].计算机应用研究,2022,39(3):797-801. 被引量：6
10袁桂丽,吴振民,刘骅骐,禹建芳,房方.基于深度置信网络的短期风电功率预测[J].太阳能学报,2022,43(2):451-457. 被引量：11

二级引证文献49

1林振敏.基于人工蜂群算法的线性系统辨识[J].仪器仪表用户,2020,27(9):95-98. 被引量：1
2李华昌,揭东帅,徐敏.电力市场化改革下的电价敏感性研究[J].中北大学学报（自然科学版）,2020,41(5):431-436. 被引量：4
3陆佳丽.基于改进时间序列模型的日志异常检测方法[J].信息网络安全,2020(9):1-5. 被引量：2
4万珊,苟文博.基于改进K-means聚类的数据自动采集系统设计[J].自动化与仪器仪表,2020(10):108-112. 被引量：4
5王晓红,杨礼彬,任展翔,莫海宁,庞斌,陈利,黄泽铭.求解包装生产中复杂问题的布谷鸟算法改进[J].包装工程,2021,42(5):240-246. 被引量：3
6李雪,南建国.基于IK-means聚类的分簇路由算法[J].计算机应用研究,2021,38(4):1149-1153. 被引量：1
7庞渊源,田然,朱晓鸿,王鑫,陈鑫.基于动态路由胶囊架构的电网客服优化设计[J].电子设计工程,2021,29(7):152-156.
8孙辉,谭文兵,刘文建,杨夕,余跃.基于图像识别的配网设备铭牌参数抄写仪设计与应用[J].中国高新科技,2021(6):15-16. 被引量：1
9孙瑞彬,钱夔,徐伟敏,路红.基于Tesseract-OCR的复杂发票自适应识别[J].南京信息工程大学学报（自然科学版）,2021,13(3):349-354. 被引量：7
10梁宇杰,宋瑞,王宇擎,吴兆田.面向首都大学生的定制公交线路规划模型及算法研究[J].大连交通大学学报,2021,42(4):1-6.

1郑冬冬,张童瑶,刘翰宇,梁慧佳.江苏省本科教育质量的评价与分析[J].中国新通信,2019,0(5):202-202.
2韩忠华,毕开元,司雯,吕哲.基于谱分析的密度峰值快速聚类算法[J].计算机应用,2019,39(2):409-413.
3于航,刘阳,王海政,胡阳,朱红路.一种基于3σ准则与FCM算法相结合的光伏电站直流侧故障定位方法[J].太阳能,2019(2):50-55. 被引量：8
4字云飞,李业丽,孙华艳.基于深度神经网络的个性化推荐系统研究[J].电子技术应用,2019,45(1):14-18. 被引量：28
5李孟颖,王健,王琰,林鸿飞,杨志豪.基于融合式神经网络的微生物生长环境关系抽取[J].模式识别与人工智能,2019,32(2):177-183. 被引量：5
6贺怀清,计瑜,惠康华,刘浩翰.一种基于稀疏分段的协同过滤推荐算法[J].现代电子技术,2019,42(9):90-94. 被引量：8
7李晓庆,唐昊,司加胜,苗刚中.面向混合属性数据集的改进半监督FCM聚类方法[J].自动化学报,2018,44(12):2259-2268. 被引量：8
8人民日报.“发文就算落实”的实质是懒政[J].冶金企业文化,2018,0(1):52-52.
9张云龙.基于PCA的高维流式数据聚类算法[J].电子技术与软件工程,2019(8):175-176. 被引量：4
10黄炜,黄建桥,李岳峰.一种基于稀疏自编码器的涉恐短文本特征提取方法[J].情报杂志,2019,38(3):203-206. 被引量：5

现代电子技术

2019年第8期

浏览历史

内容加载中请稍等...

基于深度信念网络的K-means聚类算法研究被引量：13

参考文献4

二级参考文献46

共引文献979

同被引文献109

引证文献13

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

基于深度信念网络的K-means聚类算法研究 被引量：13

参考文献4

二级参考文献46

共引文献979

同被引文献109

引证文献13

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

基于深度信念网络的K-means聚类算法研究被引量：13