一种时间序列数据的动态k-means聚类算法被引量：3

A Dynamic k-means Clustering Algorithm for Time Series Data

下载PDF

导出

摘要传统k-means聚类算法是对某个时间片上的静态数据集合进行独立的聚类分析,但对于时间序列数据仅仅是多次静态聚类分析的重复应用。当数据量过大时,算法的时间开销将大大增加。为此,本文提出了一种时间序列数据的动态k-means聚类算法(Dynamic k-means Clustering Algorithm for Time Series Data,DKCA/TSD)。该算法通过时间序列的前一时刻最优质心的结果,利用数据之间的关联性进行下一时刻的聚类,从而减少算法的迭代次数,提高时间效率。实验结果表明:对于时间序列数据,DKCA/TSD算法相对于k-means算法时间效率上有很大提高。 The traditional k-means clustering algorithm is an independent clustering analysis of static data sets on a certain time slice.However,it is only repeated application of multiple static clustering analysis for time series data.When the amount of da⁃ta is too large,the time overhead of the algorithm will increase greatly.Therefore,this paper proposes a Dynamic k-means Cluster⁃ing Algorithm for Time Series Data(DKCA/TSD).The algorithm uses the correlation between the data to perform the clustering at the next moment through the correlation of the highest quality of the time series,thereby reducing the number of iterations of the al⁃gorithm and improving the time efficiency.The algorithm uses the correlation between the data to perform the clustering at the next moment through the correlation of the highest quality of the time series,thereby reducing the number of iterations of the algorithm and improving the time efficiency.The experimental results show that for time series data,the time efficiency of DKCA/TSD algo⁃rithm is greatly improved compared with k-means algorithm.

作者冀敏杰肖利雪 JI Minjie;XIAO Lixue(School of Computer Science,Xi'an University of Posts and Telecommunications,Xi'an 710121)

机构地区西安邮电大学计算机学院

出处《计算机与数字工程》 2020年第8期1852-1857,共6页 Computer & Digital Engineering

基金西安邮电大学研究生创新基金项目(编号:103-602080016)资助。

关键词 K-MEANS 动态聚类时间序列数据数据关联性 k-means dynamic clustering time series data data relevance

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献11

1谢福鼎,赵晓慧,嵇敏,平宇.一种时间序列动态聚类的算法[J].计算机应用研究,2012,29(10):3677-3680. 被引量：8
2李海林,郭崇慧.时间序列数据挖掘中特征表示与相似性度量研究综述[J].计算机应用研究,2013,30(5):1285-1291. 被引量：65
3贾瑞玉,李玉功.类簇数目和初始中心点自确定的K-means算法[J].计算机工程与应用,2018,54(7):152-158. 被引量：50
4孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1074
5徐梅,黄超.基于符号时间序列方法的金融收益分析与预测[J].中国管理科学,2011,19(5):1-9. 被引量：18
6丛思安,王星星.K-means算法研究综述[J].电子技术与软件工程,2018(17):155-156. 被引量：16
7刘琴,王恺乐,饶卫雄.不等长时间序列滑窗STS距离聚类算法[J].计算机科学与探索,2015,9(11):1301-1313. 被引量：10
8李凯,曹阳.基于ARIMA模型的网络安全威胁态势预测方法[J].计算机应用研究,2012,29(8):3042-3045. 被引量：11
9潘定,沈钧毅.时态数据挖掘的相似性发现技术[J].软件学报,2007,18(2):246-258. 被引量：41
10ZHAI Yuanzheng,WANG Jinsheng,TENG Yanguo,ZUO Rui.Water demand forecasting of Beijing using the Time Series Forecasting Method[J].Journal of Geographical Sciences,2012,22(5):919-932. 被引量：17

二级参考文献177

1李红权,马超群,邹琳.中国证券市场的混沌动力学特征研究[J].中国管理科学,2005,13(z1):194-200. 被引量：9
2CHEN Yaning & XU Zongxue Xinjiang Institute of Ecology & Geography, Chinese Academy of Sciences, Urumqi 830011, China,College of Environmental Sciences, Beijing Normal University, Beijing 100875, China.Plausible impact of global climate change on water resources in the Tarim River Basin[J].Science China Earth Sciences,2005,48(1):65-73. 被引量：56
3张永铮,云晓春,胡铭曾.基于特权提升的多维量化属性弱点分类法的研究[J].通信学报,2004,25(7):107-114. 被引量：35
4李爱国,覃征.在线分割时间序列数据[J].软件学报,2004,15(11):1671-1679. 被引量：27
5肖辉,胡运发.基于分段时间弯曲距离的时间序列挖掘[J].计算机研究与发展,2005,42(1):72-78. 被引量：59
6Jia-WeiHan,JianPei,Xi-FengYan.From Sequential Pattern Mining to Structured Pattern Mining： A Pattern-Growth Approach[J].Journal of Computer Science & Technology,2004,19(3):257-279. 被引量：18
7李爱国,覃征.大规模时间序列数据库降维及相似搜索[J].计算机学报,2005,28(9):1467-1475. 被引量：20
8杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：191
9李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
10陈秀真,郑庆华,管晓宏,林晨光.层次化网络安全威胁态势量化评估方法[J].软件学报,2006,17(4):885-897. 被引量：342

共引文献1315

1丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
2王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
3林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
4高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
5毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
6张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
7李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
8尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
9段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1
10袁鹏程,周天乐.基于ARIMAX的城市道路交通流短期预测模型[J].智能计算机与应用,2021,11(10):12-19. 被引量：7

同被引文献32

1范荻,李绍山,李海涛,王卫.台区用户识别仪关键技术应用研究[J].华北电力技术,2010(7):27-30. 被引量：24
2张剑.数据挖掘在现代作战中的应用研究[J].计算机与数字工程,2012,40(6):51-53. 被引量：2
3李建,赵汉昌.多功能低压台区识别设备的研制[J].电测与仪表,2014,51(13):107-111. 被引量：39
4秦昆,罗萍,姚博睿.GDELT数据网络化挖掘与国际关系分析[J].地球信息科学学报,2019,21(1):14-24. 被引量：30
5赵莉,候兴哲,胡君,傅宏,孙洪亮.基于改进k-means算法的海量智能用电数据分析[J].电网技术,2014,38(10):2715-2720. 被引量：126
6原继东,王志海.时间序列的表示与分类算法综述[J].计算机科学,2015,42(3):1-7. 被引量：53
7李亚,樊汝森,蒋伟,杨俊杰,宋涛,赵勤学.基于BP神经网络的智能台区识别方法研究[J].电测与仪表,2017,54(3):25-30. 被引量：43
8黄纯,刘鹏辉,江亚群,冷华,朱吉然.基于动态时间弯曲距离的主动配电网馈线差动保护[J].电工技术学报,2017,32(6):240-247. 被引量：31
9傅靖,季润阳,王栋,冯鹏,唐文斌,毛艳芳.基于并行K-Means聚类的配电网台区用户行为分析模型研究及应用[J].电网与清洁能源,2018,34(11):71-76. 被引量：16
10吴广建,章剑林,袁丁.基于K-means的手肘法自动获取K值方法研究[J].软件,2019,40(5):167-170. 被引量：65

引证文献3

1张欢,许雄,宗国福.战场态势下的时间序列数据挖掘分析[J].信息与电脑,2021,33(10):176-178.
2张志丹,张帝,黄纯,邓威,唐海国,朱吉然.基于筛选电压数据的配电低压用户相别辨识方法[J].供用电,2022,39(1):58-64. 被引量：3
3朱炤瑗,秦昆,关庆锋,罗萍,姚博睿,漆林,周扬.COVID-19期间国家关系交互网络时空分析研究[J].地理与地理信息科学,2022,38(1):15-22. 被引量：7

二级引证文献10

1杨学习,邓敏,刘瑜.社会感知与地理空间智能的研究动态与展望——“社会感知与地理空间智能”专栏导读[J].地理与地理信息科学,2022,38(1):1-4. 被引量：1
2白东壮,田世明,邹毅豪,周颖,徐玉婷,韩凝晖,李永军.基于FDA的居民用户空调用电行为分类分析方法[J].智慧电力,2022,50(3):44-49. 被引量：10
3王亚京,包鹏赞,陈金香,王海涛,程向群.基于FPGA的旋转变压器信号解码设计[J].电子设计工程,2022,30(24):75-78. 被引量：3
4任德孝,刘清杰,张坤领.“一带一路”沿线国家间合作网络特征及合作强度影响因素分析--基于合作事件大数据的跟踪研究[J].亚太经济,2023(1):71-79. 被引量：1
5郭垠宏,宋涛,葛岳静.中欧科技—经贸合作网络的共同演化分析——基于电气工程领域的实证研究[J].地理与地理信息科学,2023,39(5):47-56.
6石建中,范齐.RCEP成员国国际旅游经济网络结构演化及中国角色分析[J].地理与地理信息科学,2024,40(1):55-63. 被引量：1
7姚梦娇,马亚萍,张辉,邓青.国家间冲突风险监测预警模型构建及应用研究[J].情报杂志,2024,43(4):89-95.
8梁天祺,秦昆,阮建平,喻雪松,周扬,刘东海,邢玲丽.基于多层复杂网络的地理多元流测度与社区识别研究[J].地球信息科学学报,2024,26(8):1843-1857.
9翟晶晶,乔阳,郝思鹏.基于深度学习的新能源场站不良数据辨识与修正方法[J].电力需求侧管理,2024,26(5):28-35.
10刘晶丽,蒋梅英,熊理然.重大公共卫生事件对联合国全球采购的影响及中国供应地位的变化——以新冠疫情为例[J].地理与地理信息科学,2024,40(5):59-66.

1程明畅,刘友波,张程嘉,马铁丰.基于分位数半径的动态K-means算法[J].南京大学学报（自然科学版）,2018,54(1):48-55. 被引量：5
2刘季昂,刘友波,程明畅,余莉娜.基于分位数半径动态K-means的分布式负荷聚类算法[J].电力系统保护与控制,2019,47(24):15-22. 被引量：27
3陈二蒙,田晓飞,王宏涛,宋豪达.面向绿色产品认证的指标体系构建方法[J].工业安全与环保,2020,46(9):98-103.
4承春明,赵欣慧,王建军,孟世斌,赵东坡,韩源.信息管理系统自动巡检平台设计与实现[J].电力信息与通信技术,2020,18(9):105-110. 被引量：5
5中国东丽集团加强合作,内销、出口取得成果[J].纺织服装周刊,2020(34):36-36.
6白玲玲.基于尺度划分的多尺度数据挖掘算法设计[J].宁夏师范学院学报,2020,41(7):65-72. 被引量：1
7杨伟,邓涵文,冯贤菊,廖雪花,李晓宁.一种基于单调链和Geohash索引的公共边裂缝处理算法[J].四川师范大学学报（自然科学版）,2020,43(5):690-699. 被引量：2
8赵莹,梁锦鹏,颜力祺,孔祥騫.标识设置对游客寻路行为的影响研究——基于眼动追踪的实验分析[J].旅游学刊,2020,35(9):63-73. 被引量：15
9梁三来.基于内容加密的安全去重算法研究[J].河南工程学院学报（自然科学版）,2020,32(3):77-80. 被引量：1
10Lin Qiaomin,Fa Anqi,Pan Min,Xie Qiang,Du Kun,Sheng Michael.Cleaning RFID data streams based on K-means clustering method[J].The Journal of China Universities of Posts and Telecommunications,2020,27(2):72-81.

计算机与数字工程

2020年第8期

浏览历史

内容加载中请稍等...

一种时间序列数据的动态k-means聚类算法被引量：3

参考文献11

二级参考文献177

共引文献1315

同被引文献32

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

一种时间序列数据的动态k-means聚类算法 被引量：3

参考文献11

二级参考文献177

共引文献1315

同被引文献32

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

一种时间序列数据的动态k-means聚类算法被引量：3