分布式增量机制下的交通流大数据聚类分析被引量：5

Traffic Flow Big Data Clustering Analysis Method Based on Distributed Incremental Mechanism

下载PDF

导出

摘要时空聚类分析是对时空大数据进行利用的一种有效手段。本文提出了一种分布式增量大数据聚类分析方法,利用分布增量机制不但可以减少重复计算和迁移拷贝次数,而且可以持续对聚类结果进行修正,能够在保持聚类准确性的条件下提升整体运算效率。而聚类算法本身通过数据聚集趋势预分析、聚类算法和结果评价3个步骤,构建了一体化时空邻域,在时间和空间维度保证了聚类结果的准确性。经过试验证明该方法可以实现时空大数据的快速高效信息挖掘。 Spatio-temporal clustering analysis is an effective way of using spatio-temporal big data. This paper proposes a distributed incremental big data clustering analysis method. The incremental distribution mechanism can not only reduce the repeated calculation and the number of copies, but also can modify the clustering results continuously. And it is able to improve the operational efficiency under the condition of keeping in clustering accuracy. The clustering algorithm includes three steps：data aggregation trend analysis, clustering algorithm and result evaluation. It constructs an integrated spatio-temporal neighborhood, which guarantees the accuracy of clustering results in time and space. The experiments show that this method can realize the fast and efficient information mining of spatio-temporal big-data.

作者李欣

机构地区河南财经政法大学中原经济区"三化"协调发展河南省协同创新中心河南财经政法大学资源与环境学院

出处《测绘通报》 CSCD 北大核心 2017年第7期61-65,共5页 Bulletin of Surveying and Mapping

基金国家自然科学基金(41501178) 河南财经政法大学博士科研启动基金(800257)

关键词时空数据大数据聚类分析增量聚类时空邻域 spatio-temporal data big data cluster analysis incremental clustering spatio-temporal neighborhood

分类号 P208 [天文地球—地图制图学与地理信息工程]

引文网络
相关文献

参考文献4

1李德仁,马军,邵振峰.论时空大数据及其应用[J].卫星应用,2015,0(9):7-11. 被引量：72
2邓敏,刘启亮,王佳,石岩.时空聚类分析的普适性方法[J].中国科学：信息科学,2012,42(1):111-124. 被引量：22
3雷小锋,谢昆青,林帆,夏征义.一种基于K-Means局部最优性的高效聚类算法[J].软件学报,2008,19(7):1683-1692. 被引量：114
4杨杰,李小平,陈湉.基于增量时空轨迹大数据的群体挖掘方法[J].计算机研究与发展,2014,51(S2):76-85. 被引量：9

二级参考文献21

1Han JW, Kamber M. Data Mining: Concepts and Techniques. 2nd ed., San Francisco: Morgan Kaufmann Publishers, 2001. 223-250.
2Ester M, Kriegel HP, Sander J, Xu XW. A density-based algorithm for discovering clusters in large spatial database with noise. In: Simoudis E, Han J, Fayyad UM, eds. Proc. of the 2nd Int'l Conf. on Knowledge Discovery and Data Mining. Portland: AAAI Press, 1996. 226-231.
3Zhang T, Ramakrishnan R, Linvy M. BIRCH: An efficient data clustering method for very large databases. In: Jagadish HV, Mumick IS, eds. Proc. of the ACM SIGMOD Int'l Conf. on Management of Data. Montreal: ACM Press, 1996. 103-114.
4Guha S, RastogiR, Shim K. CURE: An efficient clustering algorithm for large databases. In: Haas LM, Tiwary A, eds. Proc. of the ACM SIGMOD Int'l Conf. on Management of Data. New York: ACM Press, 1998. 73-84.
5Ankerst M, Breuning M, Kriegel HP, Sander J. OPTICS: Ordering points to identify the clustering structure. In: Delis A, Faloutsos C, Ghandeharizadeh S, eds. Proc. of the ACM SIGMOD Int'l Conf. on Management of Data. Philadelphia: ACM Press, 1999. 49-60.
6Karypis G, Han EH, Kumar V. CHAMELEON: A hierarchical clustering algorithm using dynamic modeling. Computer, 1999,32(8): 68-75.
7Hand DJ, Vinciotti V. Choosing k for two-class nearest neighbour classifiers with unbalanced classes. Pattern Recognition Letters, 2003,24(9): 1555-1562.
8Stonebraker M, Frew J, Gardels K, Meredith J. The SEQUOIA 2000 storage benchmark. In: Buneman P, ed. Proc. of the ACM SIGMOD Int'l Conf. on Management of Data. Washington: ACM Press, 1993.2-11.
9Aghabozorgi, Saeed,Saybani, Mahmoud Reza,Wah, Teh Ying.Incremental clustering of time-series by fuzzy clustering[].Journal of Information Science and Engineering.2012
10Lu-An Tang,Yu Zheng,Jing Yuan,Jiawei Han.On Discovery of Traveling Companionsfrom Streaming Trajectories[].ICDE.2012

共引文献209

1吕政阳,邓涛,张丽艳.一种基于机器视觉的飞机钣金件跨粒度识别方法[J].仪器仪表学报,2020,41(2):195-204. 被引量：10
2宋冰,龙毅,张翎,阮陵,葛军莲.旅游时空大数据:概念、分类与应用[J].现代测绘,2020,43(6):14-18. 被引量：1
3王海,高岭,陈东棋,任杰.一种基于用户行为的嵌入式功耗优化方法[J].系统仿真学报,2015,27(2):320-326.
4周慧芳.自适应的k-means聚类算法SA-K-means[J].科技创新导报,2009,6(34):4-5. 被引量：3
5罗晖霞,曲晓玲.基于网络舆情的K-Means算法的改进研究[J].电脑开发与应用,2010,23(8):4-6. 被引量：3
6彭柳青,张军英,许进.基于k-Means均匀效应的健壮聚类初始算法[J].华中科技大学学报（自然科学版）,2010,38(8):73-76. 被引量：2
7李东艳,李绍滋,柯逍.基于外部数据库的图像自动标注改善模型[J].计算机应用,2010,30(10):2610-2613. 被引量：1
8刘琳,于海斌.异构无线传感器网络中簇首的优化部署策略[J].通信学报,2010,31(10):229-237. 被引量：7
9李晓燕,陈刚,寿黎但,董金祥.一种面向协作标签系统的图片检索聚类方法[J].中国图象图形学报,2010,15(11):1635-1643. 被引量：3
10雷小锋,何涛,李奎儒,谢昆青,丁世飞.面向结构稳定性的分裂-合并聚类算法[J].计算机科学,2010,37(11):217-222. 被引量：4

同被引文献68

1罗英杰,张娜,李琪,王昕,景永才,乐荣武.基于SWMM的地表径流量与城市下垫面和降雨特征关系的空间分析——以中国科学院大学雁栖湖校区为例[J].中国科学院大学学报（中英文）,2020,37(1):27-38. 被引量：8
2郭雪莲,许嘉巍,吕宪国.城市典型下垫面空间构型对降水蓄渗率的影响[J].水土保持学报,2007,21(4):60-62. 被引量：10
3王娜,李霞.基于监督信息特性的主动半监督谱聚类算法[J].电子学报,2010,38(1):172-176. 被引量：33
4钱鹏江,王士同,邓赵红,徐华.基于最小包含球的大数据集快速谱聚类算法[J].电子学报,2010,38(9):2035-2041. 被引量：16
5宋涵,童蔚苹,程琳.考虑拥挤效应的多条最短路径研究与实现[J].中国科技论文,2012,7(11):880-883. 被引量：1
6詹勇,马红,程方远.基于时序植被指数数据的地表覆盖聚类分析研究[J].城市勘测,2013(6):71-74. 被引量：1
7李晓庆,唐昊,司加胜,苗刚中.面向混合属性数据集的改进半监督FCM聚类方法[J].自动化学报,2018,44(12):2259-2268. 被引量：8
8姚磊,卫伟,于洋,肖峻,陈利顶.基于GIS和RS技术的北京市功能区产流风险分析[J].地理学报,2015,70(2):308-318. 被引量：23
9唐东明.基于Hadoop的仿射传播大数据聚类分析方法[J].计算机工程与应用,2015,51(4):29-34. 被引量：8
10刘瑶杰,张晶,张富华,翟瀚.基于浮动车数据的城市学校周边交通拥堵分析[J].首都师范大学学报（自然科学版）,2015,36(2):93-98. 被引量：3

引证文献5

1秦飞,陈品祥,余永欣,郭燕宾,孔俊元.北京城市下垫面雨水径流蓄滞效能评估与研究[J].测绘科学,2022,47(8):86-93.
2刘家良,孙立双.城市出行热点区域的出租车调度点配置[J].中国科技论文,2018,13(9):1012-1017. 被引量：2
3金海,张劲松,吴睿.一种基于抽样改进加权核K-means的大数据谱聚类算法[J].测绘通报,2018(11):78-82. 被引量：7
4冯政军,朱琴.论物联网大数据聚类分析方法和技术[J].信息与电脑,2018,30(6):119-121. 被引量：1
5赵云强,韩翼,崔慧茹,郑琳.聚类目标函数下混合属性大数据集分析系统[J].电子设计工程,2020,28(4):73-76. 被引量：3

二级引证文献13

1李雷孝,周成栋,高静.基于Spark出租车乘客出行时空特征分析研究[J].内蒙古工业大学学报（自然科学版）,2019,38(2):129-139.
2毕曦文,纪明宇,吴鹏,方静,段仁翀,郭鹏鑫.个性化高校新闻分类推荐的应用研究[J].计算机应用与软件,2019,36(7):218-223. 被引量：10
3向礼红,欧嵬,胡姣,刘威.一种基于区块链的保险行业反欺诈系统[J].电脑知识与技术,2019,15(10):49-53. 被引量：1
4吕洪林,尹青山.大规模数据集Spark并行优化谱聚类[J].测绘通报,2019(12):96-100.
5崔艺馨,陈晓东.Spark框架优化的大规模谱聚类并行算法[J].计算机应用,2020,40(1):168-172. 被引量：10
6王炼,陆惠惠.基于K-means算法的电网用户标签特征分类软件缺陷检测[J].电子设计工程,2020,28(18):122-126. 被引量：3
7韩海.包含视野参数的聚类目标函数设计[J].江汉大学学报（自然科学版）,2020,48(6):91-96.
8刘晓丽,牟意红.基于主动学习的半监督谱聚类算法研究[J].甘肃高师学报,2021,26(2):41-45.
9薛晓璇.基于大数据聚类的用户画像提取与智能推送系统[J].电子设计工程,2022,30(2):184-188. 被引量：4
10吴亚楠,李西灿,董士伟,潘瑜春,王怡蓉,牛冲.基于距离度量的高光谱遥感图像空间聚类方法[J].现代电子技术,2022,45(8):163-168. 被引量：1

1杨文杰,张新长,郭泰圣.一种基于改进版本-增量机制的宗地数据更新方法[J].测绘通报,2014(5):55-59.
2张晓志,屈成忠,龚靖,吴迪.局部平面波假定与优化傍轴透射边界[J].地震工程与工程振动,2010,30(5):9-13. 被引量：1
3刘大鹏,岳建平.一种改进的电离层层析投影矩阵生成算法[J].测绘工程,2017,26(9):51-55. 被引量：2
4王家耀,武芳,郭建忠,成毅,陈科.时空大数据面临的挑战与机遇[J].测绘科学,2017,42(7):1-7. 被引量：66
5朱明晨,赵爱国.UNB 3 m模型的区域精度分析[J].测绘与空间地理信息,2017,40(6):26-29. 被引量：2
6黄荣泽,徐杰,邓琨,黄江,邓柏昌,全宏俊.华南地区电离层闪烁与TEC耗空的时间和空间分布统计分析[J].空间科学学报,2017,37(4):414-423. 被引量：2
7孙倩莹,廖胜利,张太衡,苏华英.基于新安江模型的前期影响雨量逐时段修正方法[J].水电能源科学,2017,35(6):6-9. 被引量：1
8赖宗婷.SECTION辅助工具在绘制地质图中的应用[J].新疆有色金属,2017,40(3):30-30.
9曹鸿博,张立华,陈秋,贾帅东,刘现鹏.航海用DDM向非航海用转换时的整体偏差补偿方法[J].测绘通报,2017(7):132-136. 被引量：2
10李晓曼,张明辉,张海刚,朴胜春,刘亚琴,周建波.一种基于模态匹配的浅海波导中宽带脉冲声源的被动测距方法[J].物理学报,2017,66(9):203-218. 被引量：5

测绘通报

2017年第7期

浏览历史

内容加载中请稍等...

分布式增量机制下的交通流大数据聚类分析被引量：5

参考文献4

二级参考文献21

共引文献209

同被引文献68

引证文献5

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

分布式增量机制下的交通流大数据聚类分析 被引量：5

参考文献4

二级参考文献21

共引文献209

同被引文献68

引证文献5

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

分布式增量机制下的交通流大数据聚类分析被引量：5