基于最短主干道距离的零售户聚类研究

A Retailer Cluster Research Based on the Shortest Arterial Road Distance(SARD)

下载PDF

导出

摘要在研究零售户聚类分析中,传统的k中心聚类方法,计算成本过大,无法有效应用于大数据集.提出了零售户聚类方法,继承CLARANS算法迭代思想,采用全局随机抽样技术,将算法应用于大型空间数据集,通过多次迭代尽量寻求最优聚类结果.聚类结果的评价标准为基于最短主干道距离(SARD)的总距离.该聚类算法是在CLARANS算法的基础上进行改进,使其能够处理带地理信息的数据对象,且聚类结果满足需求约束条件限制. In the study of retailer cluster analysis,the traditional k center cluster method can not be used effectively for large data sets because of too much computation.A method of retailer cluster analysis based on the CLARANS iterative algorithm is proposed and the global random sampling technique is used in this method to deal with the large spatial data sets.Optimal cluster results may be obtained through several iterations.An evaluation criterion of the cluster results is the total distance that based on the Shortest Arterial Road Distance(SARD).The cluster algorithm is improved based on the CLARANS algorithm and can be used to process data with geographic information,and its results can meet the demand constraint conditions.

作者杜秀亭杨晨光

机构地区内蒙古自治区烟草公司四川大学计算机软件学院

出处《内蒙古大学学报（自然科学版）》 CAS CSCD 北大核心 2012年第3期306-312,共7页 Journal of Inner Mongolia University：Natural Science Edition

基金国家自然科学基金资助项目(71172168)

关键词聚类算法最短主干道距离差异度 cluster algorithm the shortest arterial road distance(SARD) variability

分类号 TP391 [自动化与计算机技术—计算机应用技术] F272 [经济管理—企业管理]

引文网络
相关文献

参考文献9

1Jiawei Han,Mieheline Kamber. Data Mining Concepts and Techniques[M].New York:Academic Press,Inc,2001.261-263.
2Zhang Tian,Raghu Ramakrishnan,Miron Livny. BIRCH;An Efficient Data Clustering Method for Very Large Databases[A].Montreal,Canada,1996.103-114.
3Ester M,Sander J,Xu X. A Density-based Algorithm for Discovering Clusters in Large Databases[A].Portland,Oregon,USA,1996.226-231.doi:10.1016/j.jacr.2010.01.014.
4Sheikholeslami G,Chatterjee S,Zhang A. WaveCluster:A Multi-Resolution Clustering Approach for Very Large Spatial Databases[A].New York,1998.428-439.
5Guha S,Rastogi R,Shim K. Cure:An Efficient Clustering Algorithm for Large Databases[A].Seattle,Washington,1998.73-84.
6Raymond T Ng,Jiawei Han. Efficient and Effective Clustering Methods for Spatial Data Mining[A].Santiago,Chile,1994.144-155.doi:10.1109/TASL.2010.2092768.
7杜秀亭,高学东.零售户聚类分析中基于最短主干道距离的差异度计算方法[J].内蒙古大学学报（自然科学版）,2010,41(5):580-582. 被引量：1
8贺玲,吴玲达,蔡益朝.数据挖掘中的聚类算法综述[J].计算机应用研究,2007,24(1):10-13. 被引量：225
9孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1072

二级参考文献38

1许志海,张昭云.交通限制条件下的最短路径算法分析与优化[J].测绘学院学报,2005,22(1):62-64. 被引量：7
2李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
3开放的API服务在地图上的应用[EB/0L].http:∥developer.openapiservice.com/.2009-12-02.
4365地图API服务操作方法详解[EB/OL].http:∥www.17173gps.com/yejiedongtai/200906/27-4201.html.2009-12-21.
5图吧烟草行业地图应用解决方案[EB/OL].http:∥www.mapbar.com/DiTuYingYong/YanCaoHangYe.html.2010-02-21.
6Wu Sen, Gu Shujuan. A Cluster Description Method for High Dimensional Data Clustering with Categorical Variables[C]//Proc. of 2010 International Conference on Measuring Technology and Mechatronics Automation, 2010,1 :32-35.
7Guha S,Rastogi R,Shim K.CURE:An Efficient Clustering Algorithm for Large Databases[C].Seattle:Proceedings of the ACM SIGMOD Conference,1998.73-84.
8Guha S,Rastogi R,Shim K.ROCK:A Robust Clustering Algorithm for Categorical Attributes[C].Sydney:Proceedings of the 15th ICDE,1999.512-521.
9Karypis G,Han E-H,Kumar V.CHAMELEON:A Hierarchical Clustering Algorithm Using Dynamic Modeling[J].IEEE Computer,1999,32(8):68-75.
10Ester M,Kriegel H-P,Sander J,et al.A Density-based Algorithm for Discovering Clusters in Large Spatial Databases with Noise[C].Portland:Proceedings of the 2nd ACM SIGKDD,1996.226-231.

共引文献1259

1刘壮,张悦.统计学方法在生物信息学分析中的应用[J].医学信息学杂志,2020,41(6):20-23. 被引量：1
2丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
3王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
4林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
5高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
6毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
7张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
8李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
9孙伟鹏,吴锡生,孟斌.基于Spark并行的密度峰值聚类算法[J].计算机应用研究,2020,37(1):163-166. 被引量：2
10尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.

1陈宝国,荀小苗.基于改进CLARANS算法的孤立点检测[J].计算机与数字工程,2008,36(7):15-17. 被引量：1
2房启东.浅析数字信息资源过程管理产生期之迭代模型[J].无锡南洋职业技术学院论丛,2010,0(Z1):72-76.
3余利丰.基于因子分析的河南省投资环境聚类研究[J].河南科技大学学报（社会科学版）,2015,33(4):82-88. 被引量：2
4杨霞,徐邓耀.南充市经济发展水平的定量分析[J].中国西部科技,2004,3(5):9-10. 被引量：2
5董明.云环境下带宽需求约束的负载均衡调度算法[J].重庆航天职业技术学院学报,2013(4):45-48.
6范晓明.广电集团核心运营能力影响因素与聚类研究[J].东南传播,2015(4):8-10.
7李光宇.基于改进的CLARANS算法在数据挖掘中的研究[J].中南林业科技大学学报,2010,30(3):142-146. 被引量：4
8叶质刚.物联网水产品追踪算法研究[J].电脑知识与技术,2016,0(6):135-136.
9冯秀芳,李海林.Euclidean节点定位算法改进及其仿真[J].计算机与现代化,2009(1):69-72. 被引量：1
10苏勇,黄烨,周冬.基于网格结构的二次CLARANS聚类算法[J].计算机应用与软件,2013,30(3):287-290. 被引量：2

内蒙古大学学报（自然科学版）

2012年第3期

浏览历史

内容加载中请稍等...

基于最短主干道距离的零售户聚类研究

参考文献9

二级参考文献38

共引文献1259

相关作者

相关机构

相关主题

浏览历史