基于改进K-means算法的商业用户聚类分析

Clustering Analysis of Commercial Users Based on Improved K-means Algorithm

下载PDF

导出

摘要在竞争激烈的市场环境下,为了更好分析商业用户信息,赢得更多的商业用户,需要进行海量大数据分析。本文针对传统K-means算法自身初始聚类选取的缺陷和单机串行聚类算法的局限性,提出了一种改进的K-means聚类算法。结合当前主流的开源云计算平台Hadoop,把改进的算法并行化,克服了传统串行聚类算法在海量数据处理时的不足,以某大型网络存储服务企业每日商业用户网络存储资源使用量为实验数据,验证了算法的高效性和可行性。 In the highly competitive market environment,in order to better analyze the commercial user information and win more commercial users,it is necessary to carry out mass data analysis.In this paper,we propose an improved K-means clustering algorithm based on the limitations of the traditional K-means algorithm and the limitations of single machine serial clustering algorithm.Combined with the current mainstream cloud computing platform Hadoop,the improved algorithm is paralleled,which overcomes the shortcomings of the traditional serial clustering algorithm in mass data processing.Use the large network storage service enterprise daily business user network storage resource as the experimental data,the effectiveness and feasibility of the algorithm is proved.

作者孙晔孙洁

机构地区凌拓(上海)商贸有限公司北京分公司华北理工大学电气工程学院

出处《河北联合大学学报（自然科学版）》 CAS 2016年第1期67-71,共5页 Journal of Hebei Polytechnic University:Social Science Edition

基金河北省自然科学基金(ZD2014077)

关键词 K-MEANS聚类算法云计算商业用户网络存储资源 K-means clustering algorithm cloud computing business user network storage resource

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1刘晓悦,郭强.海量用电数据并行聚类分析[J].辽宁工程技术大学学报（自然科学版）,2016,35(1):76-80. 被引量：5
2常润梅,孟利青,刘万军.电信企业云计算数据中心容量管理[J].辽宁工程技术大学学报（自然科学版）,2013,32(8):1112-1117. 被引量：5
3周文,井明洋,吴辰康,徐怡秋,马雯,郭毅可,张武.中国云计算产业结构和商业模式[J].上海大学学报（自然科学版）,2013,19(1):26-30. 被引量：15
4瞿小宁.K均值聚类算法在商业银行客户分类中的应用[J].计算机仿真,2011,28(6):357-360. 被引量：6
5谢雪莲,李兰友.基于云计算的并行K-means聚类算法研究[J].计算机测量与控制,2014,22(5):1510-1512. 被引量：21

二级参考文献43

1罗江,唐瑜,郝加波.复杂网络的控制及计算机数值算法[J].辽宁工程技术大学学报（自然科学版）,2012,31(3):413-416. 被引量：5
2常润梅,孟利青,刘万军.电信企业云计算数据中心容量管理[J].辽宁工程技术大学学报（自然科学版）,2013,32(8):1112-1117. 被引量：5
3张石磊,武装.一种基于Hadoop云计算平台的聚类算法优化的研究[J].计算机科学,2012,39(S2):115-118. 被引量：29
4江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报（自然科学版）,2011,39(S1):120-124. 被引量：79
5何大四,张旭.改进的季节性指数平滑法预测空调负荷分析[J].同济大学学报（自然科学版）,2005,33(12):1672-1676. 被引量：32
6张国政.客户关系管理中基于数据挖掘的客户细分研究[J].商业研究,2006(13):153-155. 被引量：15
7张建萍,刘希玉.基于聚类分析的K-means算法研究及应用[J].计算机应用研究,2007,24(5):166-168. 被引量：124
8袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
9傅国锦.数据挖掘技术在商业银行客户细分中的应用[J].金华职业技术学院学报,2007,7(4):44-47. 被引量：2
10MARSTON S, LI Z, BANDYOPADHYAY S, et aJ. Cloud computing-the business perspective [J]. Decision Support Systems, 2011, 51: 176-189.

共引文献46

1禤世丽,刘建明.基于Hadoop平台的K-means聚类算法并行化改进研究[J].玉林师范学院学报,2020(3):90-96.
2郑晓薇,马琳.基于FCM算法的电子商务客户分类研究[J].微型机与应用,2013,32(15):90-92.
3陈芝,任超,张人龙.云计算环境下制造型企业联合管理库存研究[J].管理现代化,2013,33(6):111-113. 被引量：3
4罗维,唐玉凤.小微企业人力资源共享模式研究综述[J].经济研究导刊,2014(14):106-107. 被引量：4
5王志强.基于云计算的数字图书馆核心数据管理与保护研究[J].现代情报,2014,34(5):88-90. 被引量：2
6王春霞,刘武强.云计算在中小企业信息化中的应用策略[J].沈阳工程学院学报（社会科学版）,2014,10(3):348-352. 被引量：3
7王伟军,刘凯,鲍丽倩,曹文俊.云计算生态系统计量研究:形成、群落结构及种群边界[J].情报理论与实践,2014,37(9):11-15. 被引量：8
8赖斌慧,林晓伟.国外云计算企业战略并购分析与启示[J].科技管理研究,2014,34(19):172-176. 被引量：1
9陈阳.国内外云计算产业发展现状对比分析[J].北京邮电大学学报（社会科学版）,2014,16(5):77-83. 被引量：16
10毛乾任,王朝斌.基于C4.5决策树的大学生笔记本电脑购买行为的数据挖掘[J].重庆理工大学学报（自然科学）,2015,29(2):76-81. 被引量：8

1马洪朋,李星,倪庆剑,邢汉承.一种网络虚拟化存储系统的设计与实现[J].计算机工程与科学,2006,28(10):25-28. 被引量：12
2杨永志.一种基于种子的互联网存储方法[J].计算机应用与软件,2007,24(8):19-20. 被引量：2
3黄文学,史金松,刘宇敏.一种开放计算机网络管理模式的探讨[J].河海大学学报（自然科学版）,2000,28(3):117-119.
4常新峰,孙泽军.无线传感器网络的双矩阵密钥预分配方案[J].计算机与数字工程,2014,42(12):2365-2368.
5尹传实,李立文,郭从良.数字视频采集及存储系统设计[J].计算机工程与应用,2004,40(2):116-118.
6张彩霞,程良伦,王向东.基于矩阵空间的分级密钥管理[J].计算机科学,2012,39(9):81-84.

河北联合大学学报（自然科学版）

2016年第1期

浏览历史

内容加载中请稍等...

基于改进K-means算法的商业用户聚类分析

参考文献5

二级参考文献43

共引文献46

相关作者

相关机构

相关主题

浏览历史