基于Hadoop平台的经纬度信息的聚类算法研究与改进
摘要
Mahout中的k-means算法在使用距离测度时通常会使用欧氏距离,当使用经纬度计算地球两点距离时会与真实情况存在误差。本文基于Hadoop平台,利用半正矢公式对Mahout中所集成的距离测度进行改进,实现球面距离的精确计算。研究结果可用于移动互联网环境下定位信息的聚类分析。
出处
《电子技术与软件工程》
2016年第8期197-198,共2页
ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING
参考文献5
-
1Han J W,Kamber M.Data mining:concepts and techniques[M].S a n Francisco,US:Morgan Kaufmann,2001.
-
2赵卫中,马慧芳,傅燕翔,史忠植.基于云计算平台Hadoop的并行k-means聚类算法设计研究[J].计算机科学,2011,38(10):166-168. 被引量:83
-
3李建江,崔健,王聃,严林,黄义双.MapReduce并行编程模型研究综述[J].电子学报,2011,39(11):2635-2642. 被引量:186
-
4牛怡晗,海沫.Hadoop平台下Mahout聚类算法的比较研究[J].计算机科学,2015,42(S1):465-469. 被引量:11
-
5R.W.Sinnott.Virtues of the Haversine.Sky and Telescope 68(2),1984.
二级参考文献56
-
1宁焕生,张瑜,刘芳丽,刘文明,渠慎丰.中国物联网信息服务系统研究[J].电子学报,2006,34(B12):2514-2517. 被引量:151
-
2Han J W, Kamber M. Data mining: concepts and techniques [M]. San Francisco, US: Morgan Kaufmann, 2001.
-
3Buyya R, Yeo C S, Venugopal S. Market-oriented cloud computing: vision,hype, and reality for delivering IT services as computing utilities, Keynote Paper [C] // Proceedings of the 10th IEEE International Conference on High Performance Computing and Communications. Dalian, China, 2009 :25-27.
-
4Armbrust M, Fox A. Above the clouds: a Berkeley view of cloud computing[R]. USA: University of California at Berkeley, 2009.
-
5Erdogmus H. Cloud computing., does nirvana hide behind the nebula[J]. IEEE Software, 2009,26 (2) : 4-6.
-
6Ghemawat S,Gobioff H, Leung S. The google file system[J].S ACM SIGOPS Operating Systems Review, 2003,37 (5) : 29-43.
-
7Dean J, Ghemawat S. MapReduce: simplified data processing on large clusters [C] /// Proceedings of Operating Systems Design and Implementation. San Franciseo, CA, 2004 : 137-150.
-
8Xu X W, Jager J, Kriegel H P. A fast parallel clustering algorithm for large spatial databases[J]. Data Mining and Knowledge Discovery,1999,3(3) :263-290.
-
9郑纬民.云计算的大幕已经拉开.中国计算机学会通讯,2009,5(6):6-7.
-
10J Dean,S Ghemawat.MapReduce:Simplified data processing on large clusters[J].Communications of the ACM,2008,51(1):107-113.
共引文献273
-
1许云峰,张妍,赵铁军.基于云计算的商业情报采集系统[J].河北科技大学学报,2012,33(2):161-165. 被引量:7
-
2桂智明,向宇,李玉鉴.基于出租车轨迹的并行城市热点区域发现[J].华中科技大学学报(自然科学版),2012,40(S1):187-190. 被引量:21
-
3张石磊,武装.一种基于Hadoop云计算平台的聚类算法优化的研究[J].计算机科学,2012,39(S2):115-118. 被引量:29
-
4原旭,陈志奎,赵亮,杨德礼.一种基于Hadoop的改进减法聚类算法[J].微电子学与计算机,2015,32(3):151-155. 被引量:1
-
5亢丽芸,王效岳,白如江.MapReduce原理及其主要实现平台分析[J].现代图书情报技术,2012(2):60-67. 被引量:17
-
6徐晓旻,肖仰华.KBAC:一种基于K-means的自适应聚类[J].小型微型计算机系统,2012,33(10):2268-2272. 被引量:6
-
7杨阳,张为群,刘枫,黄仁杰.基于MapReduce自适应参数的粗糙K-modes算法研究[J].计算机科学,2012,39(11):149-152.
-
8李建敦,彭俊杰,张武.云存储中一种基于布局的虚拟磁盘节能调度方法[J].电子学报,2012,40(11):2247-2254. 被引量:10
-
9刘树仁,宋亚奇,朱永利,王德文.基于Hadoop的智能电网状态监测数据存储研究[J].计算机科学,2013,40(1):81-84. 被引量:51
-
10许丞,刘洪,谭良.Hadoop云平台的一种新的任务调度和监控机制[J].计算机科学,2013,40(1):112-117. 被引量:52
-
1hgpic.球的概念与性质课件展示[J].信息技术教育,2005(1):70-70.
-
2石立兴,胡访宇.二维空间上基于呼叫详细记录数据的用户移动性分析[J].计算机应用,2015,35(9):2453-2456. 被引量:4
-
3刘泽军,熊文兵,孙莹,冯晓玲,王艳兰,李向红.基于极坐标投影的多谱勒雷达数据栅格化技术[J].气象研究与应用,2009,30(1):55-57. 被引量:9
-
4王育红,陈胜,王宇丰.基于STM32嵌入式处理器的路灯控制器设计与实现[J].工业控制计算机,2015,28(10):143-144.
-
5李长军,陈学佺,丁治国.一种港口区域舰船目标变化检测新方法[J].计算机工程,2006,32(14):190-192. 被引量:2
-
6牛力,郁进明,禹素萍,蔡海林,严沁.基于PDA与GPS水源定位系统的设计[J].计算机与现代化,2010(3):103-106. 被引量:1
-
7伍文平,樊宏.基于PC-104的便携式定位定向装置设计及实现[J].仪器仪表用户,2007,14(3):37-38.
-
8赵方,张洁,赵天忠,闫民.基于Android平台的GPS林地面积测量[J].计算机工程与应用,2014,50(23):261-266. 被引量:5
-
9英向华,胡占义.一种基于球面透视投影约束的鱼眼镜头校正方法[J].计算机学报,2003,26(12):1702-1708. 被引量:71
-
10杨淑云,李盼池.基于Bloch球面旋转的量子自组织网络聚类算法[J].系统仿真学报,2015,27(5):1105-1111. 被引量:1