基于Hadoop平台的DBIK-means聚类算法并行化研究被引量：1

Research on parallel DBIK- means clustering algorithm based on Hadoop platform

下载PDF

导出

摘要针对Hadoop存在的不足,提出了利用分布式数据库来模拟共享存储空间的解决方案。并对DBIK-means聚类算法做了并行化设计和实验分析,验证了DBIK-means聚类算法在处理大数据时,能够获得较好的加速比。 According to the existing problems of the Hadoop, the scheme of using the distributed database to simulate the sharing storage space is put forward. The clustering algorithm based on DBIK - means is parallel designed and analysed for experiments to verify that the DBIK -means clustering algorithm can get good speedup in processing large data.

作者卜天然

机构地区安徽商贸职业技术学院电子信息工程系

出处《新余学院学报》 2016年第4期115-118,共4页 Journal of Xinyu University

基金安徽省省级自然科研重点课题<基于ed X平台的云计算课程实训MOOC系统研究>(KJ2015A373) 安徽商贸职业技术学院院级科研项目<基于Hadoop平台的文本聚类算法研究>(2016KYZ05)

关键词 HADOOP DBIK-means聚类算法并行化 Hadoop DBIK - means clustering algorithm parallelization

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1张石磊,武装.一种基于Hadoop云计算平台的聚类算法优化的研究[J].计算机科学,2012,39(S2):115-118. 被引量：29
2Anil K J.Data clustering:50 years beyond K-Means[J].Pattern Recognition Letters,2010,31(8):651-666.
3朱颢东,钟勇,赵向辉.一种优化初始中心点的K-Means文本聚类算法[J].郑州大学学报（理学版）,2009,41(2):29-32. 被引量：13
4Tou J.Pattern Recognition Principles Reading[M].Boston:Addison-Wesley Publishing Company,1974.
5Linde Y,Buzo A,Gary R.An Algorithm for Vector Quantizer Design[J].IEEE Tranc on Communication,1980,28(1):84-95.
6Chang F,Dean J,Ghemawat S,et al.Bigtable:A distributed storage system for structured data[J].ACM Transactions on Computer Systems(TOCS),2008,26(2):1-4.
7张琳,陈燕,汲业,张金松.一种基于密度的K-means算法研究[J].计算机应用研究,2011,28(11):4071-4073. 被引量：43

二级参考文献23

1朱颢东,钟勇,赵向辉.一种优化初始中心点的K-Means文本聚类算法[J].郑州大学学报（理学版）,2009,41(2):29-32. 被引量：13
2江小平,李成华,向文,张新访,颜海涛.k-means聚类算法的MapReduce并行化实现[J].华中科技大学学报（自然科学版）,2011,39(S1):120-124. 被引量：79
3田珂,朱清新,向培素.基于混合遗传算法的工作流重构研究[J].计算机科学,2007,34(1):103-105. 被引量：2
4袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：152
5HAN Jia-wei, KAMBER M. Data mining concepts and techniques [ M]. 2nd ed. Beijing: China Machine Press,2006:383,402-404.
6KANG P, CHO S. K-means clustering seeds initialization based on centrality, sparsity, and isotropy[ C ]//Proc of the 10th International Conference on Intelligent Data Engineering and Automated Learning. Berlin : Springer,2009 : 109-117.
7Lam C.Hadoop in action[]..2011
8http://www.cnblogs.com/leoo2sk/archive/2010/09/20/k-means.html .
9http://www.cnblogs.com/vivounicorn/archive/2011/10/08/22-01986.html .
10柴晓冬,周成鹏.一种改进的模拟退火算法的相位恢复[J].计算机工程与应用,2008,44(7):75-77. 被引量：2

共引文献77

1周爱武,汪贤惠,刘慧婷.基于HowNet词汇相关性的文本聚类[J].微电子学与计算机,2015,32(4):90-93. 被引量：4
2陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
3孙可,刘杰,王学颖.K均值聚类算法初始质心选择的改进[J].沈阳师范大学学报（自然科学版）,2009,27(4):448-450. 被引量：15
4李翠,冯冬青.基于改进K-均值聚类的图像分割算法研究[J].郑州大学学报（理学版）,2011,43(1):109-113. 被引量：25
5张琳,陈燕,汲业,张金松.一种基于密度的K-means算法研究[J].计算机应用研究,2011,28(11):4071-4073. 被引量：43
6郑丹,王潜平.K-means初始聚类中心的选择算法[J].计算机应用,2012,32(8):2186-2188. 被引量：35
7周爱武,陈宝楼,王琰.K-Means算法的研究与改进[J].计算机技术与发展,2012,22(10):101-104. 被引量：19
8詹辉煌,朱敏琛.一种改进的动态K-means聚类算法[J].微型机与应用,2012,31(20):74-76. 被引量：2
9李力沛.一种改进的聚类簇数目自动计算算法[J].现代计算机（中旬刊）,2012(10):13-16.
10翟东海,聂洪玉,崔静静,杜佳.基于自适应簇中心选择的文本聚类算法研究[J].成都信息工程学院学报,2013,28(6):617-622. 被引量：1

同被引文献3

1杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：188
2吕佳.基于动态隧道系统的K-means聚类算法研究[J].重庆师范大学学报（自然科学版）,2009,26(1):73-77. 被引量：8
3张琳,陈燕,汲业,张金松.一种基于密度的K-means算法研究[J].计算机应用研究,2011,28(11):4071-4073. 被引量：43

引证文献1

1卜天然.基于初始中心点K均值聚类算法的改进方法研究[J].通化师范学院学报,2017,38(2):60-63. 被引量：2

二级引证文献2

1孟志强,李蛟.基于高校本科生借阅兴趣标签的图书馆馆藏空间服务创新研究[J].情报科学,2022,40(12):143-151. 被引量：1
2曾明如,杨向文,祝琴.基于卷积神经网络的横向转角预测方法[J].现代电子技术,2020,43(6):140-143. 被引量：2

1司福明,卜天然.一种基于Hadoop云计算平台大数据聚类算法设计[J].通化师范学院学报,2016,37(4):9-12. 被引量：3
2李惠欢.Internet中数据库访问方法[J].计算机应用研究,2001,18(3):75-77. 被引量：7
3潘战生.利用DBI实现跨平台异构数据源的存取[J].计算机系统应用,2000,9(5):40-41.
4武夫.VB编写简单U盘加密器[J].黑客防线,2007(7):88-88.
5杜强,孙敏.基于改进聚类分析算法的入侵检测系统研究[J].计算机工程与应用,2011,47(11):106-108. 被引量：27
6曹剑,徐友春,赵建辉,张志超,李建市.野外环境下基于AK—means聚类算法的障碍检测研究[J].军事交通学院学报,2012,14(8):45-49.
7司福明.一种基于密度的增量k-means聚类算法研究[J].新余学院学报,2016,21(3):114-117. 被引量：1
8Windows XP实用小窍门(二)[J].电脑采购,2003,0(5):12-12.
9魏建东,陆建峰,彭甫镕.一种层次初始的聚类个数自适应的聚类方法研究[J].电子设计工程,2015,23(6):5-8. 被引量：6
10丁姝郁.一种基于DBI-PD聚类算法的异常检测机制[J].电脑开发与应用,2015,28(2):24-26. 被引量：2

新余学院学报

2016年第4期

浏览历史

内容加载中请稍等...

基于Hadoop平台的DBIK-means聚类算法并行化研究被引量：1

参考文献7

二级参考文献23

共引文献77

同被引文献3

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于Hadoop平台的DBIK-means聚类算法并行化研究 被引量：1

参考文献7

二级参考文献23

共引文献77

同被引文献3

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于Hadoop平台的DBIK-means聚类算法并行化研究被引量：1