期刊文献+

一种新的并行自动聚类算法:CGC-Cluster 被引量:2

New Parallel Auto-clustering Algorithm: CGC-Cluster
下载PDF
导出
摘要 针对基于基因表达式编程的自动聚类算法聚类速度较慢和聚簇质量较差的问题,提出一种新的并行自动聚类算法:基于统一计算设备架构和粗粒度并行模型的基因表达式编程自动聚类算法(CGC-Cluster).采用GRCM方法对基于基因表达式编程的自动聚类算法(GEP-Cluster)中聚类中心的筛选与聚合步骤进行了改进,基于统一计算设备架构以达到提高并行处理能力,基于粗粒度并行演化模型以提高并行度.选择了较知名的数据集,从算法的聚类速度和聚类质量两方面与GEP-Cluster算法进行了统计实验对比分析,实验结果表明,CGC-Cluster算法不仅获得了3倍左右的加速比,而且从簇内方差、Ocq指标和Dunn指标三种评判质量的指标进行比较,CGC-Cluster显著地改进了聚簇的质量.最后还通过实验分析了算法参数对并行算法的影响. Aiming at the problem that the speed is slower and the quality is poor in automatic clustering algorithm based on gene ex- pression programming, a new parallel automatic clustering algorithm, named GEP-Cluster algorithm based on computer unified device architecture ( CUDA ) and coarse grain parallel evolutionary model, (CGC-Cluster) is proposed. The parallel processing capacity is im- proved based on CUDA. The parallel degree is improved based on parallel evolutionary model. The speed and quality of clustering al- gorithm are compared between CGC-Cluster algorithm and GEP-Cluster by statistical experiments. Experimental results show that CGC-Cluster algorithm not only obtains three times speedup but also gets better clustering qualities from three indexes that variance of intra-cluster,Ocq index and Dunn index. Finally,the effect of algorithm parameters on the parallel algorithm is analyzed through the experimental.
出处 《小型微型计算机系统》 CSCD 北大核心 2015年第6期1181-1187,共7页 Journal of Chinese Computer Systems
基金 国家自然科学基金项目(61305079 61203306 61305086 61165004)资助 福建省杰出青年培育计划项目(JA12471)资助 福建师范大学青年骨干教师培育计划项目(fjsdjk2012083)资助 武汉大学软件工程国家重点实验室开放基金项目(SKLSE2012-09-28)资助 福建省教育厅项目(JA13400)资助
关键词 统一计算设备架构 基因表达式编程 聚类算法 并行演化算法 CUDA GEP clustering algorithm parallel evolutionary algorithm
  • 相关文献

参考文献11

二级参考文献128

共引文献302

同被引文献8

引证文献2

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部