基因表达数据的分层近邻传播聚类算法被引量：5

Gene expression data clustering algorithm using hierarchical affinity propagation

下载PDF

导出

摘要为提高分层近邻传播聚类算法处理大规模基因表达数据的精确度,通过使用Pearson系数度量基因表达数据之间的相似性,构建相似性矩阵,在分层近邻传播聚类的自适应阶段加入全局数据信息,提出一种高效的分层近邻传播聚类算法。实验结果表明,与同类算法相比,该算法可以快速完成大规模基因表达数据的聚类,获得较高Silhouette(Sil)及Calinski-Harabasz(CH)指标值的聚类结果。 To improve the accuracy of gene expression data clustering obtained using hierarchical affinity propagation clustering algorithm,Pearson correlation coefficient was used to measure the similarity between gene expression data to construct the similarity matrix,the global information was added into the adapting stage in hierarchical affinity propagation procedure,and an efficient hierarchical affinity propagation algorithm was proposed.Experimental results show that compared with the other existing algorithms,the proposed algorithm can cluster the large-scale gene expression data fast and obtain the clustering results with high Silhouette index and Calinski-Harabasz index.

作者吴娱钟诚尹梦晓 WU Yu ZHONG Cheng YIN Meng-xiao(School of Computer, Electronics and Information, Guangxi University, Nanning 530004, Chin)

机构地区广西大学计算机与电子信息学院

出处《计算机工程与设计》北大核心 2016年第11期2961-2966,共6页 Computer Engineering and Design

基金国家自然科学基金项目(61462005) 广西自然科学基金项目(2014XNSFAA118396 2014XNSFAA118361)

关键词基因表达数据聚类分层近邻传播自适应全局数据 gene expression data clustering hierarchical affinity propagation adaptation global data

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献7

1涂金金,杨明,郭丽娜.基于MapReduce的基因数据密度层次聚类算法[J].中国科学技术大学学报,2014,44(7):537-543. 被引量：7
2张建朋,陈福才,李邵梅,于洪涛.基于混合测度的并行仿射传播聚类算法[J].计算机科学,2013,40(7):167-172. 被引量：4
3冯晓磊,于洪涛.密度不敏感的近邻传播聚类算法研究[J].计算机工程,2012,38(2):159-162. 被引量：7
4许喆,薛智锋,陈福才.基于改进的近邻传播学习算法的视频拷贝检测[J].计算机工程与设计,2014,35(9):3185-3189. 被引量：4
5王开军,张军英,李丹,张新娜,郭涛.自适应仿射传播聚类[J].自动化学报,2007,33(12):1242-1246. 被引量：145
6鲁伟明,杜晨阳,魏宝刚,沈春辉,叶振超.基于MapReduce的分布式近邻传播聚类算法[J].计算机研究与发展,2012,49(8):1762-1772. 被引量：53
7刘晓楠,尹美娟,李明涛,姚东,陈武平.面向大规模数据的分层近邻传播聚类算法[J].计算机科学,2014,41(3):185-188. 被引量：14

二级参考文献65

1倪巍伟,陆介平,孙志挥.基于向量内积不等式的分布式k均值聚类算法[J].计算机研究与发展,2005,42(9):1493-1497. 被引量：15
2Gelbard R, Goldman O, Spiegler I. Investigating Diversity of Clustering Methods: An Empirical Comparison[J]. Data & Knowledge Engineering, 2007, 63(1): 155-166.
3Frey B J, Dueck D. Clustering by Passing Messages Between Data Points[J]. Science, 2007, 315(5814): 972-976.
4Thedoridis S, Koutroumbas K. Pattern Recognition[M]. 3rd ed. Beijing, China: Publishing House of Electronics Industry, 2010.
5Frey B J, Dueck D. Clustering by passing messages between data points. Science, 2007, 315(5814): 972-976
6Kelly K. Affinity program slashes computing times [Online], available: http://www.news.utoronto.ca/bin6/070215-2952. asp. October 25, 2007
7Dudoit S, Fridlyand J. A prediction-based resampling method for estimating the number of clusters in a dataset. Genome Biology, 2002, 3(7): 1-21
8Wang K J. Supplement of adaptive affinity propagation clustering [Online], available: http://www.mathworks. com/matlabcentral/fileexchange/loadAut hor .do?object Type =author&objectId=1095267, October 25, 2007
9Velamuru P K, Renaut R A, Guo H B, Chen K W. Robust clustering of positron emission tomography data. In: Joint Interface CSNA. USA: 2005
10Dembele D, Kastner P. Fuzzy C-means method for clustering microarray data. Bioinformatics, 2003, 19(8): 973-980

共引文献215

1潘春燕,张仁崇,杨忠保.密度偏差抽样在近邻传播聚类中的应用[J].商丘师范学院学报,2022,38(12):4-8.
2原旭,陈志奎,赵亮,杨德礼.一种基于Hadoop的改进减法聚类算法[J].微电子学与计算机,2015,32(3):151-155. 被引量：1
3常瑞花.基于密集度量元的近邻传播聚类算法[J].微电子学与计算机,2015,32(5):1-5. 被引量：1
4王少锋,伍少成,刘涛,邓琨,黄兵.对Hadoop的用电信息大数据计算服务应用分析[J].自动化与仪器仪表,2016(4):221-222. 被引量：6
5张仁彦,赵洪亮,卢晓,曹茂永.基于相似性传播聚类的灰度图像分割[J].海军工程大学学报,2009,21(3):33-37. 被引量：4
6茅赵阳.图像的聚类和可视化方法研究[J].现代计算机,2009,15(7):71-73. 被引量：1
7许文竹,徐立鸿.基于仿射传播聚类的自适应关键帧提取[J].计算机科学,2010,37(1):268-270. 被引量：11
8李雅芹,杨慧中.基于仿射传播聚类和高斯过程的多模型建模方法[J].计算机与应用化学,2010,27(1):51-54. 被引量：15
9董俊,王锁萍,熊范纶.可变相似性度量的近邻传播聚类[J].电子与信息学报,2010,32(3):509-514. 被引量：49
10王开军,李健.聚类结果可视化的线珠模式[J].计算机系统应用,2010,19(5):167-170. 被引量：1

同被引文献63

1丁晓群,黄伟,章文俊,邓勇,丁颖,方朝雄,李可文.基于电压控制区的主导节点电压校正方法[J].电网技术,2004,28(14):44-48. 被引量：31
2郭庆来,孙宏斌,张伯明,吴文传.基于无功源控制空间聚类分析的无功电压分区[J].电力系统自动化,2005,29(10):36-40. 被引量：124
3杨秀媛,董征,唐宝,陈树勇.基于模糊聚类分析的无功电压控制分区[J].中国电机工程学报,2006,26(22):6-10. 被引量：78
4倪向萍,阮前途,梅生伟,何光宇.基于复杂网络理论的无功分区算法及其在上海电网中的应用[J].电网技术,2007,31(9):6-12. 被引量：49
5孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1076
6岳峰,孙亮,王宽全,王永吉,左旺孟.基因表达数据的聚类分析研究进展[J].自动化学报,2008,34(2):113-120. 被引量：25
7张平,宋春晖,杨用彪,高红山,张红艳,刘维明,潘美慧,刘平,胡思虎,夏维民.稳定湖相沉积物和风成黄土粒度判别函数的建立及其意义[J].沉积学报,2008,26(3):501-507. 被引量：37
8肖宇,于剑.基于近邻传播算法的半监督聚类[J].软件学报,2008,19(11):2803-2813. 被引量：165
9殷志强,秦小光,吴金水,宁波.中国北方部分地区黄土、沙漠沙、湖泊、河流细粒沉积物粒度多组分分布特征研究[J].沉积学报,2009,27(2):343-351. 被引量：86
10张国印,程慧杰,刘咏梅,姚爱红.一种新算法在基因表达谱聚类中的应用[J].计算机工程与应用,2009,45(36):216-218. 被引量：4

引证文献5

1姚登举,詹晓娟,张晓晶.一种加权K-均值基因聚类算法[J].哈尔滨理工大学学报,2017,22(2):112-116. 被引量：12
2刘文通,舒勤,钟俊,李欣然.基于局部电压稳定指标及复杂网络理论的无功电压分区方法[J].电网技术,2018,42(1):269-275. 被引量：30
3叶涛,陈雷.基于近邻传播聚类与曲线拟合的断层识别[J].计算机工程与设计,2018,39(8):2510-2514.
4刘祥奇,宋磊,吴奇龙,李国民,毛欣.基于粒度分布曲线的邻近传播聚类算法在沉积环境识别中的应用——以白洋淀地区为例[J].海洋地质与第四纪地质,2020,40(1):198-209. 被引量：4
5顾东虎.Hadoop云平台下基于P-WAP的大数据聚类挖掘算法[J].长春师范大学学报,2020,39(10):29-35. 被引量：3

二级引证文献49

1成雨风,贺松,刘燕,黄诗懿.基于数据挖掘的CRC肠道菌群营养干预可行性分析[J].智能计算机与应用,2020(4):81-85.
2覃琴,施浩波,周勤勇,韩奕.兼顾系统强度和直流支撑的500 kV电网分区方法[J].电网技术,2018,42(12):4138-4144. 被引量：8
3管霖,吴亮,卓映君,文博,陈鹏,赵琦,黄振琳.面向暂态电压控制的大电网区域划分方法[J].电网技术,2018,42(11):3753-3759. 被引量：14
4黄英来,任田丽,赵鹏.VMD与PSO的乐器声音识别[J].哈尔滨理工大学学报,2018,23(2):6-11. 被引量：4
5周建方,何禹清,何红斌,李翠翠,李培强.基于线路电压稳定指标的连续潮流计算方法[J].电力系统及其自动化学报,2018,30(8):140-144. 被引量：5
6张瀚超,匡洪海,王建辉,朱国平.偏差修正算法的风电短期功率预测[J].新型工业化,2019,9(2):1-9. 被引量：4
7陈功贵,曹佳,刘耀,郭艳艳.基于全序排列帝国主义算法的多目标无功优化仿真研究[J].实验室研究与探索,2019,38(7):94-99. 被引量：3
8张旭,陈云龙,王仪贤,岳帅,查效兵.基于潮流断面修正的含风电电网无功-电压分区方法[J].电力自动化设备,2019,39(10):48-54. 被引量：12
9袁博,张雪敏,张至美.考虑无功源容量约束的无功分区方法[J].电力电容器与无功补偿,2020,41(1):59-65.
10郑吉祥,钟俊.基于节点类型和分区耦合性的复杂网络无功电压快速分区方法[J].电网技术,2020,44(1):223-229. 被引量：18

1杨春蓉,赵小勇.利用改进的最优聚类算法边缘提取方法研究[J].计算机应用与软件,2012,29(12):295-297. 被引量：6
2日立新型屏幕桌以“影子”作接口[J].家电科技,2004(12):14-14.
3宋中山,王晓华.一种基于二部分图的推荐算法[J].中南民族大学学报（自然科学版）,2015,34(1):103-107. 被引量：1
4邹小林.融合SLIC的DCUT改进图像分割算法[J].新疆大学学报（自然科学版）,2017,34(1):78-83. 被引量：2
5党宏社,白梅.一种基于分层AP的视频关键帧提取方法研究[J].陕西科技大学学报（自然科学版）,2016,34(1):159-163.
6石坤,余强,朱秋月.融合信息熵与兴趣度的协同过滤算法[J].计算机与数字工程,2017,45(2):338-342. 被引量：3
7王修竹,刘自伟,齐阳,鲍竞.基于Pearson系数的芯片数据预处理方法[J].计算机时代,2006(11):37-38. 被引量：1
8Songmin Jia,Lijia Wang,Xiuzhi Li.View-invariant Gait Authentication Based on Silhouette Contours Analysis and View Estimation[J].IEEE/CAA Journal of Automatica Sinica,2015,2(2):226-232. 被引量：1
9向培素.一种自适应AP算法的matlab实现[J].西南民族大学学报（自然科学版）,2014,40(6):877-882. 被引量：1
10杨怡,王江晴,朱宗晓.基于仿射传播聚类的自适应手写字符识别[J].计算机应用,2015,35(3):807-810. 被引量：6

计算机工程与设计

2016年第11期

浏览历史

内容加载中请稍等...

基因表达数据的分层近邻传播聚类算法被引量：5

参考文献7

二级参考文献65

共引文献215

同被引文献63

引证文献5

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

基因表达数据的分层近邻传播聚类算法 被引量：5

参考文献7

二级参考文献65

共引文献215

同被引文献63

引证文献5

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

基因表达数据的分层近邻传播聚类算法被引量：5