基因表达数据的并行双向聚类算法被引量：2

Parallel Biclustering Algorithm for Gene Expressing Data

下载PDF

导出

摘要基因表达数据的双向聚类问题是生物信息学中的一个重要的问题,通过对基因在各种不同实验条件下的表达数据进行双向聚类,可以分析和识别同类基因所共同拥有的基因功能以及转录调控元件.本文对基因表达数据进行双向聚类的问题进行了深入的研究,提出一种并行算法.该算法根据数据集合的大小对双向聚类质量的反单调性,由最小的数据集合开始逐步添加行或列,最终找到所有满足条件的聚类.实验结果表明,该算法处理速度快,聚类质量高,性能明显优于其它同类算法. Biclustering of the gene expressing data is an important task in bioinformatics. By clustering the gene expressing data obtained under different experimental conditions, function and regulatory elements of the gene sequence can be analyzed and recognized. After studying the problem of gene expressing data analysis, a parallel biclustering algorithm is presented. Based on the anti-monotones property of the quality of the data sets with their sizes, the algorithm starts from the data sets containing of every two rows and every two columns of the data matrix, and gets the final biclusters by gradually adding columns and rows on the data sets, Experimental results show that our algorithm has superiority our other similar algorithms in terms of processing speed and quality of clustering and efficiency.

作者刘维陈崚

机构地区南京航空航天大学信息技术学院扬州大学信息工程学院南京大学计算机软件新技术国家重点实验室

出处《小型微型计算机系统》 CSCD 北大核心 2009年第4期683-689,共7页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(60473012)资助国家科技攻关项目(2003BA614A-14)资助江苏省自然科学基金(BK2005047)资助

关键词基因表达数据并行算法生物信息学双向聚类 sequence comparison parallel algorithm bioinformatics scalability

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献17

1Getz G, Levine E, Domany E. Coupled two-way clustering analysis of gene microarray data[C]. Proceedings of the Natural Academy of Sciences USA, 2000, 12079-12084.
2Tang Chun,Zhang Li,Zhang Idon,et al. Interrelated two-way clustering: an unsupervised approach for gene expression data analysis[C]. Proceedings of the 2nd IEEE International Symposium on Bioinformatics and Bioengineering,41-48, 2001. Inese-ID Tec. Rep. 1/2004, Jan. 2004,31.
3Hartigan J A. Direct clustering of a data matrix[J]. Journal of the American Statistical Association (JASA), 1972, 67(337) :123-129.
4Cheng Yi-zong, George M Church. Biclustering of expression data[J]. Proceedings of the 8th International Conference on Intelligent Systems for Molecular Biology (ISMB' 00), 2000,93- 103.
5Yang yong,Wang Wei,Wang Hai-xun,et al. Capturing subspace correlation in a large data set[C]. Proceedings of the 18th IEEE International Conference on Data Engineering, 2002,517-528.
6Yang yong,Wang Wei,Wang Hai-xun,et al. Enhanced biclustering on expression data [C]. Proceedings of the 3rd IEEE Conference on Bioinforrnatics and Bioengineering, 2003, 321- 327.
7Yuval Klugar, Ronen Basri, Joseph T Chang,et al. Spectral biclustering of microarray data : coclustering genes and conditions[J]. Genome Research,2003,13(4):703-716.
8Amir Ben-Dor, Benny Chor, Richard Karp, et al. Discovering local structure in gene expression data: the order-preserving submatrix problem [C]. Proceedings of the 6th International Conference on Computacional Biology (RECOMB' 02), 2002, 49-57.
9Zhang Zong-hong, Alvin Teo. Mining deterministic biclusters in gene expression data[C]. Proceedings of the Fourth IEEE Symposium on Bioinformatics and Bioengineering (BIBE'04) ,2004, 2173-2180.
10Wang Hai-xun, Wang wei, Yang yong, et al. Clustering by pattern similarity in large data sets[C]. Proceedings of the 2002 ACM SIGMOD International Conference on Management of Data, 2002,394-405.

同被引文献21

1熊赟,邱伯仁,张坤,朱扬勇.Gen-Cluster:一个基因表达数据的高维聚类算法[J].复旦学报（自然科学版）,2008,47(2):135-146. 被引量：2
2郑度,欧阳,周成虎.对自然地理区划方法的认识与思考[J].地理学报,2008,63(6):563-573. 被引量：125
3高倩倩,须文波,孙俊.量子行为粒子群算法在基因聚类中的应用[J].计算机工程与应用,2010,46(21):152-155. 被引量：3
4郭红,蔡莉.采用多目标微分进化算法的基因表达数据双向聚类[J].小型微型计算机系统,2010,31(10):1997-2001. 被引量：3
5周頔,孙俊,须文波.具有量子行为的协同粒子群优化算法[J].控制与决策,2011,26(4):582-586. 被引量：23
6姚强,张研,张士靖.双向聚类在文献计量学中的应用初探——以医院绩效评价为例[J].情报杂志,2012,31(3):54-59. 被引量：30
7宋辞,裴韬.基于特征的时间序列聚类方法研究进展[J].地理科学进展,2012,31(10):1307-1317. 被引量：30
8吴磊,李舒.基于双向聚类方法的中医治疗中风病方剂配伍规律知识发现[J].中国中医药信息杂志,2013,20(11):16-19. 被引量：13
9王劲峰,葛咏,李连发,孟斌,武继磊,柏延臣,杜世宏,廖一兰,胡茂桂,徐成东.地理学时空数据分析方法[J].地理学报,2014,69(9):1326-1345. 被引量：113
10方全,刘以珍,林朝晖,蔡奇英,易淑德,葛刚.云居山栓皮栎群落特征及多样性研究[J].植物科学学报,2015,33(3):311-319. 被引量：15

引证文献2

1陈佳瑜,李梁,罗云.采用多样性选择的量子粒子群双向聚类算法[J].计算机工程与应用,2018,54(9):42-46. 被引量：3
2程昌秀,宋长青,吴晓静,沈石,高培超,叶思菁.地理时空三向聚类分析方法的构建与实践[J].地理学报,2020,75(5):904-916. 被引量：6

二级引证文献9

1曹申,粟世玮,曹文康,杨玄.基于人工免疫粒子群算法的分布式电源优化配置[J].电力科学与工程,2019,35(10):57-61. 被引量：2
2胡一鸣,伍旭中.安徽省全国“一村一品”示范村镇空间分布格局研究[J].沈阳农业大学学报（社会科学版）,2020,22(4):423-429. 被引量：2
3于国龙,赵勇,吴恋,崔忠伟.QPSO算法的改进及其在DBN参数优化中应用[J].计算机工程与应用,2021,57(10):154-162. 被引量：2
4程昌秀,沈石,李强坤.黄河流域人地系统研究的大数据支撑与方法探索[J].中国科学基金,2021,35(4):529-536. 被引量：10
5单宝艳,张智璇,陈艳秋,于新伟,樊文平,吕永强.时空格局分析方法及其实证应用——以山东省制造业为例[J].测绘科学技术学报,2021,38(6):624-630. 被引量：2
6刘耀林,刘启亮,邓敏,石岩.地理大数据挖掘研究进展与挑战[J].测绘学报,2022,51(7):1544-1560. 被引量：12
7高翔,温蕊阳,张杰,李杰,闫安.中国荒漠类型自然保护区空间分布格局[J].兰州大学学报（自然科学版）,2023,59(1):17-22.
8杨峰,罗尉丹,李仰杰.基于量子竞争决策算法的电力营销信息多标签分类方法[J].微型电脑应用,2023,39(3):100-103. 被引量：1
9李效顺,刘希朝,和伟康,倪衡,李帆.基于DNA模型的城镇人地耦合框架及机理研究[J].现代城市研究,2023,38(4):126-132. 被引量：1

1孙燕飞.基于云平台的双向聚类算法在生物信息领域中的应用[J].科技通报,2013,29(4):143-145. 被引量：1
2李梁,陈佳瑜.基于粒子群算法的基因表达谱聚类分析方法[J].重庆理工大学学报（自然科学）,2017,31(2):89-94. 被引量：7
3胡炜,徐青翠,樊中奎.基于用户日志双向聚类的查询扩展方法[J].数字技术与应用,2011,29(12):233-234. 被引量：1
4魏玲,刘运朋,邢继昕.可扩展双向聚类算法在煤炭领域中的研究与实现[J].煤炭技术,2013,32(5):195-198.
5唐小丽,胡孔法,陈崚,顾颀.一种改进的双向聚类算法及其在销售分析中的应用[J].计算机应用研究,2007,24(1):251-254. 被引量：1
6张龑飞,刘培强.双向聚类中二分团判断的改进算法[J].中国市场,2015(24):220-221.
7明叔亮,宋妍,董晓常.千亿Google[J].互联网周刊,2005(37):27-29. 被引量：1
8李纪元,傅宇凡.下一代互联网拉开商用大幕[J].中国教育网络,2013(2):22-23.
9侯磊,刘培强,肖进杰.基于奇异值分解法的二元矩阵聚类算法研究[J].计算机安全,2014(11):18-23.
10黄玲琳,刘青,杨楠,李亚平,肖林.RABBIC:基因表达数据的基因模块发现[J].小型微型计算机系统,2016,37(8):1702-1706.

小型微型计算机系统

2009年第4期

浏览历史

内容加载中请稍等...

基因表达数据的并行双向聚类算法被引量：2

参考文献17

同被引文献21

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基因表达数据的并行双向聚类算法 被引量：2

参考文献17

同被引文献21

引证文献2

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基因表达数据的并行双向聚类算法被引量：2