一种新的基因表达数据聚类方法被引量：3

New method for clustering gene expression data

下载PDF

导出

摘要提出了一种基于样本间关系的新聚类方法,从基因表达数据中通过pearson相关系数获得样本间的关系,并用网络的方法表示这种关系,通过该网络的空间结构特征来提取样本间的关系特征,并在这种关系特征空间中进行样本的聚类.该方法能更好地揭示不同类样本间的差异性,具有聚类空间维数低而无需降维的特点.分别采用本方法与现有的聚类方法对真实的基因表达数据进行了聚类分析,实验结果说明该方法能获得更高的聚类正确率,且对于分布混杂的数据的聚类效果也较好. A new clustering method based on the relationship between patterns is proposed. The relationship between patterns is obtained from gene expression data through the pearson correlation coefficient, which is denoted by a network, the relation feature between patterns is extracted by discovering the structure feature of the network, and clustering is performed in the relation feature space. The proposed method uncovers the dissimilarity between patterns belonging to different classes more effectively, and the dimensionality of the clustering space is so low than there is no need to reduce dimensions. The comparison of the method with the conventional ones shows that the method can obtain a much higher clustering efficiency than other methods and it can lead to a better efficiency even for those data with promiscuous distribution.

作者王文俊张军英

机构地区西安电子科技大学计算机学院

出处《西安电子科技大学学报》 EI CAS CSCD 北大核心 2009年第3期502-505,534,共5页 Journal of Xidian University

基金国家自然科学基金资助(60371044)

关键词聚类样本关系网络结构特征关系特征 clustering pattern relation network structure feature relation feature

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献10

1Witten I H, Frank E. Data Mining: Pracitcal Machine Learning Tools and Techniques [M]. Sna Francisco: Morgan Kaufmann Publishers, 2005.
2Golub T R, Slonim D K, Tamayo P, et al. Molecular Classification of Cancer: Class Discovery and Class Prediction by Gene Expression Monitoring [J]. Science, 1999, 286(5439): 531-537.
3Karypis G, Han E H, Kumar V. CHAMELEON: A Hierarchical Clustering Algorithm Using Dynamic Modeling[J]. Journal of Computer Using Dynamic Modeling, IEEE Computer, 1999, 32(8): 68-75.
4Eisen M B, Spellman P T. Cluster Analysis and Display of Genome-wide Expression Ppatterns [J]. The National Academy of Science, 1998, 95(25) : 14863-14868.
5Herwig R, Poustka A J. Large-scale Clustering of cDNA-fingerprinting Data [J]. The National Academy of Science, 1999, 9(11) : 1093-1105.
6Kohonen T. The Self-Organizing Map [J]. Proc IEEE, 1990, 78(9): 1464-1480.
7宫改云,毛用才,高新波,刘三阳.基于模糊c-均值聚类的微阵列基因表达数据分析[J].西安电子科技大学学报,2004,31(2):291-295. 被引量：8
8Rougemont J, Hingamp P. DNA Microarray Data and Contextual Analysis of Correlation Graphs [J]. BMC Bioinformatics, 2003, 4 (1) : 15.
9Qu Yi, Xu Shizhong. Supervised Cluster Analysis for Microarray Data Based on Multivariate Gaussian Mixture [J]. Bioinformatics, 2004, 20(12): 1905-1913.
10Herrero J, Valencia A, Dopazo J. A Hierarchical Unsupervised Growing Neural Network for Clustering Gene Expression Patterns [J]. Bioinformatics, 2001, 17(2):126-136.

二级参考文献5

1高新波姬红兵.一种基于特征加权的模糊均值聚类算法[J].西安电子科技大学学报,2000,27:80-83.
2Pan Wei, Lin Jizhen, Le C T. Model-Based Cluster Analysis of Microarray Genes Expression Data[ DB/OL]. http://www, biostat. umn.edu/-weip/paper, hind, 2001-02-07.
3Eiaen M, Spellman P, Botstein D. Ouster Analysis and Display of C, enome-wide Expression Patterns[J]. Proc Nail Acad Sci USA,1998, 95(25): 14863-14868.
4Tavazoie S, Hughes J D, Campbell M J, et al. Systematic Determination of Genetic Network Azchltecture[J]. Nat Genet, 1999, 22(3):281-285.
5Tamayo P, Slonim D, Mesirov J, et al. Interpetlng Patterns of C.ene Expression with Self-organizing Maps: Methods and Applications to Hematopoietic Differentiation[J]. Proc Nail Acad Sci USA, 1999, 96(6) : 2907-2912.

共引文献7

1崔光照,曹祥红,张华.基于小波变换的基因表达数据去噪聚类分析[J].信号处理,2005,21(z1):463-466. 被引量：2
2张宏怡,张军英.延迟基因调控网络重构问题研究[J].西安电子科技大学学报,2007,34(5):809-813. 被引量：1
3杨德武,李霞,肖雪,杨月莹,王靖.离子通道亚型与其基因共表达的关联研究[J].遗传,2008,30(9):1157-1162.
4王新金,张华,曹祥红,崔光照.小波包分解和模糊聚类下的基因表达数据分析[J].计算机工程与应用,2009,45(19):128-130.
5唐世星,陈军,柯凤琴.基于FCM算法的小脑基因模糊聚类分析[J].数学的实践与认识,2010,40(12):74-79. 被引量：2
6秦传东,刘三阳,张市芳.一种肿瘤基因的支持向量机提取方法[J].西安电子科技大学学报,2012,39(1):191-196. 被引量：4
7王文俊.基于传输互表达的基因表达数据聚类分析[J].模式识别与人工智能,2012,25(6):894-899.

同被引文献98

1忻雅,崔海瑞.植物表达序列标签(EST)标记及其应用研究进展[J].生物学通报,2004,39(8):4-6. 被引量：6
2李颖新,刘全金,阮晓钢.一种肿瘤基因表达数据的知识提取方法[J].电子学报,2004,32(9):1479-1482. 被引量：13
3李虹,卢孟柱,蒋湘宁.表达序列标签(EST)分析及其在林木研究中的应用[J].林业科学研究,2004,17(6):804-809. 被引量：14
4李颖新,阮晓钢.基于支持向量机的肿瘤分类特征基因选取[J].计算机研究与发展,2005,42(10):1796-1801. 被引量：51
5丁成龙,沈益新,顾共如,三浦优一.分群分析法获得与多花黑麦草抗叶班病基因连锁的EST-CAPS标记[J].草地学报,2006,14(1):9-13. 被引量：6
6张建成,王传堂,杨新道.SSR和STS标记在花生栽培品种鉴定中的应用研究[J].植物遗传资源学报,2006,7(2):215-219. 被引量：22
7李建中,杨昆,高宏,骆吉洲,郭政.考虑样本不平衡的模型无关的基因选择方法[J].软件学报,2006,17(7):1485-1493. 被引量：24
8连瑞丽,李宇伟,赵德刚.蒺藜状苜蓿中MtERF-6基因的克隆及序列分析[J].草业科学,2006,23(9):82-87. 被引量：5
9刘稳升,吴忠道.表达序列标签大规模序列分析策略及方法[J].国际医学寄生虫病杂志,2007,34(3):139-145. 被引量：3
10赵光耀,孔秀英,贾继增.粗山羊草(Ae.tauschii)幼苗和根全长cDNA文库构建及其EST注释与比较分析[J].中国农业科学,2007,40(7):1331-1336. 被引量：4

引证文献3

1王晓娜,卢欣石.表达序列标签的应用现状及分析方法研究[J].草业科学,2010,27(5):76-84. 被引量：9
2耿耀君,张军英.一种基于监督降维和形状分析的基因选择方法[J].西安电子科技大学学报,2011,38(3):121-127. 被引量：1
3秦传东,刘三阳,张市芳.一种肿瘤基因的支持向量机提取方法[J].西安电子科技大学学报,2012,39(1):191-196. 被引量：4

二级引证文献14

1钟亮,徐亮,刘彦群,焦阳,刘书禹,谌苗苗.基于EST-SSR标记的柞蚕遗传多样性分析[J].蚕业科学,2020,46(1):67-74. 被引量：1
2屠德鹏,魏臻武,武自念,雷艳芳,张栋,邱伟伟.蒺藜苜蓿EST-SSRs分布特征及标记的开发[J].草业科学,2011,28(5):746-752. 被引量：10
3李俊,韩辉林,高强,金倩,迟美妍,武春生,张爱兵.支持向量机和邻接法在夜蛾科昆虫条码研究中的应用[J].生物安全学报,2012,21(4):308-314. 被引量：1
4王进,丁凌,孙开伟,李钟浩.演化超网络在多类型癌症分子分型中的应用[J].电子与信息学报,2013,35(10):2425-2431. 被引量：5
5刘泓宇,谭北平,董晓慧,迟淑艳,杨奇慧.低盐胁迫下凡纳滨对虾鳃丝抑制性消减杂交cDNA文库构建及差异ESTs分析[J].海洋湖沼通报,2014(1):56-66.
6魏峻.一种有效的DNA微阵列数据特征基因提取方法[J].现代电子技术,2014,37(13):95-98.
7凌玲,衣娜,王翼飞.基于提升小波的基因芯片数据的分类预测[J].应用数学与计算数学学报,2014,28(2):218-227.
8王年,宋豪,汪沁紫.基于点的代数连通强度和非负矩阵分解的肿瘤基因分类[J].安徽大学学报（自然科学版）,2015,39(1):92-96. 被引量：1
9郑茜茜,马红方,谌苗苗,钟亮,李群,王欢,夏润玺,李喜升,王凤成,刘彦群.基于EST数据的柞蚕SSR标记开发[J].蚕业科学,2016,42(1):76-82. 被引量：4
10卢倩,邹丽萍.转录组测序技术在癫痫中的应用[J].癫痫杂志,2018,4(2):112-116. 被引量：2

1张华国,黄韦艮,周长宝,厉冬玲,肖清梅.关于IKONOS卫星遥感图像的分形特征研究[J].测绘通报,2005(5):15-18. 被引量：12
2韩丽,程远,贾玥.融合空间结构特征的三维模型局部检索方法[J].微型机与应用,2013,32(15):51-53. 被引量：1
3Huabin Yang Deyu Wang.FH Sequences Selected Based on Clustering Analysis[J].通讯和计算机（中英文版）,2010,7(8):58-61. 被引量：1
4秦昆,陈一祥,甘顺子,冯霞,任文力.高分辨率遥感影像空间结构特征建模方法综述[J].中国图象图形学报,2013,18(9):1055-1064. 被引量：10
5本期摘要[J].传感器世界,2014,20(10):4-5.
6赖明珠,孙建国,张国印.双特征下的二维电子海图水印技术研究[J].哈尔滨工程大学学报,2015,36(5):678-681.
7谭论正,夏利民,夏胜平.基于多级Sigmoid神经网络的城市交通场景理解[J].国防科技大学学报,2012,34(4):132-137. 被引量：6
8李垒,任越美.基于随机森林的高光谱遥感图像分类[J].计算机工程与应用,2016,52(24):189-193. 被引量：18
9文振焜,陈斌,吴惠思.基于自适应哈希算法的直播视频篡改检测[J].深圳大学学报（理工版）,2017,34(2):165-172. 被引量：1
10沈璐璐,蔡丽娜.基于非监督分类的遥感信息提取方法尝试[J].硅谷,2010,3(14):162-163. 被引量：3

西安电子科技大学学报

2009年第3期

浏览历史

内容加载中请稍等...

一种新的基因表达数据聚类方法被引量：3

参考文献10

二级参考文献5

共引文献7

同被引文献98

引证文献3

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

一种新的基因表达数据聚类方法 被引量：3

参考文献10

二级参考文献5

共引文献7

同被引文献98

引证文献3

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

一种新的基因表达数据聚类方法被引量：3