从基因表达数据中挖掘最大的行常量双聚类被引量：5

Mining constant row bicluster in gene expression data

下载PDF

导出

摘要双聚类方法是当前分析基因表达数据的一个重要研究方向,其挖掘目标是发现哪些基因在哪些实验条件下具有相似的表达水平或者关系密切。目前已提出了许多双聚类算法来挖掘不同类型的双聚类,然而其大部分挖掘效率不高。鉴于此,提出了一个新颖的挖掘算法———MRCluster,其主要是用来从原始的基因表达数据中挖掘最大的行常量双聚类模式。就其挖掘效率来说,它采用的是基于Apriori原则的基因扩展深度优先的挖掘策略,并且在挖掘过程中引入了一些新颖的剪枝技术来提高效率。将MRCluster和一个行常量双聚类模式挖掘方法 RAP(range support pattern)算法进行比较,从实验结果上可以看出,相比RAP算法,MRCluster算法对在原始的基因表达数据中挖掘最大的行常量双聚类模式具有更好的效率。因此,MRCluster算法能够有效地从原始的基因表达数据中挖掘最大的行常量双聚类。 Biclustering is one of important techniques for gene expression data analysis. A bicluster is a set of genes coherently expressed for a set of biological conditions. Various bielustering algorithms have been proposed to find biclusters of different types. However, most of them are not efficient. This paper proposed a novel algorithm MRCluster to mine constant row biclusters from real-valued dataset. MRCluster used Apriori property and several novel pruning techniques to mine biclusters efficiently. This paper compared the proposed algorithm with a recent approach RAP. The experimental results show that MRClus- ter is much more efficient than RAP in mining biclusters with constant rows. As a result, MRCluster can efficiently find out constant row bieluster from real-valued gene expression data.

作者缪苗尚学群刘加财王淼

机构地区西北工业大学计算机学院计算机软件与理论系

出处《计算机应用研究》 CSCD 北大核心 2011年第12期4447-4450,共4页 Application Research of Computers

基金国家自然科学基金资助项目(60703105) 西北工业大学基础研究基金资助项目(JC201042)

关键词双聚类原始数据行常量双聚类范围支持度基因芯片 biclustering real-valued data constant row bicluster range support DNA microarray

分类号 TP393.04 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1CHENG Y, CHURCH G M. Biclustering of expression data[ C ]//Proc of the 8th International Conference on Intelligent Systems for Molecu- lar Biology. New York:ACM Press, 2000:93-103.
2MADEIRA S C, OLIVEIRA A L. Biclustering algorithms for biological data analysis: a survey[ J ]. IEEE Trans on Computational Biology and Bioinformatics, 2004,1 (1):24-45.
3SUBRAMANIAN A,TAMAYO P,MOOTHA V,et al. Gene set enrich- ment analysis: a knowledge-based approach for interpreting genome- wide expression profiles [ J ]. Proceedings of the National Acade- my of Sciences of USA, 2005,102 ( 43 ) : 15545-15550.
4CHENG Y, CHURCH G M. Biclustering of gene expression data [ C ]//Proc of International Conference on Intelligent Systems for Mo- lecular Biology. New York : ACM Press ,2000:93-103.
5MURALI T M, KASIF S. Extracting conserved gene expression motifs from gene expression data [ C ]//Proc of Pacific Symposium Biocom- puting. 2003:77-88.
6PANDEY G, ATLURI G, STEINBACH M ,et al. An association anal- ysis approach to biclustering[ C ]//Proc Of the 15th ACM SIGKDD In- ternational Conference on Knowledge Discovery and Data Mining. New York, ACM Press.2009,677- 686.
7ZAHN J M, POOSALA S. AGEMAP:a gene expression database for aging in mice[ J]. PLoS Genetics ,2007,3( 11 ) :2326-2337.

同被引文献92

1钱鑫,张龙波,田爱奎,邓齐志,汪金苗.一种面向数据密集型计算环境的聚类算法[J].济南大学学报（自然科学版）,2013,27(1):11-15. 被引量：3
2陈垚亮,洪骥,崔万云,肖仰华.BWA Plus:一个基于频繁序列的下一代基因比对工具[J].计算机研究与发展,2011,48(S3):391-394. 被引量：2
3罗尚凤,李国光,何宇东,辛永洁,武建华,王燕生.枳术丸的化学成分分析[J].西北药学杂志,1994,9(5):206-209. 被引量：11
4李国春,戴慎.动态聚类分析在中医方剂药量组合规律中的应用[J].中国卫生统计,2006,23(1):63-64. 被引量：9
5罗四维,赵连伟.基于谱图理论的流形学习算法[J].计算机研究与发展,2006,43(7):1173-1179. 被引量：76
6葛宏伟,梁艳春.基于隐马尔可夫模型和免疫粒子群优化的多序列比对算法[J].计算机研究与发展,2006,43(8):1330-1336. 被引量：9
7陆斌杰.数据挖掘技术在医院管理中的应用[J].中国医疗器械杂志,2006,30(4):256-257. 被引量：6
8闫雷鸣,孙志挥.一种基于二次互信息的双聚类算法[J].计算机工程与应用,2006,42(22):158-160. 被引量：4
9韩家炜.数据挖掘:概念与技术[M].北京:机械工业出版社,2006.
10QU Jinhin, MICHAEL N, CHEN Luonan. Constrained sub- space clustering for time series gene expression data [C]. Suzhou, China: 4th Intemational Conference on Computational Systems Biology, 2010: 9-11.

引证文献5

1张敏,戈文航.基于概率计算的重叠双聚类算法[J].计算机工程与设计,2012,33(9):3579-3583. 被引量：3
2王洪波,荣岩,罗贺,王晓佳.基于流形学习的DNA序列数据挖掘方法研究[J].合肥工业大学学报（自然科学版）,2014,37(8):933-937. 被引量：2
3刘婵桢,王友俊.医学数据挖掘技术与应用研究[J].生物医学工程学杂志,2014,31(5):1182-1186. 被引量：12
4王瑞祥.基于双聚类算法的方剂剂量模式研究[J].辽宁中医杂志,2016,43(1):8-9. 被引量：1
5霍宏,董旭,崔一之,李晶怡,张莹,刘佳惠,丛婧,王东岩.转录组学应用于针灸作用机制研究的探讨[J].针灸临床杂志,2022,38(1):1-7. 被引量：5

二级引证文献23

1钱立,王红,廉耿,单长丽.互联网大背景下医学影像诊断云平台对保障民生健康工作有效推进机制的研究[J].科教导刊,2021(34):157-160. 被引量：2
2姜龙训,张玲.改进型蚁群聚类算法在单核苷酸多态性(SNPs)数据分析中的应用[J].中国数字医学,2015,10(5):77-80.
3田宗梅,王莉,肖琳.基于数据挖掘的临床路径抽取与应用[J].中国数字医学,2015,10(6):2-4. 被引量：6
4王殿君,邵宗凯.FP-Growth算法在药物相互作用系统中的应用[J].武汉工程大学学报,2015,37(10):57-60. 被引量：2
5刘杰,张淑艳.数据挖掘在检验医学中的应用[J].中华检验医学杂志,2015,38(12):888-890. 被引量：7
6王翠娥,李香林,崔冬华.复杂网络数据流的入侵数据检测方法仿真[J].计算机仿真,2015,32(12):272-275. 被引量：5
7刘文华,梁永全,冯政.基于加权均方残差的改进双聚类算法[J].模式识别与人工智能,2016,29(6):519-526. 被引量：3
8黎彩芬,唐瑞璠,卢远新,韦玉玲,陈翠芹,何拥群.病案信息数据挖掘在老年高血压病临床护理中的应用[J].深圳中西医结合杂志,2016,26(12):132-133. 被引量：6
9陈超,沈思鹏,赵杨,陈峰,魏永越.大数据思维与传统统计思维差异的思考[J].南京医科大学学报（社会科学版）,2016,16(6):477-479. 被引量：2
10孙林,刘弱南,张霄雨,孙印杰,宋黎明.一种基于粗糙均方残基的模糊双聚类方法[J].河南师范大学学报（自然科学版）,2017,45(5):93-100. 被引量：4

1刘武,杨路,任萍,舒航.缓冲区溢出攻击的分析和一种防卫算法RAP[J].计算机应用,2003,23(1):4-6. 被引量：8

计算机应用研究

2011年第12期

浏览历史

内容加载中请稍等...

从基因表达数据中挖掘最大的行常量双聚类被引量：5

参考文献7

同被引文献92

引证文献5

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

从基因表达数据中挖掘最大的行常量双聚类 被引量：5

参考文献7

同被引文献92

引证文献5

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

从基因表达数据中挖掘最大的行常量双聚类被引量：5