期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
应用于癌症基因表达数据的OMB双向聚类算法 被引量:1
1
作者 王常武 刘楠楠 +2 位作者 贾永伟 王宝文 刘文远 《计算机工程与应用》 CSCD 北大核心 2011年第28期237-240,共4页
癌症基因表达数据的聚类分析可以为癌症的早期诊断和精确的癌症亚型分型提供依据。针对癌症基因表达数据的特点,提出一种称为OMB(Override Matrix Bicluster)的双向聚类算法。OMB算法分别在基因表达数据矩阵的行和列上搜索低于阈值的行... 癌症基因表达数据的聚类分析可以为癌症的早期诊断和精确的癌症亚型分型提供依据。针对癌症基因表达数据的特点,提出一种称为OMB(Override Matrix Bicluster)的双向聚类算法。OMB算法分别在基因表达数据矩阵的行和列上搜索低于阈值的行和列,用删除添加算法产生一个子矩阵;构建与基因表达矩阵大小相同的覆盖矩阵,标识矩阵中上一次迭代产生的子矩阵的位置;在标识出来的矩阵中,重复贪婪迭代搜索找到K个聚类结果。Matlab实验结果表明OMB算法对具有重叠结构的癌症基因表达数据具有更好的聚类效果。 展开更多
关键词 癌症基因表达数据 双向聚类算法 贪婪迭代 覆盖矩阵 平均平方残基
下载PDF
改进的局部线性嵌入算法在癌症基因表达数据降维中的应用 被引量:2
2
作者 刘文远 王春蕾 +1 位作者 王宝文 王常武 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2014年第1期85-90,共6页
癌症基因表达数据具有高维、小样本的特点,对其进行维数约减十分有必要。传统的线性降维方法不能发现数据点之间的非线性关系,降维效果不好,因此,本文引入一种改进距离的多组权局部线性嵌入(DMLLE)算法对其进行降维。该算法采用一种改... 癌症基因表达数据具有高维、小样本的特点,对其进行维数约减十分有必要。传统的线性降维方法不能发现数据点之间的非线性关系,降维效果不好,因此,本文引入一种改进距离的多组权局部线性嵌入(DMLLE)算法对其进行降维。该算法采用一种改进距离来计算每个数据点的近邻点,为每一个近邻引入多组线性无关的局部权向量进行线性重构,通过最小化重构误差得到高维数据在低维空间的嵌入结果。实验结果表明,DMLLE算法对癌症基因表达数据有很好的降维效果。 展开更多
关键词 非线性降维 局部线性嵌入 癌症基因表达数据 多组重构权
原文传递
Cancer classification based on microarray gene expression data using a principal component accumulation method 被引量:2
3
作者 LIU JingJing CAI WenSheng SHAO XueGuang 《Science China Chemistry》 SCIE EI CAS 2011年第5期802-811,共10页
The classification of cancer is a major research topic in bioinformatics. The nature of high dimensionality and small size associated with gene expression data,however,makes the classification quite challenging. Altho... The classification of cancer is a major research topic in bioinformatics. The nature of high dimensionality and small size associated with gene expression data,however,makes the classification quite challenging. Although principal component analysis (PCA) is of particular interest for the high-dimensional data,it may overemphasize some aspects and ignore some other important information contained in the richly complex data,because it displays only the difference in the first twoor three-dimensional PC subspaces. Based on PCA,a principal component accumulation (PCAcc) method was proposed. It employs the information contained in multiple PC subspaces and improves the class separability of cancers. The effectiveness of the present method was evaluated by four commonly used gene expression datasets,and the results show that the method performs well for cancer classification. 展开更多
关键词 cancer classification principal component analysis principal component accumulation gene expression data
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部