-
题名基于LNMF的癌症基因表达谱数据的特征提取
- 1
-
-
作者
王蕊平
王年
苏亮亮
陈乐
-
机构
安徽大学计算智能与信号处理教育部重点实验室
-
出处
《生物信息学》
2011年第2期164-166,170,共4页
-
基金
国家自然科学基金(60772121)
安徽大学211工程创新团队项目资助
-
文摘
海量数据的存在是现代信息社会的一大特点,如何在成千上万的基因中有效地选出样本的分类特征对癌症的诊治具有重要意义。采用局部非负矩阵分解方法对癌症基因表达谱数据进行特征提取。首先对基因表达谱数据进行筛选,然后构造局部非负矩阵并对其进行分解得到维数低、能充分表征样本的特征向量,最后用支持向量机对特征向量进行分类。结果表明该方法的可行性和有效性。
-
关键词
分类
特征提取
局部非负矩阵分解
基因表达谱
-
Keywords
classification
feature extraction
local non-negative matrix factorization
gene expression profiles
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于邻接谱主分量分析的肿瘤分类方法
被引量:3
- 2
-
-
作者
陈乐
王年
苏亮亮
王蕊平
-
机构
安徽大学计算智能与信号处理教育部重点实验室
-
出处
《安徽大学学报(自然科学版)》
CAS
北大核心
2011年第4期86-91,共6页
-
基金
国家自然科学基金资助项目(60772121)
-
文摘
基于谱图理论展开针对基因表达谱数据的分类研究,将反映图结构的特征表示引入到基因表达谱数据分类中,从而高维空间离散点分布问题便可以转化成为具有结构信息的图问题.文中对基因表达谱数据样本点构造高斯权邻接矩阵,SVD分解后,采用特征记分准则进行筛选,找出最大限度区分肿瘤样本与正常样本的主分量作为样本特征,输入KNN分类器进行分类,通过对白血病两个亚型(ALL与AML)与结肠癌表达谱数据进行实验,证明了文中方法的可行性与有效性.
-
关键词
肿瘤分类
主分量分析
邻接矩阵
特征记分准则
-
Keywords
tumor classification
principal components analysis
adjacent spectral
feature scoring criteria
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于邻接矩阵分解的肿瘤亚型特征提取方法
- 3
-
-
作者
陈乐
王年
苏亮亮
王蕊平
-
机构
安徽大学计算智能与信号处理教育部重点实验室
-
出处
《生物学杂志》
CAS
CSCD
2011年第2期87-89,共3页
-
基金
国家自然科学基金(10601001
60772121)
+1 种基金
安徽省自然科学基金(070412065)
安徽省教育厅自然科学研究项目(2006KJ030B)
-
文摘
基于肿瘤基因表达谱的肿瘤分类是生物信息学的一个重要研究内容。传统的肿瘤信息特征提取方法大多基于信息基因选择方法,但是在筛选基因时,不可避免的会造成分类信息的流失。提出了一种基于邻接矩阵分解的肿瘤亚型特征提取方法,首先对肿瘤基因表达谱数据构造高斯权邻接矩阵,接着对邻接矩阵进行奇异值分解,最后将分解得到的正交矩阵特征行向量作为分类特征输入支持向量机进行分类识别。采用留一法对白血病两个亚型的基因表达谱数据集进行实验,实验结果证明了该方法的可行性和有效性。
-
关键词
生物信息学
邻接矩阵
基因表达数据
特征提取
-
Keywords
bioinformatics
adjacent spectral
gene expression data
feature extraction
-
分类号
Q811.4
[生物学—生物工程]
TP18
[自动化与计算机技术—控制理论与控制工程]
-