摘要
本文提出了一种基于遗传算法的基因微阵列数据特征提取方法。首先对原始数据进行标准化,然后利用方差分析方法对数据进行降低维数处理,最后利用遗传算法对数据进行优化。针对基因数据对遗传算子和适应度函数进行设置,优化数据集选取特征基因,得到较小的特征子集。为了验证选取的特征,利用样本划分法通过判别分析建立分类器进行判定。实验论证此方法具有理想的分类效果,算法稳定、效率高。
This paper presents a feature selection method based on genetic algorithm (GA) and linear discriminant analysis (LDA). First, normalization and gene filtering are used to pre-process dataset. Then genetic algorithm is performed to select the best features. We use linear discfiminant analysis to form the fitness function. In the experiments, a good gene subset is obtained based on the global searching of microarray data. Experimental results prove our method is robust and efficient.
出处
《生物信息学》
2008年第3期119-122,共4页
Chinese Journal of Bioinformatics
基金
山东省自然科学基金
Y2006C96
关键词
基因数据
数据预处理
特征选取
遗传算法
分类评价
Microarrays data
Data pre-processing
Feature selection
Genetic Algorithm
Linear Diserirainant Analysis