期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
Parameters selection in gene selection using Gaussian kernel support vector machines by genetic algorithm 被引量:11
1
作者 毛勇 周晓波 +2 位作者 皮道映 孙优贤 WONG Stephen T.C. 《Journal of Zhejiang University-Science B(Biomedicine & Biotechnology)》 SCIE EI CAS CSCD 2005年第10期961-973,共13页
In microarray-based cancer classification, gene selection is an important issue owing to the large number of variables and small number of samples as well as its non-linearity. It is difficult to get satisfying result... In microarray-based cancer classification, gene selection is an important issue owing to the large number of variables and small number of samples as well as its non-linearity. It is difficult to get satisfying results by using conventional linear sta- tistical methods. Recursive feature elimination based on support vector machine (SVM RFE) is an effective algorithm for gene selection and cancer classification, which are integrated into a consistent framework. In this paper, we propose a new method to select parameters of the aforementioned algorithm implemented with Gaussian kernel SVMs as better alternatives to the common practice of selecting the apparently best parameters by using a genetic algorithm to search for a couple of optimal parameter. Fast implementation issues for this method are also discussed for pragmatic reasons. The proposed method was tested on two repre- sentative hereditary breast cancer and acute leukaemia datasets. The experimental results indicate that the proposed method per- forms well in selecting genes and achieves high classification accuracies with these genes. 展开更多
关键词 gene selection Support VECTOR machine (SVM) RECURSIVE feature ELIMINATION (RFE) geneTIC algorithm (GA) Parameter selection
下载PDF
Enhancing Cancer Classification through a Hybrid Bio-Inspired Evolutionary Algorithm for Biomarker Gene Selection
2
作者 Hala AlShamlan Halah AlMazrua 《Computers, Materials & Continua》 SCIE EI 2024年第4期675-694,共20页
In this study,our aim is to address the problem of gene selection by proposing a hybrid bio-inspired evolutionary algorithm that combines Grey Wolf Optimization(GWO)with Harris Hawks Optimization(HHO)for feature selec... In this study,our aim is to address the problem of gene selection by proposing a hybrid bio-inspired evolutionary algorithm that combines Grey Wolf Optimization(GWO)with Harris Hawks Optimization(HHO)for feature selection.Themotivation for utilizingGWOandHHOstems fromtheir bio-inspired nature and their demonstrated success in optimization problems.We aimto leverage the strengths of these algorithms to enhance the effectiveness of feature selection in microarray-based cancer classification.We selected leave-one-out cross-validation(LOOCV)to evaluate the performance of both two widely used classifiers,k-nearest neighbors(KNN)and support vector machine(SVM),on high-dimensional cancer microarray data.The proposed method is extensively tested on six publicly available cancer microarray datasets,and a comprehensive comparison with recently published methods is conducted.Our hybrid algorithm demonstrates its effectiveness in improving classification performance,Surpassing alternative approaches in terms of precision.The outcomes confirm the capability of our method to substantially improve both the precision and efficiency of cancer classification,thereby advancing the development ofmore efficient treatment strategies.The proposed hybridmethod offers a promising solution to the gene selection problem in microarray-based cancer classification.It improves the accuracy and efficiency of cancer diagnosis and treatment,and its superior performance compared to other methods highlights its potential applicability in realworld cancer classification tasks.By harnessing the complementary search mechanisms of GWO and HHO,we leverage their bio-inspired behavior to identify informative genes relevant to cancer diagnosis and treatment. 展开更多
关键词 Bio-inspired algorithms bioinformatics cancer classification evolutionary algorithm feature selection gene expression grey wolf optimizer harris hawks optimization k-nearest neighbor support vector machine
下载PDF
基于F-score和二进制灰狼优化的肿瘤基因选择方法
3
作者 穆晓霞 郑李婧 《南京师大学报(自然科学版)》 CAS 北大核心 2024年第1期111-120,共10页
针对肿瘤基因数据维度高、噪声多、冗余性高的现状,结合Spearman相关系数改进F-score算法,在此基础上优化二进制灰狼算法,提出了一种基于改进F-score和二进制灰狼算法的肿瘤基因选择算法.首先,考虑特征之间的相关性,计算每个特征的F-sc... 针对肿瘤基因数据维度高、噪声多、冗余性高的现状,结合Spearman相关系数改进F-score算法,在此基础上优化二进制灰狼算法,提出了一种基于改进F-score和二进制灰狼算法的肿瘤基因选择算法.首先,考虑特征之间的相关性,计算每个特征的F-score值和特征之间的Spearman相关系数的绝对值;然后,计算权重系数得出各个特征的权重值,依据重要性进行排序,选出初选特征子集;最后,通过收敛因子的衰减曲线和初始化方法优化二进制灰狼算法,调整全局搜索和局部搜索所占比例,增强全局搜索能力并提高局部搜索速度,有效节省时间开销,提升特征选择的分类性能和效率,得到最优特征子集.在9个肿瘤基因数据集上测试所提算法,在分类准确率和筛选特征数目两个指标上进行仿真实验,并与4种其他算法进行对比,实验结果证明所提算法表现良好,可有效降低基因数据维度,并具有较好的分类精度. 展开更多
关键词 肿瘤基因 Fisher-score Spearman 相关系数 二进制灰狼优化算法 特征选择
下载PDF
Identification of metastasis-associated genes in colorectal cancer through an integrated genomic and transcriptomic analysis 被引量:2
4
作者 Xiaobo Li Sihua Peng 《Chinese Journal of Cancer Research》 SCIE CAS CSCD 2013年第6期623-636,共14页
Objective: Identification of colorectal cancer (CRC) metastasis genes is one of the most important issues in CRC research. For the purpose of mining CRC metastasis-associated genes, an integrated analysis of mJcroa... Objective: Identification of colorectal cancer (CRC) metastasis genes is one of the most important issues in CRC research. For the purpose of mining CRC metastasis-associated genes, an integrated analysis of mJcroarray data was presented, by combined with evidence acquired from comparative genornic hybridization (CGH) data. Methods: Gene expression profile data of CRC samples were obtained at Gene Expression Omnibus (GEO) website. The 15 important chromosomal aberration sites detected by using CGH technology were used for integrated genomic and transcriptomic analysis. Significant Analysis of Microarray (SAM) was used to detect significantly differentially expressed genes across the whole genome. The overlapping genes were selected in their corresponding chromosomal aberration regions, and analyzed by using the Database for Annotation, Visualization and Integrated Discovery (DAVID). Finally, SVM-T-RFE gene selection algorithm was applied to identify ted genes in CRC. Results: A minimum gene set was obtained with the minimum number [14] of genes, and the highest classification accuracy (100%) in both PRI and META datasets. A fraction of selected genes are associated with CRC or its metastasis. Conclusions- Our results demonstrated that integration analysis is an effective strategy for mining cancer- associated genes. 展开更多
关键词 Colorectal cancer metastasis integrated analysis comparative genomic hybridization (CGH) Significant Analysis of Microarray (SAM) Database for Annotation Visualization and Integrated Discovery(DAVID) svm-t-rfe gene selection algorithm
下载PDF
基于混合进化算法的特征选择方法研究
5
作者 高慧敏 王云鹤 +1 位作者 卞闯 李向涛 《电子学报》 EI CAS CSCD 北大核心 2023年第6期1619-1636,共18页
特征选择(Feature Selection,FS)是一种有效的数据预处理方法,它可以通过选择高维数据中一组具有高相关性和低冗余性的特征,从而解决数据冗余引起的维数灾难.目前许多计算方法已经被应用于求解FS问题,其中基于教与学优化(Teaching and L... 特征选择(Feature Selection,FS)是一种有效的数据预处理方法,它可以通过选择高维数据中一组具有高相关性和低冗余性的特征,从而解决数据冗余引起的维数灾难.目前许多计算方法已经被应用于求解FS问题,其中基于教与学优化(Teaching and Learning-based Optimization Algorithm,TLBO)的特征选择模型由于其高效的全局搜索能力受到越来越多学者的关注.然而,随着数据规模的不断扩大,这些算法所具有的模型不稳定、模型精确度低和局部搜索能力差等局限性,使算法的研究逐步陷入困境.为解决上述问题,本文提出了融合教与学优化算法与局部搜索方法(Local Search,LS)的混合进化Wrapper算法模型(Teaching and Learning-based Optimization-Local Search Algorithm,TLBOLS).首先,由于传统的教与学优化算法不能直接用于求解特征选择问题,算法在初始化阶段将实数型编码转为二进制编码,然后为保证种群的多样性,在教阶段引入最差个体重启机制,并针对进化班级过程中学习者与教学者两种身份采用不同值的TF值,提出二进制的教与学特征选择算法(Binary Teaching and Learning-based Optimization-Local Search Algorithm,BTLBOLS).随后,提出结合多操作的局部搜索方法和变邻域搜索逐渐增强扰动力度,提高整个种群的个体质量.为优化特征选择结果,BTLBOLS利用综合评价指标作为目标函数指导整体进化过程.实验选取45个高维癌症基因表达数据集进行测试并与十种特征选择算法相比,实验结果表明,相比其他算法,BTLBOLS在分类准确率和特征个数上都具有一定优势,算法分类性能有效提高. 展开更多
关键词 教与学优化算法 局部搜索 新型Wrapper混合特征选择算法 特征选择 分类 基因表达数据
下载PDF
基于基因改进烟花算法求解TSP问题
6
作者 刘奇鑫 《科学技术创新》 2023年第7期91-94,共4页
本文提出基因片段选取连接策略提高算法精度并提高算法效率。经过对TSPLIB库中的多个数据进行仿真对比实验,计算结果验证了改进的烟花算法性能。
关键词 TSP 烟花算法 基因片段提取 遗传算法 适应度函数
下载PDF
一种基于互信息最大化的模型无关基因选择方法 被引量:7
7
作者 魏莎莎 陆慧娟 +2 位作者 安春霖 郑恩辉 金伟 《计算机科学》 CSCD 北大核心 2014年第9期243-247,共5页
针对大规模基因芯片高维度的基因表达数据存在大量无关和冗余特征可能降低分类器性能的问题,提出了一种基于互信息最大化方法(MMI)和与遗传算法的模型无关的基因选择方法来将特征选择转化为全局优化问题,其中的适应度函数定义为类间距... 针对大规模基因芯片高维度的基因表达数据存在大量无关和冗余特征可能降低分类器性能的问题,提出了一种基于互信息最大化方法(MMI)和与遗传算法的模型无关的基因选择方法来将特征选择转化为全局优化问题,其中的适应度函数定义为类间距离与类内距离之比,适应程度高。为了评价算法的性能,采用3个数据集进行了实验,结果表明MMIGA-Selection取得了较好的效果,在每个数据集上获得了较高的5折交叉验证正确率。MMIGA-Selection主要有两个优点:一是可以有效减少冗余基因;二是模型无关性,选择得出的特征子集可直接用于其他类型的分类器,分类精度较高。 展开更多
关键词 互信息最大化 模型无关 遗传算法 基因选择
下载PDF
基于蚁群算法和免疫算法融合的TSP问题求解 被引量:10
8
作者 吴建辉 章兢 刘朝华 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第10期81-87,共7页
利用蚁群算法和免疫克隆选择算法的各自优势提出了一种新的融合优化方法:结合抗体小窗口局部搜索算法的蚁群和克隆选择融合算法(Aca—Csa—s Algorithm,简称ACLA).在蚁群算法中引入混沌扰动能在一定程度上避免早熟、停滞;克隆扩增、免... 利用蚁群算法和免疫克隆选择算法的各自优势提出了一种新的融合优化方法:结合抗体小窗口局部搜索算法的蚁群和克隆选择融合算法(Aca—Csa—s Algorithm,简称ACLA).在蚁群算法中引入混沌扰动能在一定程度上避免早熟、停滞;克隆扩增、免疫基因等算子的操作能加快克隆选择算法的收敛速度;局部搜索策略的应用,也有效提高了ACLA算法搜索效率.针对TSP实验结果表明,该算法在收敛速度与求解精度上均取得了较好的效果. 展开更多
关键词 蚁群算法 克隆选择 局部搜索 免疫基因 TSP问题
下载PDF
基于优化的邻域粗糙集的混合基因选择算法 被引量:7
9
作者 陈涛 洪增林 邓方安 《计算机科学》 CSCD 北大核心 2014年第10期291-294,316,共5页
DNA微阵列技术可以同时检测细胞内成千上万的基因的活性,被广泛应用于重大基因疾病的临床诊断。然而微阵列数据通常具有高维小样本特点,且存在大量噪声和冗余基因。为了进一步提高微阵列数据分类性能,提出一种特征基因混合选择算法。首... DNA微阵列技术可以同时检测细胞内成千上万的基因的活性,被广泛应用于重大基因疾病的临床诊断。然而微阵列数据通常具有高维小样本特点,且存在大量噪声和冗余基因。为了进一步提高微阵列数据分类性能,提出一种特征基因混合选择算法。首先采用ReliefF算法剔除大量无关基因,获得特征基因候选子集;然后采用基于差分进化算法优化的邻域粗糙集模型实现特征基因选择;最后利用支持向量机进行分类,以验证算法的有效性。仿真实验结果表明,该算法能用尽可能少的特征基因来获得更高的分类精度,既增强了算法的泛化性能,又提高了时间效率,而且对致病基因的临床诊断有着重要的参考意义。 展开更多
关键词 特征基因选择 RELIEFF算法 邻域粗糙集模型 差分进化算法
下载PDF
基于统计相关性与K-means的区分基因子集选择算法 被引量:56
10
作者 谢娟英 高红超 《软件学报》 EI CSCD 北大核心 2014年第9期2050-2075,共26页
针对高维小样本癌症基因数据集的有效区分基因子集选择难题,提出基于统计相关性和K-means的新颖混合基因选择算法实现有效区分基因子集选择.算法首先采用Pearson相关系数和Wilcoxon秩和检验计算各基因与类标的相关性,根据统计相关性原... 针对高维小样本癌症基因数据集的有效区分基因子集选择难题,提出基于统计相关性和K-means的新颖混合基因选择算法实现有效区分基因子集选择.算法首先采用Pearson相关系数和Wilcoxon秩和检验计算各基因与类标的相关性,根据统计相关性原则选取与类标相关性较大的若干基因构成预选择基因子集;然后,采用K-means算法将预选择基因子集中高度相关的基因聚集到同一类簇,训练SVM分类模型,计算每一个基因的权重,从每一类簇选择一个权重最大或者采用轮盘赌思想从每一类簇选择一个得票数最多的基因作为本类簇的代表基因,各类簇的代表基因构成有效区分基因子集.将该算法与采用随机策略选择各类簇代表基因的随机基因选择算法Random,Guyon的经典基因选择算法SVM-RFE、采用顺序前向搜索策略的基因选择算法SVM-SFS进行实验比较,几个经典基因数据集上的200次重复实验的平均实验结果表明:所提出的混合基因选择算法能够选择到区分性能非常好的基因子集,建立在该区分基因子集上的分类器具有非常好的分类性能. 展开更多
关键词 区分基因子集选择 Pearson 相关系数 Wilcoxon 秩和检验 K-MEANS 聚类 统计相关性 FILTER 算法 Wrapper算法
下载PDF
基于单亲遗传模拟退火算法的顶点p-中心问题 被引量:4
11
作者 蒋建林 徐进澎 文杰 《系统工程学报》 CSCD 北大核心 2011年第3期414-420,共7页
针对顶点p-中心问题这一经典的离散选址NP困难问题提出了一种单亲遗传和模拟退火的混合算法,该算法:1)采用单亲遗传算法简化遗传操作过程;2)加入模拟退火策略,增强局部优化能力;3)提出自适应选择法,根据个体的优劣及算法迭代情况来选择... 针对顶点p-中心问题这一经典的离散选址NP困难问题提出了一种单亲遗传和模拟退火的混合算法,该算法:1)采用单亲遗传算法简化遗传操作过程;2)加入模拟退火策略,增强局部优化能力;3)提出自适应选择法,根据个体的优劣及算法迭代情况来选择个体;4)设计了自适应基因重组操作;5)采取最优保存策略,避免最优解的丢失.数值实验结果表明了该算法对于解决规模较大的顶点p-中心问题的有效性. 展开更多
关键词 顶点p-中心问题 单亲遗传算法 模拟退火算法 自适应基因重组 自适应选择 混合算法
下载PDF
内嵌多准则的遗传算法用于尿沉渣红白细胞的特征选择 被引量:2
12
作者 李勇明 周頔 +1 位作者 曾孝平 韩庆文 《系统仿真学报》 EI CAS CSCD 北大核心 2008年第14期3853-3857,3863,共6页
针对尿沉渣检测中红白细胞的特征选择问题,提出了结合双向选择的内嵌多准则的改进遗传算法(NMGA)(通过多代进化逐步选中优良特征,在每一代进化中基于多种评价准则进行遗传,分别得出各自的最佳特征子集,然后对其进行"多票投选"... 针对尿沉渣检测中红白细胞的特征选择问题,提出了结合双向选择的内嵌多准则的改进遗传算法(NMGA)(通过多代进化逐步选中优良特征,在每一代进化中基于多种评价准则进行遗传,分别得出各自的最佳特征子集,然后对其进行"多票投选",得出一个最佳特征子集,然后继续下一代进化,该方法可结合小生境技术共同搜索最佳特征子集。文末采用多个尿沉渣红细胞和白细胞样本进行验证实验,实验结果表明,算法优选的特征集与未进行特征选择和经过普通遗传算法(SGA)特征选择得到的特征集相比,识别率较高,并且优选后的特征子集的特征数较少,明显降低了分类器的维数复杂度。 展开更多
关键词 双向选择法 基因位锁定 多准则 特征选择 遗传算法 BP神经网络
下载PDF
改进的克隆选择算法与SPEA相结合的进化算法 被引量:1
13
作者 杨观赐 马鑫 +2 位作者 李少波 钟勇 于丽娅 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2011年第5期109-113,共5页
为了使进化过程中子代的繁殖能够像生物繁殖那样继承进化信息,通过挖掘抗体中优秀决定基并生成记忆集、增加高斯变异、用变异抗体群中亲和度高的抗体按概率替换记忆抗体群中低亲和度抗体等策略,提出了一种改进的克隆选择算法(ICSA)。将I... 为了使进化过程中子代的繁殖能够像生物繁殖那样继承进化信息,通过挖掘抗体中优秀决定基并生成记忆集、增加高斯变异、用变异抗体群中亲和度高的抗体按概率替换记忆抗体群中低亲和度抗体等策略,提出了一种改进的克隆选择算法(ICSA)。将ICSA与SPEA相结合,形成了一种改进的克隆选择算法与强度Pareto进化算法相结合的新型的进化算法(ICSA-SPEA)。ICSA-SPEA通过克隆选择替代选择、交叉、重组等遗传操作。用一组多目标0/1背包问题测试算法性能的统计结果表明,改进的算法可以有效保持种群多样性,具有良好的收敛精度与准确度。 展开更多
关键词 多目标优化 进化算法 克隆选择 基因挖掘 遗传信息
下载PDF
基于基因算法的信息免疫模型 被引量:2
14
作者 马玉春 宋瀚涛 《北京理工大学学报》 EI CAS CSCD 北大核心 2004年第12期1084-1087,共4页
研究Web信息过载的问题,提出一种新的基于基因算法的信息免疫模型(IIM).根据免疫细胞的特异性,利用IIM不同的染色体描述用户需求,并专注于对无关信息的处理,使用户免于该类信息的入侵,并引入了特征选择和信息熵,阈值的选择也是可变的.... 研究Web信息过载的问题,提出一种新的基于基因算法的信息免疫模型(IIM).根据免疫细胞的特异性,利用IIM不同的染色体描述用户需求,并专注于对无关信息的处理,使用户免于该类信息的入侵,并引入了特征选择和信息熵,阈值的选择也是可变的.通过实验与Rocchio方法进行了对比,结果表明,IIM的查准率比Rocchio的高27.5%,查全率比Rocchio的高47.7%. 展开更多
关键词 信息免疫 基因算法 特征选择 阈值
下载PDF
搜索空间逐步缩小的遗传算法用于尿沉渣图像特征选择的研究 被引量:1
15
作者 李勇明 曾孝平 +3 位作者 蒋阳 王毅 曾浩 赵德春 《中国生物医学工程学报》 CAS CSCD 北大核心 2008年第6期842-847,859,共7页
基于尿沉渣图像特征选择问题,提出一种新的特征优选方法,首先引入类空间分层分类思想,将多类成分特征集优选问题转化为两类成分的特征集优选问题以减少特征数,从而减少了后续分类器的维数复杂度并提高了优选后的特征集对成分的识别率;... 基于尿沉渣图像特征选择问题,提出一种新的特征优选方法,首先引入类空间分层分类思想,将多类成分特征集优选问题转化为两类成分的特征集优选问题以减少特征数,从而减少了后续分类器的维数复杂度并提高了优选后的特征集对成分的识别率;针对红细胞和白细胞的特征集优选问题,采用改进的遗传算法进行处理,先根据统计实验结果,锁定待选特征集中形态特征和纹理特征相应的两个可分度最大且相互独立的特征,然后使用基因位逐步锁定技术,结合小生境技术和自适应交叉变异算子,提高了遗传算法的搜索性能;最后,为了提高特征集的优选效果和稳定性,引入"多票投选"机制。就多个尿沉渣成分样本进行验证实验,结果表明,该算法优选的特征集与通过其他方式获得的特征集相比,识别率较高,而且明显减少了后续分类器的维数复杂度。 展开更多
关键词 尿沉渣 基因位锁定 特征选择 遗传算法 分层分类
下载PDF
基于实例基因库与遗传算法的高层结构智能选型知识发现 被引量:3
16
作者 张世海 欧进萍 王光远 《工程力学》 EI CSCD 北大核心 2006年第1期87-92,共6页
首先,给出了将工程实例库转化为结构选型规则库与实例基因库的方法,建立了实例空间、规则空间、基因空间及三者间的相互转换关系,实现了从实例到选型规则与基因间的转换;其次,给出了从实例基因库与基因空间中发现结构型式判别规则知识... 首先,给出了将工程实例库转化为结构选型规则库与实例基因库的方法,建立了实例空间、规则空间、基因空间及三者间的相互转换关系,实现了从实例到选型规则与基因间的转换;其次,给出了从实例基因库与基因空间中发现结构型式判别规则知识库的策略,提出了基因向量与正反实例基因库间的相似性度量方法,建立了基于实例基因库与实数码遗传算法的结构选型知识库发现过程与方法;最后,编制了基于实例基因库与遗传算法的知识发现程序,给出了所获取的钢筋混凝土结构型式产生知识。实践证明,该方法可有效自动地从实例基因库中获取结构型式产生的规则性知识库,为开采工程实例“富矿”、解决知识获取“瓶颈”、提高结构选型质量与效率等提供了新的途径与方法。 展开更多
关键词 高层结构 智能选型 实例基因库 知识发现 遗传算法
下载PDF
基于GEP的最小二乘支持向量机模型参数选择 被引量:6
17
作者 钱晓山 阳春华 《智能系统学报》 北大核心 2012年第3期225-229,共5页
针对最小二乘支持向量机的多参数寻优问题,提出了一种基于基因表达式编程的最小二乘支持向量机参数优选方法.该算法将最小二乘支持向量机参数(C,σ)样本作为GEP的基因,按其变异算子随着进化代数和染色体所含基因数目动态变化的机制执行... 针对最小二乘支持向量机的多参数寻优问题,提出了一种基于基因表达式编程的最小二乘支持向量机参数优选方法.该算法将最小二乘支持向量机参数(C,σ)样本作为GEP的基因,按其变异算子随着进化代数和染色体所含基因数目动态变化的机制执行,其收敛速度和精确度大大提高.并与基于粒子群算法和遗传算法参数优选方法比较,通过标准测试函数验证了该算法的拟合误差最低.最后用其建立氧化铝生产蒸发过程参数预测模型,应用工业生产数据进行验证,实验结果表明该方法有效且获得了满意的效果. 展开更多
关键词 基因表达式编程 最小二乘支持向量机 参数选择 粒子群算法 遗传算法
下载PDF
基于遗传算法和支持向量机的肿瘤分子分类 被引量:5
18
作者 何爱香 朱云华 安凯 《数据采集与处理》 CSCD 北大核心 2007年第1期84-89,共6页
提出了一种基于遗传算法(GA)和支持向量机(SVM)的用于肿瘤分子分类和特征基因选择的新方法。该方法针对基因表达数据样本少维数高的特点,先根据基因的散乱度滤掉大量分类无关基因,而后使用相关性分析去除分类冗余基因,得到一个候选基因... 提出了一种基于遗传算法(GA)和支持向量机(SVM)的用于肿瘤分子分类和特征基因选择的新方法。该方法针对基因表达数据样本少维数高的特点,先根据基因的散乱度滤掉大量分类无关基因,而后使用相关性分析去除分类冗余基因,得到一个候选基因子集,用遗传算法搜索候选特征基因空间,发现在支持向量机分类器上具有好的分类性能的且含基因个数较少的特征子集。把这种GA/SVM方法应用到结肠癌和急性白血病基因表达谱,能选出多个取得较高分类精度的较小基因子集,实验结果表明了该方法的有效性。 展开更多
关键词 遗传算法 支持向量机 特征选取 基因表达谱
下载PDF
肿瘤特征基因选择的互信息最值过滤原则与粒子群优化算法 被引量:3
19
作者 喻德旷 杨谊 《计算机应用》 CSCD 北大核心 2018年第2期421-426,432,共7页
基因数据小样本、高维数、高冗余的特点常导致特征基因选择出现"维数灾难"和"过拟合",针对这一问题,提出一种特征基因提取算法——互信息最值过滤原则-惯性权重粒子群优化(MIMVFC-IWPSO)算法。首先,借鉴过滤法的思... 基因数据小样本、高维数、高冗余的特点常导致特征基因选择出现"维数灾难"和"过拟合",针对这一问题,提出一种特征基因提取算法——互信息最值过滤原则-惯性权重粒子群优化(MIMVFC-IWPSO)算法。首先,借鉴过滤法的思路,通过计算互信息指标,依据互信息最值过滤原则(MIMVFC)获得特征基因候选子集(FGCS),缩小分类操作的范围,提高特征基因被覆盖的概率;接着,对粒子群优化(PSO)算法进行改进,引入惯性权重实现自调节可变惯性权重粒子群优化(IWPSO)算法,使得在算法迭代初期有着快速的全局优化能力,而在算法后期具有较强的局部搜索能力;最后,运用IWPSO从FGCS中提取核心信息基因子集(CFGS),并基于CFGS对样本进行肿瘤与正常组织的分类。采用3个公开的肿瘤基因表达谱数据进行实验,MIMVFC正确分类率优于信噪比(SNR)、t-检验和信息增益(IG)方法,与卡方统计值(Chi-Square)方法接近,而MIMVFC还能利用IWPSO进一步优化结果。基于相同的FGCS,与目前效果较好的二进制粒子群优化与防治基因算法(BPSO-CGA)相比,IWPSO的运算耗时有所增加,但所获得的CFGS规模减小,准确率提高;而与经典PSO相比,所获得的CFGS规模减小、运算耗时减少、准确率提高。实验结果表明MIMVFC-IWPSO具有较好的综合分类性能,能有效提高准确率和效率,可用于多种肿瘤的特征基因选择,辅助指导分子生物学实验设计和验证。 展开更多
关键词 肿瘤特征基因选择 互信息最值过滤原则 粒子群优化算法 特征基因候选子集 核心信息基因子集
下载PDF
基于FCBF特征选择和集成优化学习的基因表达数据分类算法 被引量:6
20
作者 马超 《计算机应用研究》 CSCD 北大核心 2019年第10期2986-2991,共6页
针对微阵列基因表达数据高维小样本、高冗余且高噪声的问题,提出一种基于FCBF特征选择和集成优化学习的分类算法FICS-EKELM。首先使用快速关联过滤方法FCBF滤除部分不相关特征和噪声,找出与类别相关性较高的特征集合;其次,运用抽样技术... 针对微阵列基因表达数据高维小样本、高冗余且高噪声的问题,提出一种基于FCBF特征选择和集成优化学习的分类算法FICS-EKELM。首先使用快速关联过滤方法FCBF滤除部分不相关特征和噪声,找出与类别相关性较高的特征集合;其次,运用抽样技术生成多个样本子集,在每个训练子集上利用改进乌鸦搜索算法同步实现最优特征子集选择和核极限学习机KELM分类器参数优化;然后基于基分类器构建集成分类模型对目标数据进行分类识别;此外运用多核平台多线程并行方式进一步提高算法计算效率。在六组基因数据集上的实验结果表明,该算法不仅能用较少特征基因达到较优的分类效果,并且分类结果显著高于已有和相似方法,是一种有效的高维数据分类方法。 展开更多
关键词 特征选择 集成学习 微阵列基因表达数据 乌鸦搜索算法 核极限学习机
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部