期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
适于癌基因表达数据集的新特征提取标准NFEC及其分类新算法研究 被引量:3
1
作者 邓赵红 王士同 胡德文 《生物信息学》 2004年第2期13-20,共8页
癌基因表达数据集具有小样本、高维数之特点,一般的机器学习机难以对其有效分类。因此,通常需要采用某些特征提取度量标准来进行降维处理。可是常用的一些特征提取度量标准亦会导致分类效果欠佳之问题。依据微分容量控制学习机DCCM,提... 癌基因表达数据集具有小样本、高维数之特点,一般的机器学习机难以对其有效分类。因此,通常需要采用某些特征提取度量标准来进行降维处理。可是常用的一些特征提取度量标准亦会导致分类效果欠佳之问题。依据微分容量控制学习机DCCM,提出了一个新的特征提取度量标准NFEC,然后依据NFEC和DCCM,提出了适于癌基因表达数据集的特征提取算法DCCFE。实验表明,新的度量NFEC和新的特征提取算法DCCFE较之现有方法对癌基因表达数据集分类时更为有效。本文的工作意义在于:(1)提出了一个新的更有意义的特征提取度量标准;(2)DCCM可以采用比核函数更为一般的一阶可微函数,因而提出的新的特征提取算法更具普遍应用意义。 展开更多
关键词 生物信息学 微分容量控制 特征提取 基因表达数据集 分类
下载PDF
fGn模型在结肠癌基因表达数据集去噪中的应用
2
作者 艾玲梅 李科 马苗 《计算机工程》 CAS CSCD 北大核心 2015年第11期303-307,共5页
基因表达数据集获取过程中容易掺杂噪声成分,噪声会干扰数据的正确表达从而影响其后期的分析与研究。基于中值计算法估计噪声标准差的经验模态分解(EMD)去噪存在一定的不足,从而影响去噪效果。分数阶高斯噪声(fGn)模型可提供EMD下较为... 基因表达数据集获取过程中容易掺杂噪声成分,噪声会干扰数据的正确表达从而影响其后期的分析与研究。基于中值计算法估计噪声标准差的经验模态分解(EMD)去噪存在一定的不足,从而影响去噪效果。分数阶高斯噪声(fGn)模型可提供EMD下较为准确的噪声标准差估计方法,在该模型下去噪可减少白色及有色噪声,进而增强去噪效果。因此在中值计算EMD去噪基础上,提出一种基于fGn模型的去噪方案,并对结肠癌基因表达数据集做去噪分析。实验结果表明,相比中值计算EMD去噪方法,改进方法的信噪比、噪声抑制比、t检验等值具有一定的优势,可作为基因表达数据集去噪的一种参考方案。 展开更多
关键词 基因表达数据集 经验模态分解去噪 噪声标准差 分数阶高斯噪声 结肠癌
下载PDF
高维基因表达数据集分类规则组的确定
3
作者 索文莉 李长国 《天津理工大学学报》 2013年第6期41-45,共5页
目前基因表达数据分析的大多数算法都是探索性的选择基因来生成识别类(例如癌细胞组织与正常细胞组织)的规则组,对此本文提出了一种对基因表达数据集进行分类的稳健算法,确保可以找到最优的k个基因生成分类的规则组,并且通过试验表明由... 目前基因表达数据分析的大多数算法都是探索性的选择基因来生成识别类(例如癌细胞组织与正常细胞组织)的规则组,对此本文提出了一种对基因表达数据集进行分类的稳健算法,确保可以找到最优的k个基因生成分类的规则组,并且通过试验表明由此算法得出的规则组比其他分类方法更准确. 展开更多
关键词 基因表达数据集 稳健 分类
下载PDF
基于模糊粗糙集的肿瘤分类特征基因选取 被引量:11
4
作者 徐菲菲 苗夺谦 魏莱 《计算机科学》 CSCD 北大核心 2009年第3期196-200,共5页
依据基因表达谱有效建立肿瘤分类模型的关键在于,准确找出决定样本类别的一组特征基因。粗糙集理论作为一种新的软计算方法能够保持在原数据集的分类能力不变的基础上,对属性极大约简,从大量基因中找到对分类有效的基因。由于基因表达... 依据基因表达谱有效建立肿瘤分类模型的关键在于,准确找出决定样本类别的一组特征基因。粗糙集理论作为一种新的软计算方法能够保持在原数据集的分类能力不变的基础上,对属性极大约简,从大量基因中找到对分类有效的基因。由于基因表达谱数据集的连续性,为了避免运用粗糙集方法所必需的离散化过程带来的信息丢失,尝试将模糊粗糙集应用于特征基因的选取,提出了基于互信息的模糊粗糙集属性约简算法,运用于基因表达谱数据集的基因选取。然后分别采用KNN和C5.0分类器进行特征基因分类性能进行检验。以急性白血病亚型(leukemia Microarray)和直肠癌(colon Microarray)分类特征基因选取为例进行实验,结果表明了上述方法的可行性和有效性。 展开更多
关键词 基因表达数据 特征选取 粗糙 模糊粗糙 互信息
下载PDF
基于GEO数据库生物信息学方法分析子宫内膜癌相关基因和候选通路 被引量:4
5
作者 王治 洪莉 +1 位作者 李素廷 曾婉玲 《吉林大学学报(医学版)》 CAS CSCD 北大核心 2020年第4期804-809,I0006,共7页
目的:通过生物信息学方法分析与子宫内膜癌(EC)发生发展相关的关键基因和候选通路,探讨EC的发病机制和治疗靶点。方法:自公共基因芯片数据库(GEO)下载EC芯片数据集GSE17025和GSE63678,使用GEO2R在线分析工具和R软件筛选EC癌组织与癌旁... 目的:通过生物信息学方法分析与子宫内膜癌(EC)发生发展相关的关键基因和候选通路,探讨EC的发病机制和治疗靶点。方法:自公共基因芯片数据库(GEO)下载EC芯片数据集GSE17025和GSE63678,使用GEO2R在线分析工具和R软件筛选EC癌组织与癌旁组织的差异表达基因(DEGs),并对DEGs进行基因本体论(GO)富集分析和京都基因与基因组百科全书(KEGG)信号通路分析,采用String数据库进行蛋白质-蛋白质互作网络(PPI)分析,最后采用Cytoscape软件对PPI网络进行可视化并进行模块分析。结果:对芯片数据集GSE17025和GSE63678进行DEGs分析后共获取100个共同上调基因和106个共同下调基因。GO富集分析DEGs主要富集于有丝分裂染色体分离、核分裂和细胞器分裂等生物学过程;KEGG信号通路分析DEGs主要富集于细胞周期、miRNA、p53信号通路和2型糖尿病等信号通路。通过Cytoscape软件分析,PPI网络中细胞分裂周期基因20(CDC20)、极光激酶A(AURKA)、细胞周期蛋白B1(CCNB1)、泛素E3连接酶(DTL)、中心体相关蛋白55(CEP55)、细胞周期蛋白依赖性激酶1(CDK1)、驱动蛋白家族成员11(KIF11)、母体胚胎亮氨酸拉链激酶(MELK)、细胞周期蛋白B2(CCNB2)和苯并咪唑出芽抑制解除同源物蛋白1(BUB1)被筛选为关键基因。结论:细胞周期相关基因与通路调控网络的失调可能是EC发病的主要机制。 展开更多
关键词 生物信息学 子宫内膜癌 差异基因 基因表达汇编芯片数据
下载PDF
基于数据库分析自噬相关基因与卵巢癌不良预后的关系
6
作者 王微微 季瑞 何爱琴 《诊断病理学杂志》 2023年第3期308-312,共5页
基于数据库分析自噬相关的基因与卵巢癌(ovarian cancer,OC)不良预后的关系。通过GEO数据库GSE54388数据集筛选OC中的差异基因,GO数据库分析确认其中与自噬相关的基因,对其进行PPI、KEGG分析,并通过在线数据库确认与OC预后的关系。GSE5... 基于数据库分析自噬相关的基因与卵巢癌(ovarian cancer,OC)不良预后的关系。通过GEO数据库GSE54388数据集筛选OC中的差异基因,GO数据库分析确认其中与自噬相关的基因,对其进行PPI、KEGG分析,并通过在线数据库确认与OC预后的关系。GSE5438数据集中有910个基因在卵巢癌中存在异常表达,GO分析结果显示其中共计13个基因与自噬相关,分别为CHMP4C、PTK2、LAMP3、HK2、ERN1、DCN、S100A8、SNCA、LGALS8、DAPK1、SYNPO2、GATA4、KDR。差异表达的自噬相关基因的GO和KEGG富集分析显示出与自噬、线粒体自噬相关的几个富集术语。在GEPIA数据库中,PTK2、HK2、S100A8和KDR在OC中无差异表达(P>0.05),而CHMP4C、LAMP3呈高表达(P<0.05),ERN1、DCN、SNCA、LGALS8、DAPK1、SYNPO2、GATA4呈低表达(P<0.05)。此外,高表达DAPK1的OC患者预后总生存率明显降低,这也提示DAPK1与OC的不良预后有关。通过生物学信息分析发现在OC中存在13个有差异表达的自噬相关基因,其中DAPK1与OC的不良预后有关,对于未来OC的诊治具有一定的应用价值。 展开更多
关键词 生物学信息分析 自噬 卵巢癌 基因表达综合数据 不良预后
下载PDF
一种基于互信息的模糊粗糙分类特征基因快速选取方法 被引量:6
7
作者 徐菲菲 魏莱 +1 位作者 杜海洲 王文欢 《计算机科学》 CSCD 北大核心 2013年第7期216-221,235,共7页
依据基因表达谱建立有效肿瘤分类模型的关键在于准确找出决定样本类别的一组特征基因。粗糙集理论已成功应用于肿瘤分类特征基因选取中。然而,粗糙集方法处理连续值的基因表达谱数据集所必需的离散化过程会使得部分信息丢失,对所选取的... 依据基因表达谱建立有效肿瘤分类模型的关键在于准确找出决定样本类别的一组特征基因。粗糙集理论已成功应用于肿瘤分类特征基因选取中。然而,粗糙集方法处理连续值的基因表达谱数据集所必需的离散化过程会使得部分信息丢失,对所选取的特征基因的分类精度造成一定影响。因此,曾提出基于互信息的模糊粗糙集基因表达谱数据集特征基因的选取算法。然而,该算法计算代价较高,当所选取的基因数较多时难以实现。为此,对该算法进行了改进,从最大相关性和最重要性(最小冗余)两方面对互信息进行了近似替代计算,大大降低了算法的复杂度,提高了算法的效率。以急性白血病亚型(leukemia)、直肠癌(colon)和乳腺癌(Breast)分类特征基因选取为例进行实验,然后分别采用1NN和SVM分类器进行特征基因分类精度检验,结果证实了新方法的可行性和有效性。 展开更多
关键词 特征选取 模糊粗糙 互信息 基因表达数据
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部