期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
肿瘤基因选择方法LLE Score 被引量:7
1
作者 李建更 逄泽楠 +1 位作者 苏磊 陈思远 《北京工业大学学报》 CAS CSCD 北大核心 2015年第8期1145-1150,共6页
针对处理肿瘤基因表达数据特征选择问题,提出了一种特征选择方法 LLE Score.该方法是典型的过滤器类型特征选择方法,在样本类别信息的基础上,LLE Score针对特征向量的局部邻域保存能力进行评价,并且根据评价结果进行特征的选取,以此达... 针对处理肿瘤基因表达数据特征选择问题,提出了一种特征选择方法 LLE Score.该方法是典型的过滤器类型特征选择方法,在样本类别信息的基础上,LLE Score针对特征向量的局部邻域保存能力进行评价,并且根据评价结果进行特征的选取,以此达到良好的特征选择效果.在实验部分对肿瘤数据集进行特征选择,并采用支持向量机分类器计算分类准确率.通过分类准确率说明了该方法的有效性. 展开更多
关键词 LLE SCORE 特征选择 肿瘤基因表达数据
下载PDF
从肿瘤基因表达数据挖掘分类规则的研究 被引量:1
2
作者 马猛 汝颖 +3 位作者 马腾 钮俊清 李龙澍 王煦法 《中国生物医学工程学报》 CAS CSCD 北大核心 2009年第5期707-712,共6页
基于肿瘤基因表达数据,利用信息科学的方法和技术建立肿瘤预测分类模型,对肿瘤基因表达模式研究和肿瘤的诊断识别具有重要意义。本研究提出一种从肿瘤基因表达数据中直接挖掘分类规则建立肿瘤预测分类器的方法。该方法首先抽取实验样本... 基于肿瘤基因表达数据,利用信息科学的方法和技术建立肿瘤预测分类模型,对肿瘤基因表达模式研究和肿瘤的诊断识别具有重要意义。本研究提出一种从肿瘤基因表达数据中直接挖掘分类规则建立肿瘤预测分类器的方法。该方法首先抽取实验样本集,分别找出标记肿瘤和正常组织样本的分类特征,由此生成可预测样本类别的分类规则,对每个未知类别样本,按照置信度最高原则,选择一个分类规则作为预测结构。本研究的实验数据来自Broad Institute的前列腺癌基因表达数据,实验结果显示该方法的预测精度在90%以上,且同时获得了大量结构透明的分类预测规则,表明本研究的方法是可行的和有效的。 展开更多
关键词 肿瘤 基因表达 数据挖掘 特征选取 分类规则
下载PDF
两种基于偏最小二乘法的分类模型对肿瘤基因表达数据行多分类的比较研究 被引量:4
3
作者 金志超 陆健 +3 位作者 吴骋 高青斌 孙亚林 贺佳 《中国卫生统计》 CSCD 北大核心 2009年第5期450-454,458,共6页
目的比较两种基于偏最小二乘法的分类模型对肿瘤基因表达数据行多分类分析的效果,比较不同差异基因选取方法对分类结果的影响。方法利用NCI60等4个肿瘤基因表达数据库,通过4种不同方法选取差异表达基因,在此基础上,用两种基于偏最小二... 目的比较两种基于偏最小二乘法的分类模型对肿瘤基因表达数据行多分类分析的效果,比较不同差异基因选取方法对分类结果的影响。方法利用NCI60等4个肿瘤基因表达数据库,通过4种不同方法选取差异表达基因,在此基础上,用两种基于偏最小二乘的方法行多分类分析。一是偏最小二乘线性判别,首先运用偏最小二乘法行降维,再利用降维得到的成分作为输入变量作线性判别分析;二是偏最小二乘判别分析,利用偏最小二乘回归直接进行分类。分类效果采用留一法和10倍交叉验证法进行评价。结果偏最小二乘判别分析的分类效果略优于偏最小二乘降维后的线性判别。以变量重要性指标选取差异表达基因时分类效果较好,其次是SAM法。结论在对肿瘤基因表达数据行多分类分析时,偏最小二乘法既是一种高效的降维方法,也是一种实用的分类方法。 展开更多
关键词 肿瘤基因表达数据 偏最小二乘法 多分类
下载PDF
基于加权极限学习机的肿瘤基因表达谱数据分类 被引量:4
4
作者 姜琳颖 余东海 石鑫 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第6期798-803,共6页
基因表达谱数据一般来源于临床试验,而在临床试验中,试验样本的类分布情况是不确定的,这就使得表达谱数据往往具有比较明显的不平衡性.采用加权极限学习机来对不平衡基因表达谱数据进行分类,为了减少因为不平衡数据引起的分类误差,一个... 基因表达谱数据一般来源于临床试验,而在临床试验中,试验样本的类分布情况是不确定的,这就使得表达谱数据往往具有比较明显的不平衡性.采用加权极限学习机来对不平衡基因表达谱数据进行分类,为了减少因为不平衡数据引起的分类误差,一个临时的权重被分配给每一个样本以增强少样本类的影响,同时减少多样本类的影响,进而提高肿瘤分类的准确率.实验结果表明,所提方法能够提高少样本类的识别率,从而提高分类器的总体性能. 展开更多
关键词 基因 表达谱数据 加权极限学习机 不平衡性 肿瘤分类
下载PDF
代价敏感特征选择的肿瘤分类应用
5
作者 边婧 彭新光 张海 《计算机工程与设计》 北大核心 2017年第5期1342-1346,1388,共6页
针对肿瘤基因数据高维、小样本的特点,引入误分类代价,基于混沌遗传算法提出一种代价敏感特征选择算法。结合误分类代价矩阵与分类精度,构建基于最近邻的代价敏感特征选择适应度函数,在降低特征选择总成本的同时权衡代价成本与分类精度... 针对肿瘤基因数据高维、小样本的特点,引入误分类代价,基于混沌遗传算法提出一种代价敏感特征选择算法。结合误分类代价矩阵与分类精度,构建基于最近邻的代价敏感特征选择适应度函数,在降低特征选择总成本的同时权衡代价成本与分类精度,采用混沌遗传算法提高搜索效率,提升算法性能。将该方法应用于肿瘤基因数据进行有效性验证,实验结果表明,该算法降低了特征空间维数,有效提高了肿瘤的分类性能。 展开更多
关键词 代价敏学习 特征选择 肿瘤基因数据 混沌遗传算法 分类
下载PDF
基于肿瘤基因表达谱的基因功能模块识别
6
作者 阮晓钢 王金莲 《北京工业大学学报》 CAS CSCD 北大核心 2007年第4期366-371,共6页
为了揭示肿瘤发生发展的分子机制,结合基因功能分类体系数据库(gene ontology,简称GO),采用网络分解算法对结肠癌基因表达谱数据进行了研究.研究结果表明,与结肠正常组织基因模块相比,结肠癌基因模块与细胞周期调节、抗细胞程序性死亡... 为了揭示肿瘤发生发展的分子机制,结合基因功能分类体系数据库(gene ontology,简称GO),采用网络分解算法对结肠癌基因表达谱数据进行了研究.研究结果表明,与结肠正常组织基因模块相比,结肠癌基因模块与细胞周期调节、抗细胞程序性死亡、信号转导、细胞增殖等功能类相关,由此推论结肠癌基因功能模块结构的改变导致了结肠癌的发生. 展开更多
关键词 DNA微阵列数据 肿瘤 基因功能模块 结肠癌
下载PDF
基因芯片表达在乳腺癌转移过程中的聚类分析 被引量:1
7
作者 董骝焕 袁媛 +4 位作者 沈世镒 孙保存 冯玉梅 尼春生 李晓青 《生物数学学报》 CSCD 北大核心 2007年第3期527-532,共6页
利用基因芯片可以得到不同基因在不同生命过程中的表达,因此在医学诊断与病变分析中受到重视,并开始大量应用.经测定发现,不同基因在病变过程的不同阶段中的表达是不相同的,由此可以得到在病变过程的不同基因的表达特征.在本文中,我们... 利用基因芯片可以得到不同基因在不同生命过程中的表达,因此在医学诊断与病变分析中受到重视,并开始大量应用.经测定发现,不同基因在病变过程的不同阶段中的表达是不相同的,由此可以得到在病变过程的不同基因的表达特征.在本文中,我们给出了乳腺癌在转移过程中的基因表达特征的聚类分析法分析,并改进了k-means聚类算法,使之具有自动搜索聚类数的功能,并且有助于改善k-means算法的聚类结果陷入局部最小值的状况.通过对平均聚类误差指标的比较,kr-means要优于k-means算法.本文所得到的结果可供乳腺癌诊断与病变分析参考,同时可以应用于小型基因检测芯片的制备,也可以用于构建基因网络调控图. 展开更多
关键词 聚类分析 乳腺癌基因转移 基因芯片数据表达
下载PDF
TARGET数据库的介绍及数据提取 被引量:5
8
作者 吕敏 田国祥 +3 位作者 郭晓娟 李豹 张军 吕军 《中国循证心血管医学杂志》 2019年第4期387-390,共4页
TARGET数据库是针对儿童肿瘤的数据库,该数据库力图采用综合基因组方法确定难以治疗的儿童期癌症的发生和发展的分子变化,旨在用数据来协助指导开发有效的、毒性较低的疗法。TARGET数据库由NCI’s Office of Cancer Genomics和Cancer Th... TARGET数据库是针对儿童肿瘤的数据库,该数据库力图采用综合基因组方法确定难以治疗的儿童期癌症的发生和发展的分子变化,旨在用数据来协助指导开发有效的、毒性较低的疗法。TARGET数据库由NCI’s Office of Cancer Genomics和Cancer Therapy Evaluation Program管理,因此颇具权威性且有更强的针对性,并通过数据分析生成对研究者有用的药物作用靶点和预后标志物,以便能够开发和应用新的更有效的治疗方案。本文对TARGET数据库进行了详细的介绍并可通过此文获得TARGET数据的下载方法,供研究者对儿童肿瘤进行更加深入的研究,为儿童肿瘤的诊治工作提供更加具有针对性的循证证据。 展开更多
关键词 TARGET 儿童肿瘤 基因 数据
下载PDF
代价敏感分类在肿瘤基因数据集的应用
9
作者 边婧 孔令珠 张海 《山西职工医学院学报》 CAS 2016年第3期76-78,共3页
本文对代价敏感分类算法及传统分类算法进行了比较研究,并应用于小儿白血病肿瘤数据集。针对现实生活中肿瘤基因表达数据高维、不平衡等特点,引入误分类代价因子,改进代价敏感分类算法Meta Cost。通过实验手段分析代价敏感算法的行为及... 本文对代价敏感分类算法及传统分类算法进行了比较研究,并应用于小儿白血病肿瘤数据集。针对现实生活中肿瘤基因表达数据高维、不平衡等特点,引入误分类代价因子,改进代价敏感分类算法Meta Cost。通过实验手段分析代价敏感算法的行为及较之传统分类算法的优势所在,提高了肿瘤基因数据中肿瘤类别数据的识别率及精确度。 展开更多
关键词 代价敏感分类 肿瘤基因表达数据 误分类代价
下载PDF
基于Spark的肿瘤基因混合特征选择方法 被引量:3
10
作者 汪丽丽 邓丽 +1 位作者 余玥 费敏锐 《计算机工程》 CAS CSCD 北大核心 2018年第11期1-6,共6页
为处理随微阵列技术发展而急剧增长的肿瘤基因数据,实现对肿瘤基因数据的特征选择,结合集成特征选择和混合特征选择,提出一种Spark分布式计算框架的混合特征选择方法。利用F-score特征选择方法去除无关特征,进行初步特征选择,结合F-scor... 为处理随微阵列技术发展而急剧增长的肿瘤基因数据,实现对肿瘤基因数据的特征选择,结合集成特征选择和混合特征选择,提出一种Spark分布式计算框架的混合特征选择方法。利用F-score特征选择方法去除无关特征,进行初步特征选择,结合F-score、多分类支持向量机递归消除法、基于随机森林的特征选择3种方法得到最优的特征子集,并采用支持向量机对特征子集进行分类预测。实验结果表明,该方法能通过选择较少的基因达到较高的分类准确率。 展开更多
关键词 肿瘤基因数据 Spark分布式计算框架 混合特征选择 集成特征选择 分类
下载PDF
利用公共数据库挖掘肿瘤关键基因
11
作者 卢娟 郑剑锋 《实验与检验医学》 CAS 2015年第6期711-713,744,共4页
目的利用公共数据库挖掘肝癌发生过程的关键基因,为后续的功能验证奠定基础。方法以肝癌表达谱芯片数据GSE33006为例,采用免费开源的R/Bio Conductor分析工具,介绍基本分析步骤,对肝癌表达谱数据进行分析。结果芯片数据GSE33006中,差异... 目的利用公共数据库挖掘肝癌发生过程的关键基因,为后续的功能验证奠定基础。方法以肝癌表达谱芯片数据GSE33006为例,采用免费开源的R/Bio Conductor分析工具,介绍基本分析步骤,对肝癌表达谱数据进行分析。结果芯片数据GSE33006中,差异表达基因有2134个,同一基因在癌组织和癌旁组织具有不同的表达模式,说明该基因与肝癌相关;同一基因在不同的癌组织表达存在差异,说明肝癌存在异质性。结论在公共数据库中挖掘肿瘤关键基因能为研究者提供生物信息学信息,能减少研究范围。 展开更多
关键词 肿瘤数据库 基因表达 R/BioConductor 数据挖掘
下载PDF
肿瘤微阵列数据统计分析概述
12
作者 张杨 张威 +2 位作者 曹文君 李运明 陈长生 《生物技术通讯》 CAS 2014年第6期875-879,共5页
微阵列技术已广泛应用于生物学和医学研究领域,如肿瘤的诊断和分型、预测和治疗,理解肿瘤的发生机制、生物学通路和基因网络。统计学方法在这一科学挑战中的地位至关重要。我们综述了微阵列实验数据分析的统计学方法最新发展,主要描述... 微阵列技术已广泛应用于生物学和医学研究领域,如肿瘤的诊断和分型、预测和治疗,理解肿瘤的发生机制、生物学通路和基因网络。统计学方法在这一科学挑战中的地位至关重要。我们综述了微阵列实验数据分析的统计学方法最新发展,主要描述了微阵列数据的标准化、差异表达基因的统计学检验及微阵列技术在肿瘤治疗中的应用,重点介绍了时间序列微阵列数据分析方法和基因调控网络在肿瘤研究中的最新发展。 展开更多
关键词 肿瘤 微阵列数据 标准化 差异表达基因 诊断及分型 时间序列 调控网络
下载PDF
基因表达数据分类算法及应用探讨
13
作者 张浩 叶明全 汪楠 《洛阳理工学院学报(自然科学版)》 2014年第3期55-59,共5页
通过机器学习方法辅助分析生物信息学中的数据,使用微阵列测试技术所获得的基因表达数据能够将任何给定条件下的基因表达模式表现出来,有利于研究人员更加深入地对众多生物过程的本质进行了解和掌握。文章对基因功能分类方法和基因表达... 通过机器学习方法辅助分析生物信息学中的数据,使用微阵列测试技术所获得的基因表达数据能够将任何给定条件下的基因表达模式表现出来,有利于研究人员更加深入地对众多生物过程的本质进行了解和掌握。文章对基因功能分类方法和基因表达数据的肿瘤分类进行了分析。对于基因表达数据的基因功能分类,按照功能类的隶属关系,提出基于功能树的优势因子决策和基于功能树的置信度调整准则,按照这两种标准进行基因功能树的基因功能分类算法改进。对于基因表达数据的肿瘤分类,将传统SVM算法和kNN算法两者进行结合,形成一种新型的分类算法,主要适用于肿瘤的分类。 展开更多
关键词 基因表达数据 分类算法 应用 肿瘤分类 功能树
下载PDF
基于GEO数据库的肝细胞癌预后基因挖掘与分析 被引量:1
14
作者 薛伟杰 王一休 +2 位作者 宫之奇 朱呈瞻 牛兆建 《精准医学杂志》 2020年第3期245-249,252,共6页
目的通过生物信息学方法筛选出一组可预测肝细胞癌(HCC)预后的特征性基因,作为预测肝细胞癌预后及指导靶向治疗的关键基因。方法首先从GEO数据库下载基因表达数据集GSE41804、GSE19665和GSE101685,从中筛选出HCC与正常组织差异表达的基... 目的通过生物信息学方法筛选出一组可预测肝细胞癌(HCC)预后的特征性基因,作为预测肝细胞癌预后及指导靶向治疗的关键基因。方法首先从GEO数据库下载基因表达数据集GSE41804、GSE19665和GSE101685,从中筛选出HCC与正常组织差异表达的基因。通过GO功能富集分析和KEGG通路分析对上述差异表达基因进行可视化分析。通过在线网站STRING和Cytoscape 3.6.1软件对差异表达基因构建蛋白互作网络图,获得候选基因。从候选基因中通过Kaplan-Meier在线分析网站筛选出与HCC患者生存密切相关的关键基因,分别建立基于关键基因的HCC预后分析模型,同时把有生存意义的关键基因作为一个联合特征性基因集建立与HCC患者预后关系的生存模型。并通过在线网站GEPIA对关键基因表达量分别进行可视化分析。获取我科确诊为HCC的患者的癌组织和对应的正常组织的实物标本,通过实时定量聚合酶链反应(RT-qPCR)测定关键基因表达量,并与数据库中分析获得的关键基因表达量进行对比。结果将GEO数据库中GSE41804、GSE19665以及GSE1016853个基因表达数据集进行数据筛选后,共得到147个HCC与正常组织差异表达基因,通过GO功能富集分析显示这些基因与对无机物的反应、加单氧酶活化、类固醇氢化酶活化等生物进程明显相关,KEGG通路分析显示,差异表达基因主要通过p53信号通路影响HCC的发生。使用STRING和Cytoscape建立蛋白互作网络图,分析得到FAM83D、CYP2C8、MT1M、SLCO1B3、GYS2、FCN36个候选基因。对候选基因进行Kaplan-Meier预后分析,发现FAM83D、CYP2C8、SLCO1B3、GYS2和FCN3为具有生存意义的5个关键基因,其中CYP2C8高表达患者的总生存期(OS)显著长于低表达的患者,而FAM83D、SLCO1B3、GYS2和FCN3高表达患者的OS显著短于低表达患者。数据库中资料显示正常组织中CYP2C8、FCN3、GYS2及SLCO1B3表达量高于HCC组织,而正常组织中FAM83D表达量低于HCC组织,RT-qPCR检测实物标本中关键基因的表达量,与在数据库中分析获得的关键基因表达量结果一致。结论筛选出了FAM83D、CYP2C8、SLCO1B3、GYS2、FCN35个与HCC预后密切相关的特征性基因,可以作为预测肝细胞癌预后及指导靶向治疗的关键基因。 展开更多
关键词 肝细胞 生物标记 肿瘤 预后 分子靶向治疗 计算生物学 数据库 遗传学 基因表达 数据挖掘
下载PDF
基于人工蜂群和SVM的基因表达数据分类 被引量:8
15
作者 叶明全 高凌云 万春圆 《山东大学学报(工学版)》 CAS 北大核心 2018年第3期10-16,共7页
基因表达数据存在高维、小样本、高噪声等特性,使得相应的肿瘤分类诊断面临着一定的挑战。为了实现更加精确的分类准确率,利用人工蜂群(artificial bee colony,ABC)算法对支持向量机(support vector machine,SVM)的核函数参数和惩罚因... 基因表达数据存在高维、小样本、高噪声等特性,使得相应的肿瘤分类诊断面临着一定的挑战。为了实现更加精确的分类准确率,利用人工蜂群(artificial bee colony,ABC)算法对支持向量机(support vector machine,SVM)的核函数参数和惩罚因子进行优化,采用准确率作为分类模型的适应度函数,提出一种基于ABC和SVM的基因表达数据分类方法 ABC-SVM。在6种公开的肿瘤基因表达数据集上进行试验,并对比分析其他的分类方法。结果表明,在筛选得到的较少信息基因基础上,ABC-SVM可获得更高的肿瘤分类准确率,对肿瘤样本类型进行更有效的分类预测。 展开更多
关键词 人工蜂群 支持向量机 基因表达数据 智能优化 肿瘤分类 生物信息学
原文传递
第五讲 生物医学信息处理——DNA微阵列数据在医学中的应用
16
作者 马尽文 邓明华 《物理》 CAS 北大核心 2005年第5期371-380,共10页
飞速发展的生物信息技术为现代医学提供了更为有效的工具.特别是随着人类基因组计划的基本完成和逐步细化,人们已经试图从基因水平上来认识生命现象,特别是一些重要疾病的机理.由于生物特性一般都涉及到多个基因的共同表达,这便出现了... 飞速发展的生物信息技术为现代医学提供了更为有效的工具.特别是随着人类基因组计划的基本完成和逐步细化,人们已经试图从基因水平上来认识生命现象,特别是一些重要疾病的机理.由于生物特性一般都涉及到多个基因的共同表达,这便出现了同时衡量成千上万个基因的表现水平的所谓DNA微阵列技术与数据.DNA微阵列数据也被称为大规模基因表达谱.根据这些微阵列数据,人们不仅能够对一些疾病进行分析,并且还能够发现一些新的生物特性与规律.另外,利用微阵列数据能够选取出疾病的相关基因并进行疾病的分类与诊断.这项研究无疑将推动医学的发展.最近,人们还进一步通过基因表达水平值来发现基因之间的调控方式,这将为疾病病理的研究与治疗提供更科学的依据. 展开更多
关键词 列数据 信息处理 生物医学 第五讲 DNA微阵列技术 人类基因组计划 应用 生物信息技术 基因表达水平 生物特性 基因表达谱 现代医学 生命现象 相关基因 调控方式 疾病
原文传递
基于数据挖掘分析BUB1基因在肝癌中的表达及临床意义
17
作者 潘丁龙 肖丽华 +1 位作者 廖小文 黄坚候 《中国新药与临床杂志》 CAS CSCD 北大核心 2021年第4期282-287,共6页
目的探讨BUB1基因在肝癌中的表达及临床意义。方法分别检索BioGPS、Oncomine、癌症细胞系百科全书(CCLE)数据库,挖掘分析BUB1基因在正常人体组织、肝癌组织及肝癌细胞系中的表达情况,应用Kaplan-Meier Plotter、GEPIA等数据库分析BUB1... 目的探讨BUB1基因在肝癌中的表达及临床意义。方法分别检索BioGPS、Oncomine、癌症细胞系百科全书(CCLE)数据库,挖掘分析BUB1基因在正常人体组织、肝癌组织及肝癌细胞系中的表达情况,应用Kaplan-Meier Plotter、GEPIA等数据库分析BUB1基因对肝癌患者预后的影响。结果BioGPS数据库分析结果显示BUB1基因在人体各组织中均有表达,肝脏组织中的表达值中位数略高于其他正常组织(7.25 vs.4.6)。从Oncomine数据库检索出BUB1基因相关研究424项,显示肝癌组织中BUB1基因高表达5项、低表达6项,Meta分析显示与正常肝组织相比BUB1基因在肝癌组织中呈高表达状态(P=0.002)。CCLE数据库分析显示,在肝癌细胞系中BUB1 mRNA高表达。Kaplan-Meier Plotter及GEPIA数据库生存分析结果显示,BUB1基因高表达组的肝癌患者总体生存时间和无进展生存时间等生存预后指标均较低表达组差(P<0.05)。结论BUB1基因在肝癌组织中呈高表达,且BUB1基因高表达与肝癌患者生存预后差有关。 展开更多
关键词 肝癌 数据挖掘 生物标记 肿瘤 BUB1基因
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部