期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于多组学数据融合构建乳腺癌生存预测模型 被引量:6
1
作者 齐惠颖 江雨荷 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第8期88-93,共6页
【目的】更好地预测乳腺癌生存期,探索融合多种组学数据利用机器学习方法构建乳腺癌生存预测模型。【方法】通过对TCGA数据库中乳腺癌的基因表达、拷贝数变异、DNA甲基化和蛋白质表达4种组学数据的融合,使用随机森林算法建立预测模型。... 【目的】更好地预测乳腺癌生存期,探索融合多种组学数据利用机器学习方法构建乳腺癌生存预测模型。【方法】通过对TCGA数据库中乳腺癌的基因表达、拷贝数变异、DNA甲基化和蛋白质表达4种组学数据的融合,使用随机森林算法建立预测模型。【结果】在测试数据集上该模型对乳腺癌分类预测的精确率为97.22%,召回率为98.13%。通过AUC值对比不同类型组合组学数据的预测性能,融合多组学数据的AUC值为0.8393,性能最好。【局限】由于样本数量的限制,模型普适性还有待进一步验证。【结论】融合多种组学数据构建乳腺癌预测模型是一种有效提高预测性能的方法。 展开更多
关键词 组学数据融合 随机森林 乳腺癌生存预测
原文传递
基于多组学数据和稀疏变分自编码器的生存分析算法 被引量:1
2
作者 殷清燕 武锐萍 +1 位作者 陈旺旺 边根庆 《计算机应用研究》 CSCD 北大核心 2023年第3期771-775,共5页
针对生存分析中多组学数据带来的维数灾难和过拟合问题,提出了一种基于多组学数据和稀疏变分自编码器的生存分析算法VAESCox。该算法将变分自编码器的基本结构与稀疏编码和生存分析相结合,在无监督阶段训练变分自编码器学习低维表示,在... 针对生存分析中多组学数据带来的维数灾难和过拟合问题,提出了一种基于多组学数据和稀疏变分自编码器的生存分析算法VAESCox。该算法将变分自编码器的基本结构与稀疏编码和生存分析相结合,在无监督阶段训练变分自编码器学习低维表示,在监督阶段将训练的权重迁移到生存分析模型,并对传递权重进行微调和稀疏编码。实验结果表明,在八种不同癌症类型的数据集上,VAESCox模型在消融和对比实验中均取得了较高的C指数值。与其他四种基准生存分析方法相比,所提算法不仅缓解了多组学数据融合的过拟合问题,也显著提高了生存预测性能,表明不同组学数据的融合有助于预后生存结果的精准预测。 展开更多
关键词 生存分析 组学数据融合 变分自编码器 稀疏编码
下载PDF
基于个性化随机游走的基因-表型关联分析
3
作者 谭好江 王峻 +2 位作者 余国先 陈建 郭茂祖 《电子学报》 EI CAS CSCD 北大核心 2024年第5期1619-1632,共14页
基因与表型间的关联分析对揭示生物的内在遗传关联具有重要意义.随机游走算法可以融合多组学数据,聚合一阶或高阶邻居的标签信息,对网络中不同节点间关联信息进行补全,提高关联预测的准确度,进而发现基因和表型间潜在的遗传关联.但现有... 基因与表型间的关联分析对揭示生物的内在遗传关联具有重要意义.随机游走算法可以融合多组学数据,聚合一阶或高阶邻居的标签信息,对网络中不同节点间关联信息进行补全,提高关联预测的准确度,进而发现基因和表型间潜在的遗传关联.但现有随机游走算法通常平等地对待每个节点,忽略了不同节点的重要性,使非重要节点过度传播,降低了模型性能.为此,本文提出了一种基于多组学数据融合的个性化随机游走算法(individual Multiple Random Walks,iMRW),在由基因、miRNA及表型节点构建的多组学异质网络上,基于网络拓扑结构,设计个性化多元随机游走策略,为不同重要程度的节点分配不同的游走步长,并结合高斯相互作用属性核相似性与随机游走,对网络不同节点及节点间关联信息进行补全,最终实现多源基因-表型关联矩阵的融合,准确获取基因-表型关联预测矩阵.在不同实验设置下,与主流算法的对比实验结果均显示iMRW能够取得更优的预测性能.在玉米光合作用能力和淀粉含量表型的实验分析结果也进一步证实了iMRW在识别潜在的基因-表型关联的实用性与有效性. 展开更多
关键词 基因-表型关联 随机游走 异质网络 组学数据融合 网络拓扑结构
下载PDF
基于单细胞数据的癌症协同驱动模块识别方法
4
作者 陈希 王峻 +2 位作者 余国先 崔立真 郭茂祖 《中国科学:信息科学》 CSCD 北大核心 2023年第2期250-265,共16页
从大规模生物组学数据中准确识别导致癌症发生的协同驱动模块是生物信息学研究领域重大课题之一.现有研究方法通常只基于批量组学数据进行识别,忽视了细胞水平上的癌症异质性,易受噪声影响.针对上述问题,本文提出了一种基于单细胞数据... 从大规模生物组学数据中准确识别导致癌症发生的协同驱动模块是生物信息学研究领域重大课题之一.现有研究方法通常只基于批量组学数据进行识别,忽视了细胞水平上的癌症异质性,易受噪声影响.针对上述问题,本文提出了一种基于单细胞数据和先验知识指导的协同驱动模块识别方法CDMFinder.该方法首先利用基因在不同亚型及正常细胞表达数据间存在的特异性共表达信息,融合基因交互网络,优化形成分子功能关联网络,在深入挖掘基因间功能关联的同时有效降低网络复杂度;再基于重叠马尔可夫(Markov)聚类从该网络中挖掘功能簇,并提出基于融合权重和贪心策略的驱动模块识别方法,从功能簇中获得驱动模块集合;最后,融合功能交互网络与突变共现定义模块距离函数,识别获取协同驱动模块. CDMFinder充分融合评估了表达、突变、差异分析等多种因素,展现了优良的识别性能.在乳腺癌和胶质母细胞瘤多组学数据上的实验结果表明,本文方法能够识别出超过对比方法 1.35倍的驱动基因,识别到的协同驱动模块在功能/通路水平富集度上超过现有算法1.5倍. 展开更多
关键词 单细胞数据 协同驱动模块 分子功能关联网络 马尔可夫聚类 组学数据融合
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部