期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于WGCNA和机器学习算法探索结直肠癌肝转移的机制及其潜在生物标志物
1
作者 张平茜 何亚玲 +3 位作者 李宇阳 胡诗涵 高波 潘云 《右江医学》 2024年第6期481-490,共10页
目的通过基于加权基因共表达网络分析(WGCNA)和机器学习算法探索结直肠肝转移(CRCLM)潜在生物标志物,为CRCLM的分子机制研究提供基础。方法从GEO数据库中收集两个CRCLM的微阵列数据集(GSE6988和GSE14297),鉴定出CRCLM中的差异表达基因(D... 目的通过基于加权基因共表达网络分析(WGCNA)和机器学习算法探索结直肠肝转移(CRCLM)潜在生物标志物,为CRCLM的分子机制研究提供基础。方法从GEO数据库中收集两个CRCLM的微阵列数据集(GSE6988和GSE14297),鉴定出CRCLM中的差异表达基因(DEGs)后进行基因本体论(GO)分析、京都基因和基因组百科全书(KEGG)富集分析和基因集富集分析(GSEA)。应用WGCNA筛选与CRCLM组相关性最强的模块内基因,采用机器学习算法最小绝对值收缩与筛选算子(LASSO)逻辑回归和支持向量机-递归特征消除(SVM-RFE)鉴定CRCLM的潜在生物标志物。比较GSE6988中CRCLM组和对照组的关键基因表达量,同时绘制关键基因诊断CRCLM的受试者工作特征(ROC)曲线,通过曲线下面积(AUC)评估其诊断效能,并在GSE14297中进行验证。结果鉴定出73个DEGs,包括55个上调基因和18个下调基因。生物学功能富集分析表明,DEGs主要富集于血液微粒和趋化因子相关的通路。WGCNA共得到了5个基因共表达模块,其中黄色模块与CRCLM相关性最强(cor=0.72,P=2e-14),其中包含81个基因。对黄色模块基因进行LASSO逻辑回归分析,其中4个基因(CCL11、SLC26A3、NR4A2、PLA2G2A)被确定为潜在的具有诊断性生物标志物,通过SVM-RFE算法,从DEGs中获得19个基因(CRP、HP、ORM2、CYP2E1、CCL11、MMP10、AQP3、SERPINA3、ENO3、HAO1、PLG、ENAM、DGUOK、UBE2Q2、HPX、APOA2、ITIH3、ANGPTL3、MMP1)作为潜在的诊断基因,将LASSO算法以及SVM-RFE算法得到的关键基因取交集。最终嗜酸细胞活化趋化因子(CCL11)被确定为有希望的生物标志物。在训练集及验证集中,CRCLM组的CCL11表达均显著低于对照组(P<0.001)。在训练集和验证集中的ROC曲线分析结果显示,CCL11诊断CRCLM的AUC分别为0.936和0.997,显示出很强的预测预后的能力。结论CCL11在CRCLM中低表达,可能是CRCLM的抑制因素,是CRCLM可能的预后生物分子标志物。CRCLM的发生发展可能与肿瘤血管微环境及趋化因子相关通路相关。 展开更多
关键词 结直肠癌肝转移 加权基因共表达网络分析 机器学习算法 生物信息学 嗜酸细胞活化趋化因子
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部