摘要
目的基于生物信息学分析溶质载体(SLC)15A1基因表达与孤独症谱系障碍(ASD)的相关性,为临床治疗提供参考。方法使用基因表达公共(GEO)数据库,检索溶质载体相关基因(SCRGs)和孤独症谱系障碍(ASD)患者血液RNA表达谱芯片或测序的研究数据集得到2个训练集(GSE6575、GSE77103数据集)和1个验证集(GSE49105数据集),对2个训练集进行去批次合并处理,将得到的新数据集作为本研究的训练集。对训练集进行差异表达分析,得到差异基因(DEGs),使用Venny2.1获取SCRGs和DEGs的交集靶点溶质载体差异基因(DE-SCRGs)并建立DE-SCRGs的关联网络图。对DE-SCRGs进行富集分析,得到其主要参与的生物学过程。通过机器学习方法[LASSO、随机森林(RF)、支持向量机的递归特征消除(SVM-RFE)算法]在验证集中筛选出生物标志物,并分析生物标志物在ASD中的预测价值。在训练集和验证集中比较ASD男童与健康对照(NC)组研究对象中DE-SCRGs的表达水平差异,在训练集中比较ASD男童和女童样本中DE-SCRGs的表达水平差异。基于SLC15A1、SLC5A4、SLC28A3、SLC50A1基因构建列线图,分析以上4个基因的表达水平与ASD发生的相关性。结果GSE6575和GSE77103数据集去批次后数据分布较均匀,获得1010个DEGs,其中692个在ASD样本中下调,318个在ASD样本中上调,并获得25个DE-SGRGs。关联网络图显示:27个基因呈102对相关性,其中SLC15A1基因与其他分析的基因均正相关,具有代表性。GO通路富集分析结果显示:DE-SCRGs参与的生物学过程主要是跨膜运输等功能;KEGG通路富集分析结果显示:DE-SCRGs参与的部分信号通路主要是蛋白质消化吸收、氮代谢等过程。通过LASSO、SVM-RFE、RF算法各得到16、16、7个候选特征基因,取交集后得到4个候选基因(SLC15A1、SLC5A4、SLC28A3、SLC50A1)作为生物标志物。受试者操作特征(ROC)曲线分析结果显示:4个生物标志物预测ASD发生的曲线下面积(AUC)均>0.7,整体模型的AUC=0.896。在训练集和验证集中,SLC15A1、SLC28A3、SLC50A1基因的表达趋势保持一致,SLC5A4基因的表达在验证集中无差异;训练集中ASD男童、女童样本的SLC50A1基因表达有差异。列线图结果显示:SLC15A1基因的表达与ASD的发生呈负相关。实验验证结果显示:ASD组患儿血液样品中SLC15A1基因表达水平低于NC组(P<0.05)。结论SLC15A1基因表达水平与ASD呈负相关,异常表达可降低寡肽物质的转运,进而影响ASD的发生或加重。
出处
《大医生》
2024年第14期27-31,共5页
Doctor