摘要
基于生物信息学的方法分析特发性肺纤维化(IPF)患者与正常人的基因芯片数据,找到差异表达基因,通过蛋白质互作网络找到关键基因,通过基因调控网络寻找潜在miRNA。方法 首先从Gene Expression Omnibusl( GEO) 数据库下载2个基因芯片数据集:GSE5384和GSE24206,通过R语言分析得到差异表达基因,并进行GO 、KEGG通路分析,使用STRING及Cytoscape软件进行蛋白质-蛋白质相互作用网络分析(PPI),从而得出核心基因,最后通过NetworkAnalyst网络构建寻找潜在miRNA。结果 筛选出137个差异表达基因。GO分析显示这些差异基因主要与细胞外基质、胶原组织以及免疫炎症等生物学功能相关,KEGG通路分析与蛋白代谢、ECM-受体、细胞黏附等通路密切关联。PPI网络CytoHubba分析出10个核心基因,包含:COL3A1、COL1A2、POSTN、COL5A2、THBS2、COL14A1、COL15A1、MXRA5、TGFB3及ASPN。通过构建基因-miRNA相互作用网络筛选出hsa-mir-29b-3p、hsa-mir-29a-3p、hsa-mir-29c-3p、hsa-mir-26b-5p、hsa-mir-335-5P等5个miRNA。结论 通过生物信息学对IPF的研究,分析出差异基因、核心基因及miRNA,在一定程度上阐明了特发性肺纤维化疾病发生发展过程中的分子调控机制,为寻找治疗提供新思路。
基金
甘肃省自然科学基金项目(No.20JR5RA165)。