大部分现有的用于预测环状RNA(circRNA)与疾病之间关联关系的计算模型通常使用circRNA和疾病相关数据等生物学知识,配合已知的circRNA-疾病关联信息对来挖掘出潜在的关联信息。然而这些模型受已知关联构成的网络稀疏性、负样本过少等固...大部分现有的用于预测环状RNA(circRNA)与疾病之间关联关系的计算模型通常使用circRNA和疾病相关数据等生物学知识,配合已知的circRNA-疾病关联信息对来挖掘出潜在的关联信息。然而这些模型受已知关联构成的网络稀疏性、负样本过少等固有问题的影响,导致预测性能不佳。因此,在图自动编码器基础上引入归纳式矩阵补全及自注意力机制进行二阶段融合,以实现circRNA-疾病关联预测,由此构建的模型叫GIS-CDA(Graph auto-encoder combining Inductive matrix complementation and Self-attention mechanism for predicting Circ RNA-Disease Association)。首先,计算circRNA集成和疾病集成的相似性,并利用图自动编码器学习circRNA和疾病的潜在特征,以获得低维表征;接着,将学习到的特征输入归纳式矩阵补全,以提高节点之间的相似性和依赖性;然后,将circRNA特征矩阵和疾病特征矩阵整合为circRNA-疾病特征矩阵,以增强预测的稳定性和精确性;最后,引入自注意力机制,从特征矩阵中提取重要特征,并减少对其他生物信息的依赖。五折交叉和十折交叉验证的结果显示:GIS-CDA获得的平均接收者操作特征曲线下面积(AUROC)值分别为0.9303和0.9393,前者比基于KATZ测度的人类circRNA-疾病关联预测模型(KATZHCDA)、基于深度矩阵分解方法的circRNA-疾病关联(DMFCDA)预测模型、RWR(Random Walk with Restart)和基于加速归纳式矩阵补全的circRNA-疾病关联(SIMCCDA)预测模型分别高出了13.19、35.73、13.28和5.01个百分点;GIS-CDA的精确率-召回率曲线下面积(AUPR)值分别为0.2271和0.2340,前者比上述对比模型分别高出了21.72、22.43、21.96和13.86个百分点。此外,在circRNADisease、circ2Disease和circ R2Disease数据集上的消融实验和案例研究进一步验证了GIS-CDA在预测circRNA-疾病的潜在关联方面具有较好的性能。展开更多
提出一种结构化深度聚类网络模型来预测microRNA(miRNA)和疾病的关联。模型将miRNA和疾病的集成相似性投入自编码器,将自编码器的输出通过传递算子传递到图卷积层,利用双重监督机制对模型进行训练。5折交叉验证结果显示,该模型分别在HMD...提出一种结构化深度聚类网络模型来预测microRNA(miRNA)和疾病的关联。模型将miRNA和疾病的集成相似性投入自编码器,将自编码器的输出通过传递算子传递到图卷积层,利用双重监督机制对模型进行训练。5折交叉验证结果显示,该模型分别在HMDD v2.0和HMDD v3.0数据集上平均AUC(Area Under the Curve)值分别为93.23%和94.58%。展开更多
文摘大部分现有的用于预测环状RNA(circRNA)与疾病之间关联关系的计算模型通常使用circRNA和疾病相关数据等生物学知识,配合已知的circRNA-疾病关联信息对来挖掘出潜在的关联信息。然而这些模型受已知关联构成的网络稀疏性、负样本过少等固有问题的影响,导致预测性能不佳。因此,在图自动编码器基础上引入归纳式矩阵补全及自注意力机制进行二阶段融合,以实现circRNA-疾病关联预测,由此构建的模型叫GIS-CDA(Graph auto-encoder combining Inductive matrix complementation and Self-attention mechanism for predicting Circ RNA-Disease Association)。首先,计算circRNA集成和疾病集成的相似性,并利用图自动编码器学习circRNA和疾病的潜在特征,以获得低维表征;接着,将学习到的特征输入归纳式矩阵补全,以提高节点之间的相似性和依赖性;然后,将circRNA特征矩阵和疾病特征矩阵整合为circRNA-疾病特征矩阵,以增强预测的稳定性和精确性;最后,引入自注意力机制,从特征矩阵中提取重要特征,并减少对其他生物信息的依赖。五折交叉和十折交叉验证的结果显示:GIS-CDA获得的平均接收者操作特征曲线下面积(AUROC)值分别为0.9303和0.9393,前者比基于KATZ测度的人类circRNA-疾病关联预测模型(KATZHCDA)、基于深度矩阵分解方法的circRNA-疾病关联(DMFCDA)预测模型、RWR(Random Walk with Restart)和基于加速归纳式矩阵补全的circRNA-疾病关联(SIMCCDA)预测模型分别高出了13.19、35.73、13.28和5.01个百分点;GIS-CDA的精确率-召回率曲线下面积(AUPR)值分别为0.2271和0.2340,前者比上述对比模型分别高出了21.72、22.43、21.96和13.86个百分点。此外,在circRNADisease、circ2Disease和circ R2Disease数据集上的消融实验和案例研究进一步验证了GIS-CDA在预测circRNA-疾病的潜在关联方面具有较好的性能。
文摘提出一种结构化深度聚类网络模型来预测microRNA(miRNA)和疾病的关联。模型将miRNA和疾病的集成相似性投入自编码器,将自编码器的输出通过传递算子传递到图卷积层,利用双重监督机制对模型进行训练。5折交叉验证结果显示,该模型分别在HMDD v2.0和HMDD v3.0数据集上平均AUC(Area Under the Curve)值分别为93.23%和94.58%。
文摘了解微生物-疾病关联不仅可以揭示疾病的发病机理,而且可以促进疾病的诊断和预后。提出一种基于结构深度网络嵌入的方法(NEMDA)来识别潜在的微生物-疾病关联。首先,通过整合人类微生物-疾病关联数据库(human microbe-disease association database,HMDAD)和Disbiome数据库,扩大微生物和疾病的数量以及已知的微生物-疾病关联关系。接着,将结构深度网络嵌入用于提取微生物-疾病二分网络的特征,并且引入微生物功能相似性、微生物相互作用谱相似性和疾病语义相似性、基于症状的疾病相似性,分别作为微生物和疾病的生物学特征。然后,将这3个特征结合构成微生物-疾病对的特征,并使用深度神经网络模型进行预测。最后,通过五折交叉验证和案例分析来评估NEMDA的性能,在五折交叉验证下,NEMDA表现良好,预测性能高于KATZMDA、NCPHMDA、LRLSHMDA、PBHMDA、NTSHMDA和BRWMDA 6种比较方法。哮喘、炎症性肠病和结直肠癌的案例分析结果进一步表明,NEMDA预测性能良好,其是一个有效的预测微生物-疾病关联的工具。