基本随机游走相似性指标由于其转移概率仅由当前节点的度决定,影响链路预测效果.鉴于此,在MH(Metropolis-Hasting)算法的基础上,充分利用邻居节点的度信息,并采用将当前节点的自环率按邻居节点的度值加权分配给邻居节点的方法重构转移...基本随机游走相似性指标由于其转移概率仅由当前节点的度决定,影响链路预测效果.鉴于此,在MH(Metropolis-Hasting)算法的基础上,充分利用邻居节点的度信息,并采用将当前节点的自环率按邻居节点的度值加权分配给邻居节点的方法重构转移概率矩阵,再融合重启随机游走(Random Walk with Restart,RWR)相似性指标,提出一种改进MH的链路预测算法.首先,根据当前节点与邻居节点的度信息重新定义节点间的转移概率;然后,将新的转移概率重构成概率矩阵;最后,融合RWR相似性指标进行链路预测实验.结果表明,新算法相较于RWR、CN(Common Neighbors)等7种基准算法在AUC指标上均有提升,在排序分指标上也有所改善;AUC指标上最高可提升3.98%,排序分指标上最高下降1.92%,提升了链路预测的准确性.展开更多
肺癌致病基因的发现及预测有助于认识肺癌的发生机理、诊断与防治,是人类基因组研究的重要目标。应用现有二元网络重启随机游走算法预测致病基因时,一般先在疾病表型网络、蛋白质作用网络及疾病-蛋白质二分图网络内随机游走一步,然后进...肺癌致病基因的发现及预测有助于认识肺癌的发生机理、诊断与防治,是人类基因组研究的重要目标。应用现有二元网络重启随机游走算法预测致病基因时,一般先在疾病表型网络、蛋白质作用网络及疾病-蛋白质二分图网络内随机游走一步,然后进行网络间跳转,这种策略不仅搜索效率较低,还可能遗漏蛋白质(或疾病)网络中的局部拓扑信息。鉴于此,作者提出一种二元网络异步重启游走(asynchronously random walk with restart,ARWRH)算法,构建疾病表型-蛋白质异构网络,深层次挖掘潜在肺癌风险致病基因。ARWRH算法首先在疾病表型网络、蛋白质作用网络及疾病表型-蛋白质二分图网络内随机游走不同步数,然后进行网络间跳转,迭代形成稳态概率向量,从而获得候选致病基因。仿真实验表明,ARWRH算法可有效预测肺癌潜在风险致病基因,多数预测结果获得了文献证据支持。展开更多
文摘基本随机游走相似性指标由于其转移概率仅由当前节点的度决定,影响链路预测效果.鉴于此,在MH(Metropolis-Hasting)算法的基础上,充分利用邻居节点的度信息,并采用将当前节点的自环率按邻居节点的度值加权分配给邻居节点的方法重构转移概率矩阵,再融合重启随机游走(Random Walk with Restart,RWR)相似性指标,提出一种改进MH的链路预测算法.首先,根据当前节点与邻居节点的度信息重新定义节点间的转移概率;然后,将新的转移概率重构成概率矩阵;最后,融合RWR相似性指标进行链路预测实验.结果表明,新算法相较于RWR、CN(Common Neighbors)等7种基准算法在AUC指标上均有提升,在排序分指标上也有所改善;AUC指标上最高可提升3.98%,排序分指标上最高下降1.92%,提升了链路预测的准确性.
文摘肺癌致病基因的发现及预测有助于认识肺癌的发生机理、诊断与防治,是人类基因组研究的重要目标。应用现有二元网络重启随机游走算法预测致病基因时,一般先在疾病表型网络、蛋白质作用网络及疾病-蛋白质二分图网络内随机游走一步,然后进行网络间跳转,这种策略不仅搜索效率较低,还可能遗漏蛋白质(或疾病)网络中的局部拓扑信息。鉴于此,作者提出一种二元网络异步重启游走(asynchronously random walk with restart,ARWRH)算法,构建疾病表型-蛋白质异构网络,深层次挖掘潜在肺癌风险致病基因。ARWRH算法首先在疾病表型网络、蛋白质作用网络及疾病表型-蛋白质二分图网络内随机游走不同步数,然后进行网络间跳转,迭代形成稳态概率向量,从而获得候选致病基因。仿真实验表明,ARWRH算法可有效预测肺癌潜在风险致病基因,多数预测结果获得了文献证据支持。