-
题名基于单细胞数据的癌症协同驱动模块识别方法
- 1
-
-
作者
陈希
王峻
余国先
崔立真
郭茂祖
-
机构
山东大学软件学院
山东大学-南洋理工大学人工智能国际联合研究院
北京建筑大学电气与信息工程学院
-
出处
《中国科学:信息科学》
CSCD
北大核心
2023年第2期250-265,共16页
-
基金
国家自然科学基金(批准号:62072380,62031003)
山东大学中央高校基本业务费项目(批准号:2020GN061)资助。
-
文摘
从大规模生物组学数据中准确识别导致癌症发生的协同驱动模块是生物信息学研究领域重大课题之一.现有研究方法通常只基于批量组学数据进行识别,忽视了细胞水平上的癌症异质性,易受噪声影响.针对上述问题,本文提出了一种基于单细胞数据和先验知识指导的协同驱动模块识别方法CDMFinder.该方法首先利用基因在不同亚型及正常细胞表达数据间存在的特异性共表达信息,融合基因交互网络,优化形成分子功能关联网络,在深入挖掘基因间功能关联的同时有效降低网络复杂度;再基于重叠马尔可夫(Markov)聚类从该网络中挖掘功能簇,并提出基于融合权重和贪心策略的驱动模块识别方法,从功能簇中获得驱动模块集合;最后,融合功能交互网络与突变共现定义模块距离函数,识别获取协同驱动模块. CDMFinder充分融合评估了表达、突变、差异分析等多种因素,展现了优良的识别性能.在乳腺癌和胶质母细胞瘤多组学数据上的实验结果表明,本文方法能够识别出超过对比方法 1.35倍的驱动基因,识别到的协同驱动模块在功能/通路水平富集度上超过现有算法1.5倍.
-
关键词
单细胞数据
协同驱动模块
分子功能关联网络
马尔可夫聚类
多组学数据融合
-
Keywords
single-cell data
cooperative driver module
molecular functional association network
Markov clustering
multi-omics data fusion
-
分类号
Q811.4
[生物学—生物工程]
R73-3
[医药卫生—肿瘤]
-