癌症多组学数据深度自编码器整合分型方法被引量：2

Multi-Omics Data Deep Autoencoder Integration for Cancer Subtyping

下载PDF

导出

摘要在癌症研究中,随着高通量测序技术发展已经产生了海量的复杂数据。尽管有了一些利用深度学习和统计学方法进行多组学数据整合的研究,但目前仍缺乏较为有效率的整合方法。因此提出一种基于深度自编码器的多组学数据整合方法(deep autoencoder for multi-omics integration,DAEMI)。它利用自编码器中的瓶颈层,学习多组学数据的特征表示。与先前利用深度学习整合的研究相比,DAEMI可以发现明显生存差异的癌症亚型。同时因为不需要生存数据来选择特征,DAEMI可以使用更多特征进行K均值聚类,进而完成癌症分型任务。将DAEMI应用于模拟数据集与四个癌症数据集实验,通过与高阶路径相似度网络的融合模型(HOPES)、相似性网络融合(SNF)、iClusterPlus和moCluster进行比较,结合模拟数据集测试结果与真实癌症数据集测试结果来看,DAEMI要优于其他方法。相应的生物功能分析揭示,神经退行性疾病与线粒体功能障碍可能与癌症共享某些生物学通路。 In cancer research, high-throughput sequencing techniques have yielded a large amount of complex heterogeneous data. Although several deep learning or statistical methods have been applied to integrate such data, there is a lack of work on how to integrate multi-omics data more efficiently. Therefore, a deep learning-based multi-omics data integration method named deep autoencoder for multi-omics integration(DAEMI)is proposed. It utilizes a deep learning algorithm named autoencoder, which uses a bottleneck layer in the network to get a compressed knowledge representation of the original input. Unlike previous deep learning integration studies, this method finds more subtypes with significant survival differences. DAEMI does not rely on survival data for compressed features selection. It uses all features obtained from the bottleneck layer and uses K-means to identify cancer subtypes. By comparing with high-order path elucidated similarity(HOPES), Similarity network fusion(SNF), iClusterPlus, and moCluster on 4 cancer datasets and simulate dataset, DAEMI performs better than other methods. Functional analysis revealed neurodegenerative diseases and mitochondrial dysfunction may share some pathways with cancer.

作者曹业伟刘飞 CAO Yewei;LIU Fei(School of Software,Sorth China University of Technology,Guangzhou 510006,China)

机构地区华南理工大学软件学院

出处《计算机工程与应用》 CSCD 北大核心 2022年第18期154-161,共8页 Computer Engineering and Applications

基金国家重点研发计划(2018YFC0830900) 广东省自然科学基金(2018A030313338)。

关键词多组学数据整合癌症分型 K均值深度学习生存分析 multi-omics data integration cancer subtyping K-means deep learning survival analysis

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

同被引文献12

1王庆山.肿瘤早期诊断方法与应用的进展[J].中国冶金工业医学杂志,2007,24(1):32-34. 被引量：2
2张树霖.拉曼光谱学的发展与中国学者的贡献[J].科学,2007,59(3):54-57. 被引量：6
3刘铭,胡永刚.拉曼光谱技术的应用——肿瘤早期诊断的无损检测[J].科技广场,2011(1):231-234. 被引量：2
4陈木旺.浅谈共聚焦显微技术[J].光学仪器,2013,35(1):44-47. 被引量：9
5区洁美,陈旭东.共振拉曼光谱在聚合物研究中的应用[J].合成材料老化与应用,2019,48(2):108-114. 被引量：1
6王康,陈悦.基于突变检测的技术融合前沿及其演进分析——以生物芯片专利为例[J].情报杂志,2021,40(7):1-7. 被引量：5
7谢良旭,李峰,谢建平,许晓军.基于融合神经网络模型的药物分子性质预测[J].计算机科学,2021,48(9):251-256. 被引量：12
8王雪,王萌萌,张秀明(综述),熊丹(审校).共聚焦显微拉曼光谱鼻咽癌检测中的研究进展[J].国际检验医学杂志,2022,43(5):622-626. 被引量：3
9Xiao Liang,Pu Zhang,Minghai Ma,Tao Yang,Xiangwei Zhao,Rui Zhang,Minxuan Jing,Rundong Song,Lei Wang,Jinhai Fan.Multiplex ratiometric gold nanoprobes based on surface-enhanced Raman scattering enable accurate molecular detection and imaging of bladder cancer[J].Nano Research,2022,15(4):3487-3495. 被引量：1
10罗斌.恶性肿瘤介入治疗的现状及进展[J].航空航天医学杂志,2022,33(3):329-331. 被引量：6

引证文献2

1石祎梦,尹焕才,殷建.拉曼光谱在肿瘤诊断中的应用研究进展[J].激光杂志,2023,44(11):1-6.
2张星宇,陈卓,黄印,原雨婷,李颖,王彬.基于多模态栈式混合自编码器的药物靶标相互作用预测[J].计算机工程与应用,2024,60(19):334-342.

1刘洋,胡志高.基于Python的网站访问数据可视化方法[J].信息与电脑,2022,34(10):26-28.
2张华,翟宏纲.5G通信与光电光纤网络的融合分析[J].电子技术（上海）,2022,51(7):204-205. 被引量：1
3崔利娜,侯立旺.一种快速稳健的K均值聚类算法[J].产业科技创新,2022,4(4):48-49.
4梁军,徐海武,郭玲.不动产登记中的房产与地籍测绘数据整合分析[J].科技创新导报,2022,19(17):193-195.
5楼柏丹,赵立铭.高中生物学科学本质教学的方法及原则[J].中学生物教学,2022(22):22-24. 被引量：1
6广闻博览[J].党的生活（青海）,2022(9):70-72.
7林雷蕾,闻立杰,钱忱,宗瓒,王建民.面向过程挖掘的日志划分技术综述[J].计算机学报,2022,45(9):1946-1968. 被引量：2
8李东方,黄乐曦,侯季秋,李艳,赵海滨.基于数据挖掘和网络药理学探讨冠心病合并抑郁用药规律和作用机制[J].中国医药导报,2022,19(22):13-19. 被引量：5
9李静,李宝重,郭现利,郭军梅.肿瘤突变负荷水平在非小细胞肺癌患者术后接受铂类药物为基础辅助化疗的临床意义[J].实用医学杂志,2022,38(14):1804-1808. 被引量：2
10邱清清.基于遥感技术的自然资源动态监测研究[J].科技创新导报,2022,19(16):12-14. 被引量：1

计算机工程与应用

2022年第18期

浏览历史

内容加载中请稍等...

癌症多组学数据深度自编码器整合分型方法被引量：2

同被引文献12

引证文献2

相关作者

相关机构

相关主题

浏览历史

癌症多组学数据深度自编码器整合分型方法 被引量：2

同被引文献12

引证文献2

相关作者

相关机构

相关主题

浏览历史

癌症多组学数据深度自编码器整合分型方法被引量：2