结构类似模板增强的端到端多域蛋白质组装方法

End-to-end Multi-domain Protein Assembly Method Enhanced by Structural Analogue Templates

下载PDF

导出

摘要使用同源模板能够有效的提升蛋白质结构预测的精度,然而,对于部分多域蛋白,PDB中可用的同源模板较少,这可能会影响预测精度.为了进一步提高多域蛋白质的建模精度,本文提出了基于结构类似模板结合同源模板的端到端多域组装方法MTDA.首先,搜索序列数据库生成多序列比对,以及分别搜索PDB100和MPDB生成同源模板和结构类似模板;进而提取序列特征、模板特征和单域特征;然后通过一个基于EfficientNetV2架构和注意力机制相结合的神经网络来预测多域蛋白质的域间方位从而直接将多个单域结构组装为全链结构.在125个测试蛋白和65个人类蛋白上的实验结果表明,MTDA优于仅使用同源模板的端到端组装方法E2EDA以及全链建模方法AlphaFold2. The use of homologous templates can effectively improve the accuracy of protein structure prediction.However,for some multi-domain proteins,there are fewer homologous templates available in PDB,which may affect the prediction accuracy.In order to further improve the modeling accuracy of multi-domain proteins,we propose an end-to-end multi-domain assembly method MTDA that combines structural analogue templates and homologous templates.First,search the sequence database to generate multiple sequence alignments,and search PDB100 and MPDB respectively to generate homologous templates and structural analogue templates,thereby extracting sequence features,template features,and single-domain features.Then,a neural network based on EfficientNetV2 architecture and attention mechanism is used to predict the inter-domain orientation of multi-domain proteins.Finally,multiple single-domain structures are directly assembled into a full-chain structure.Experimental results on 125 tested proteins and 65 human proteins show that MTDA outperforms E2EDA,an end-to-end assembly method using only homologous templates,and AlphaFold2,a full-chain modeling method.

作者朱海涛夏瑜豪张贵军 ZHU Haitao;XIA Yuhao;ZHANG Guijun(College of Information Engineering,Zhejiang University of Technology,Hangzhou 310023,China)

机构地区浙江工业大学信息工程学院

出处《小型微型计算机系统》 CSCD 北大核心 2024年第8期1825-1831,共7页 Journal of Chinese Computer Systems

基金国家重点研发项目(2019YFE0126100)资助国家自然科学基金项目(62173304)资助.

关键词多域蛋白质模板建模深度学习结构域组装域间方位预测 multi-domain proteins template modeling deep learning domain assembly inter-domain orientation prediction

分类号 TP389 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献2

1杨涛,刘栋,刘俊,张贵军.深度学习几何约束预测的蛋白质建模方法[J].小型微型计算机系统,2022,43(9):1918-1924. 被引量：3
2张贵军,侯铭桦,彭春祥,刘俊.多结构域蛋白质结构预测方法综述[J].电子科技大学学报,2022,51(6):820-829. 被引量：3

二级参考文献5

1周建红,艾观华,方慧生,陈凯先.蛋白质结构从头预测方法研究进展[J].生物信息学,2011,9(1):1-5. 被引量：4
2陈沙沙,吴宏杰,吕强.一种基于折叠模式识别的蛋白质结构片段库构建方法[J].小型微型计算机系统,2013,34(2):356-359. 被引量：5
3郝小虎,张贵军,周晓根,程正华,张启鹏.一种基于片段组装的蛋白质构象空间优化算法[J].计算机科学,2015,42(3):237-240. 被引量：3
4邓海游,贾亚,张阳.蛋白质结构预测[J].物理学报,2016,65(17):169-179. 被引量：21
5於东军,李阳.蛋白质残基接触图预测[J].南京理工大学学报,2019,43(1):1-12. 被引量：5

共引文献4

1闫尊强,梁毓豪,宋科林,滚双宝,王鹏飞.合作猪SIRT 3基因克隆、生物信息学分析及组织表达研究[J].中国畜牧兽医,2024,51(4):1390-1399. 被引量：1
2张金龙,赵凯龙,刘栋,张贵军.基于多结构深度学习的蛋白质模型细化方法[J].小型微型计算机系统,2024,45(7):1577-1584.
3李章维,张福金,赵凯龙,张贵军.多域蛋白质残基间距离深度学习预测方法[J].小型微型计算机系统,2024,45(8):1793-1799.
4张贵军,汪乾梁,彭春祥.基于语言模型的蛋白质结构域边界预测方法[J].浙江工业大学学报,2024,52(5):521-529.

1褚红健,李佑文,丁桃胜.一种基于图像模板的图像建模及识别框架研究[J].无线互联科技,2023,20(23):143-145. 被引量：1
2陈建润,毛卫宁.基于深度学习的纯方位水下目标机动检测[J].指挥控制与仿真,2024,46(3):95-101.
3梁方,徐旭瑶,赵凯龙,赵炫锋,张贵军.远程模板检测算法及其在蛋白质结构预测中的应用[J].计算机科学,2024,51(S01):167-173.
4刘臻岳,范玉婧,陈苗苗,姚惠娇,高志岭,刘春敬,谢建治,耿仕呈,代宇菲.铵态氮对生物过滤塔甲烷净化性能的影响及其微生物学机理[J].环境工程学报,2023,17(3):1001-1010. 被引量：1
5于紫凝,李海峰,景锡龙,池成全,郑海永.基于四分量钻孔应变数据的神经网络地震活动性预测分析[J].地震学报,2024,46(2):327-339.
6魏想想,孟朝晖.河海图结构蛋白质数据集及预测模型[J].计算机科学,2024,51(8):117-123.
7雷佳敏,王晓慧,苏征,高佩佩,徐孝娜,张磊,李伟,陈长生,张荣强,刘寒强.基于网络药理学及分子对接探讨黄芩治疗糖尿病的作用机制[J].现代药物与临床,2024,39(6):1445-1453.
8李章维,张福金,赵凯龙,张贵军.多域蛋白质残基间距离深度学习预测方法[J].小型微型计算机系统,2024,45(8):1793-1799.
9柳佳欣,吴丹,陶思政,罗英,杨凤,余婷,杨有新,周勇.辣椒CaBBX2基因的克隆与表达分析[J].核农学报,2024,38(9):1671-1681.

小型微型计算机系统

2024年第8期

浏览历史

内容加载中请稍等...

结构类似模板增强的端到端多域蛋白质组装方法

参考文献2

二级参考文献5

共引文献4

相关作者

相关机构

相关主题

浏览历史