期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于图神经网络的固定骨架蛋白质设计方法研究

Fixed backbone protein design based on graph neural network

下载PDF

导出

摘要针对图神经网络(GNN)ProteinSolver结构特征约束不充分的问题,增加了骨架二面角、配对氨基酸的相对位置编码和相对方向等结构约束,提出了一种基于GNN的固定骨架蛋白质设计方法。实现了基于Transformer多头注意力机制的GNN架构,将物理坐标添加到消息传递和更新步骤中,提高了原子坐标的等变特性。在CATH数据集上的训练和测试结果显示:该文模型平均困惑度为8.12,比ProteinSolver的平均困惑度8.97降低了0.85;在掩盖率为50%时,ProteinSolver的恢复率为28.7%;然后,增加更多的结构约束,恢复率达到了30.3%;随后,将ProteinSolver的GNN替换成基于Transformer的GNN,恢复率达到了34.3%;最后,通过再引入等变特性,恢复率进一步提高到35.0%。 To solve the problem of insufficient constraints on the structural characteristics of graph neural network(GNN)ProteinSolver,structural constraints such as skeleton dihedral angle,relative position encoding and relative direction of paired amino acids are added,and a design method of GNN based fixed skeleton protein is proposed.The GNN architecture based on Transformer’s multi head attention mechanism is implemented,and the physical coordinates are further added to the message transmission and update steps to improve the equivariant characteristics of atomic coordinates.The training and testing results on CATH dataset show that the average sequence perplexity of this model is 8.12,which is 0.85 lower than the average sequence perplexity of ProteinSolver of 8.97;when the concealment rate is 50%,the sequence recovery rate of ProteinSolver is 28.7%;then,by adding more structural constraints,the sequence recovery rate reaches 30.3%;subsequently,the GNN of ProteinSolver is replaced by the GNN based on Transformer,and the sequence recovery rate reaches 34.3%;finally,by introducing the equivariant feature,the sequence recovery rate further improves to 35.0%.

作者刘炎袁野沈红斌 Liu Yan;Yuan Ye;Shen Hongbin(Institute of Image Processing and Pattern Recognition,Shanghai Jiao Tong University,Shanghai 200240,China)

机构地区上海交通大学图像处理与模式识别研究所

出处《南京理工大学学报》 CAS CSCD 北大核心 2023年第3期311-317,329,共8页 Journal of Nanjing University of Science and Technology

关键词图神经网络固定骨架蛋白质蛋白质设计结构特征约束骨架二面角配对氨基酸相对位置编码相对方向 graph neural network fixed skeleton protein protein design structural feature constraints skeleton dihedral angle paired amino acids relative position coding relative direction

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1於东军,李阳.蛋白质残基接触图预测[J].南京理工大学学报,2019,43(1):1-12. 被引量：5
2魏志森,杨静宇,於东军.基于加权PSSM直方图和随机森林集成的蛋白质交互作用位点预测[J].南京理工大学学报,2015,39(4):379-385. 被引量：7
3张维洵,潘小勇,沈红斌.基于深度学习与领域规则建模的蛋白质信号肽及其切割位点预测[J].南京理工大学学报,2020,44(3):278-287. 被引量：7
4伍青林,任玉彬,翟小威,陈东,刘凯.生成模型在蛋白质序列设计中的应用[J].应用化学,2022,39(1):3-17. 被引量：2

二级参考文献13

1杨章静,刘传才,顾兴健,朱俊.依概率分类的保持投影及其在人脸识别中的应用[J].南京理工大学学报,2013,37(1):7-11. 被引量：6
2韦雪芳,王冬梅,刘思,周鹏.信号肽及其在蛋白质表达中的应用[J].生物技术通报,2006,22(6):38-42. 被引量：65
3刘惠,杨杰,陈军,刘丹青.基于全序列比对相似度预测信号肽[J].上海交通大学学报,2008,42(1):11-15. 被引量：8
4陈润生.当前生物信息学的重要研究任务[J].生物工程进展,1999,19(4):11-14. 被引量：24
5李倩倩,刘胥影.多类类别不平衡学习算法:EasyEnsemble.M[J].模式识别与人工智能,2014,27(2):187-192. 被引量：16
6冀俊忠,刘志军,刘红欣,刘椿年.蛋白质相互作用网络功能模块检测的研究综述[J].自动化学报,2014,40(4):577-593. 被引量：24
7魏志森,杨静宇,於东军.基于加权PSSM直方图和随机森林集成的蛋白质交互作用位点预测[J].南京理工大学学报,2015,39(4):379-385. 被引量：7
8郜法启,於东军,沈红斌.基于分类器集成的跨膜蛋白两亲螺旋区域位置预测[J].南京理工大学学报,2016,40(4):431-437. 被引量：4
9於东军,朱一亨,胡俊.识别蛋白质配体绑定残基的生物计算方法综述[J].数据采集与处理,2018,33(2):195-206. 被引量：3
10金康荣,於东军.基于加权朴素贝叶斯分类器和极端随机树的蛋白质接触图预测[J].南京航空航天大学学报,2018,50(5):619-628. 被引量：6

共引文献16

1刘光徽,胡俊,於东军.基于多视角特征组合与随机森林的G蛋白偶联受体与药物相互作用预测[J].南京理工大学学报,2016,40(1):1-9. 被引量：5
2杨晓光,朱保平.基于复杂网络的社区发现算法[J].南京理工大学学报,2016,40(3):267-271. 被引量：6
3郜法启,於东军,沈红斌.基于分类器集成的跨膜蛋白两亲螺旋区域位置预测[J].南京理工大学学报,2016,40(4):431-437. 被引量：4
4於东军,李阳.蛋白质残基接触图预测[J].南京理工大学学报,2019,43(1):1-12. 被引量：5
5张维洵,潘小勇,沈红斌.基于深度学习与领域规则建模的蛋白质信号肽及其切割位点预测[J].南京理工大学学报,2020,44(3):278-287. 被引量：7
6葛芳,胡俊,朱一亨,於东军.非同义单核苷酸变异致病性预测研究综述[J].南京理工大学学报,2021,45(1):1-17. 被引量：2
7梁亮.基于异质分类器集成的蛋白质结晶倾向性预测[J].南京理工大学学报,2021,45(5):582-588.
8喻红稠,韩长志.禾谷炭疽菌中候选G蛋白偶联受体蛋白的找寻[J].科学技术与工程,2022,22(1):103-109. 被引量：3
9陈焕超,魏志森,於东军,杨敬民,杨静宇.基于LightGBM的蛋白质类泛素化修饰位点预测[J].南京理工大学学报,2022,46(2):156-163.
10张贵军,侯铭桦,彭春祥,刘俊.多结构域蛋白质结构预测方法综述[J].电子科技大学学报,2022,51(6):820-829. 被引量：3

1李健,熊琦,胡雅婷,刘孔宇.基于Transformer和隐马尔科夫模型的中文命名实体识别方法[J].吉林大学学报（工学版）,2023,53(5):1427-1434. 被引量：8
2郭小磊,牛晓蕾,何丽清.基于LDA模型的影评文本情感分析[J].电脑与电信,2023(3):1-4.
3吴玥,纪颖.基于主题意义引领的高中英语单元整体教学设计方法研究[J].海外英语,2023(9):191-193.
4杨运成,吴飞,朱海,朱润哲,杨明泽.结合CNN-BiLSTM-SA运动模式识别的自适应步频检测方法[J].全球定位系统,2023,48(2):71-80.
5陈籽伊,冯新龙,赵建平.基于BiMCCN模型的滚动轴承故障诊断方法[J].人工智能,2023(3):62-71.
6麻亚辉,邓文静.市政给排水管道布置设计方法研究[J].中文科技期刊数据库（全文版）工程技术,2023(7):123-126.
7杨作骞,施威,王景景.基于并联网络的水声信号自动调制识别方法[J].移动通信,2023,47(6):122-130. 被引量：1
8冯青文,王丹辉.无人机3D目标检测关键技术研究[J].信息记录材料,2023,24(5):137-139. 被引量：1
9李凡,贾东立,姚昱旻,涂俊.结合残差与自注意力机制的图卷积小样本图像分类网络[J].计算机科学,2023,50(S01):366-370. 被引量：2
10王怡阳,王慧,王新力,邢紫薇.空间结构视角下乡土建筑更新类型学设计方法研究[J].城市建筑,2023,20(9):10-13. 被引量：1

南京理工大学学报

2023年第3期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部