基于融合神经网络模型的药物分子性质预测被引量：12

Predicting Drug Molecular Properties Based on Ensembling Neural Networks Models

下载PDF

导出

摘要在生物信息学领域,人工智能方法在预测药物分子的物理化学性质和生物活性中获得了重大成功,特别是神经网络已被广泛应用到药物研发中。但是浅层神经网络的预测精度低,深度神经网络又容易出现过拟合的问题,而模型融合策略有望提升机器学习中弱学习器的预测能力。据此,文中将模型融合方法首次应用到药物分子性质的预测中,通过对药物分子的化学结构进行信息化编码,采用平均法、堆叠法融合浅层神经网络,提高对药物分子pKa预测的能力。与深度学习方法相比,堆叠法(Stacking)融合的模型具有更高的预测准确性,其预测结果的相关系数达到0.86。通过将多个弱学习器的神经网络有机组合可使其达到深度神经网络的预测精度,同时保留更好的模型泛化能力。研究结果表明,模型融合方法可提高神经网络对药物分子pKa预测结果的准确性和可靠性。 Artificial intelligence(AI)methods have made great success in predicting chemical properties and bioactivity of drug molecules in the Bioinformatics field.Neural network gains wide applications in the process of drug discovery.However,the shallow neural network(SNN)gives lower accuracy while deep neural networks(DNN)are easy to be overfitting.Model ensembling is expected to further improve the predictive performance of weak learners in traditional machine learning methods.Therefore,it is the first time to apply model ensembling strategy to predict the properties of drug molecules.By encoding molecular structures,the combination strategies,averaging,and stacking methods are adopted to increase predicting accuracy of pKa of drug molecules.Compared with DNN,the stacking strategy presents the best predictive accuracy and the Pearson coefficient reaches to 0.86.Ensembling weak learners of the neural networks can reproduce the accuracy of DNN while keeping the satisfied generalization ability.The results show that ensembling method can increase the predictive accuracy and reliability.

作者谢良旭李峰谢建平许晓军 XIE Liang-xu;LI Feng;XIE Jian-ping;XU Xiao-jun(Institute of Bioinformatics and Medical Engineering,School of Electrical and Information Engineering,Jiangsu University of Technology,Changzhou,Jiangsu 213001,China;Jiangsu Sino-Israel Industrial Technology Research Institute,Changzhou,Jiangsu 213100,China;School of Electrical and Information Engineering,Jiangsu University of Technology,Changzhou,Jiangsu 213001,China;School of Science,Huzhou University,Huzhou,Zhejiang 313000,China)

机构地区江苏理工学院电气信息工程学院生物信息与医药工程研究所江苏省中以产业技术研究院江苏理工学院电气信息工程学院湖州师范学院理学院

出处《计算机科学》 CSCD 北大核心 2021年第9期251-256,共6页 Computer Science

基金国家自然科学基金(12074151,22003020) 江苏省自然科学基金(BK20191032) 常州市重点研发项目(CJ20200045) 江苏省中以产业技术研究院开放课题(JSIITRI202009)。

关键词计算机辅助药物设计生物信息学模型融合深度学习机器学习 Computer aided drug discovery Bioinformatics Model ensembling Deep learning Machine learning

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1孙志远,鲁成祥,史忠植,马刚.深度学习研究与进展[J].计算机科学,2016,43(2):1-8. 被引量：133
2田启川,王满丽.深度学习算法研究进展[J].计算机工程与应用,2019,55(22):25-33. 被引量：58
3史新宇,禹龙,田生伟,叶飞跃,钱进,高双印.基于深度学习的口服生物利用度分类研究[J].计算机科学,2016,43(4):260-263. 被引量：2

二级参考文献22

1张立民,刘凯.基于深度玻尔兹曼机的文本特征提取研究[J].微电子学与计算机,2015,32(2):142-147. 被引量：9
2李寿山,黄居仁.基于词边界分类的中文分词方法[J].中文信息学报,2010,24(1):3-7. 被引量：6
3李寿山,黄居仁.基于Stacking组合分类方法的中文情感分类研究[J].中文信息学报,2010,24(5):56-61. 被引量：43
4赖珺,廖正根,杨明福,梁新丽.生物利用度的研究进展[J].中国实验方剂学杂志,2010,16(18):226-229. 被引量：33
5余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：610
6刘建伟,刘媛,罗雄麟.深度学习研究进展[J].计算机应用研究,2014,31(7):1921-1930. 被引量：291
7王勇,赵俭辉,章登义,叶威.基于稀疏自编码深度神经网络的林火图像分类[J].计算机工程与应用,2014,50(24):173-177. 被引量：34
8尹宝才,王文通,王立春.深度学习研究综述[J].北京工业大学学报,2015,41(1):48-59. 被引量：381
9李阳辉,谢明,易阳.基于降噪自动编码器及其改进模型的微博情感分析[J].计算机应用研究,2017,34(2):373-377. 被引量：12
10郑健,王志明,张宁.一种基于深度学习的改进人脸识别算法[J].计算机与现代化,2018(12):90-95. 被引量：11

共引文献190

1万志军,屠世浩,徐营,张东升,李桂臣,姚强岭,程敬义,张源,郑西贵.智能采矿人才培养定位及课程体系的构建[J].煤炭高等教育,2019,37(5):77-82. 被引量：21
2贾雪芳,李润玮.深度学习与人工智能[J].内江科技,2020(6):78-78.
3赵毅力,李禹成,陈皓.云南野生鸟类图像自动识别系统[J].计算机应用研究,2020,37(S01):423-425. 被引量：5
4龚亮.深度学习法在水文中应用的现状[J].河南水利与南水北调,2020(4):33-34. 被引量：3
5周慧君.顾及环境胁迫反应机制的船舶轨迹预测方法[J].测绘科学,2022,47(9):67-75. 被引量：2
6管士坤,刘宁.人工智能在初次髋膝关节置换手术中的应用进展[J].中华关节外科杂志（电子版）,2022,16(6):766-770.
7欧阳勇,李玉晶.牙本质磷蛋白及其功能研究[J].北京口腔医学,2000,8(1):43-46. 被引量：2
8徐广斌,张伟.DeepEye:一个基于深度学习的程序化交易识别与分类方法[J].大数据,2018,4(5):94-102. 被引量：1
9韩丰,龙明盛,李月安,薛峰,王建民.循环神经网络在雷达临近预报中的应用[J].应用气象学报,2019,30(1):61-69. 被引量：47
10殷晓辉.基于改进K-SVD算法的傅里叶叠层成像识别技术研究[J].生命科学仪器,2018,16(6):46-49.

同被引文献70

1苏敏仪,刘慧思,林海霞,王任小.应用机器学习方法构建药物分子解离速率常数的预测模型[J].物理化学学报,2020,36(1):179-187. 被引量：4
2虞晓芬,傅玳.多指标综合评价方法综述[J].统计与决策,2004,20(11):119-121. 被引量：527
3罗党,刘思峰.灰色关联决策方法研究[J].中国管理科学,2005,13(1):101-106. 被引量：161
4李琳,陈德钊,束志恒,叶子青.基于预处理的决策树在化学数据挖掘中的应用[J].分析化学,2005,33(8):1091-1094. 被引量：2
5刘涛,谌琛.一种利用支持向量机预测蛋白-蛋白结合位点的改进算法[J].中国分子心脏病学杂志,2005,5(2):470-470. 被引量：5
6刘雅琴,王成,章鲁.基于神经网络的乳腺癌生存预测模型[J].中国生物医学工程学报,2009,28(2):221-225. 被引量：5
7白茹,滕奇志,杨晓敏,杨胜勇,向明礼.基于SVM和GA的药物与人血清白蛋白结合的预测[J].计算机工程与应用,2009,45(12):226-228. 被引量：8
8朱永亮,叶祖光.计算毒理学与中药毒性预测的研究进展[J].中国新药杂志,2011,20(24):2424-2429. 被引量：20
9任景,李健,石峰,王昕,何建华,许叶春,张乃霞,熊兵,沈竞康.基于片段的药物发现方法进展[J].药学学报,2013,48(1):14-24. 被引量：3
10汤井田,曹扬,肖嘉莹,郭曲练.基于粒子群优化支持向量机的瑞芬太尼血药浓度预测模型[J].中国药学杂志,2013,48(16):1394-1399. 被引量：7

引证文献12

1颜彩琴,范睿琦,宁雨坪,郭宪,王凯.深度学习模型在中药毒性预警中的应用和前景[J].中国药理学与毒理学杂志,2022,36(3):231-240. 被引量：6
2董奕鑫,张欢欢,王昌会,陈昊,李孝诚.抗乳腺癌候选药物的优化模型[J].高师理科学刊,2022,42(6):30-37.
3何毅,马双宝,孙彪.基于随机森林的ERα生物活性预测研究[J].武汉纺织大学学报,2022,35(4):54-56. 被引量：1
4焦彦宗,王时通,李红硕,徐澍玮.基于Stacking的突发事件微博舆情风险评估及可视化系统[J].工业控制计算机,2022,35(10):88-90. 被引量：1
5许美贤,郑琰,李炎举,吴伟豪.基于PSO-BP神经网络与PSO-SVM的抗乳腺癌药物性质预测[J].南京信息工程大学学报（自然科学版）,2023,15(1):51-65. 被引量：10
6王晓飞,樊学强,李章维.基于迁移学习和多视图特征融合提高RNA碱基相互作用预测[J].计算机科学,2023,50(3):164-172.
7王斯,张国浩,陈义安.基于GWO-KELM与GBDT的抗乳腺癌药物性质预测[J].重庆工商大学学报（自然科学版）,2023,40(6):93-104.
8范春英,张雪敏.自旋霍尔电导与反常霍尔电导材料电导性质预测研究[J].自动化与仪器仪表,2023(11):25-28.
9董磊磊,张鑫,豆东阳,李豹,张崎.基于LightGBM的拖曳系统动力响应预报方法[J].舰船科学技术,2024,46(3):34-40.
10苏洋洋,夏仁杰,王云松,许振军.基于PaDEL分子描述符的气味机器学习识别研究[J].江苏理工学院学报,2024,30(2):5-10.

二级引证文献18

1唐凯临,唐心悦,陈子鲲,闫德宇,吴鑫文,高健,曹志伟.中药信息学研究进展和展望[J].生物医学转化,2022,3(3):74-81. 被引量：1
2汤仕星,曾莹.基于随机森林的抗乳腺癌候选药物的优化[J].湖北工业大学学报,2023,38(1):111-115.
3石霞.基于Stacking融合模型的抗乳腺癌药物活性值预测[J].信息与电脑,2022,34(24):99-102.
4花蕊,朱家明.基于深度神经网络对抗乳腺癌候选药物ERα生物活性的预测[J].陕西理工大学学报（自然科学版）,2023,39(2):47-53.
5王肖成,阮昊,鹏奕锟,李成堃,陈雪.基于随机森林和深度神经网络的药物ADMET性质预测[J].微处理机,2023,44(2):39-43. 被引量：1
6沈磐,孙德志,周维,高月.中药毒性预测研究进展与思考[J].中国药物警戒,2023,20(4):473-479. 被引量：5
7余聪,代洪娜,徐晓亮,孙曌阳,刘兴国.基于SVM-BP神经网络组合模型的高速公路出口流量预测[J].交通节能与环保,2023,19(3):102-107.
8钱文秀,阎星旭,张文青,贾国香,赵珊,宋丽丽,李遇伯.计算机虚拟筛选技术在中药毒性研究中的探索与思考[J].中草药,2023,54(12):4036-4043. 被引量：4
9程虹,梁浩,李文妍,秦丹,王耘.基于拉曼光谱的苦味中药药性辨识方法[J].中华中医药杂志,2023,38(9):4120-4124.
10张襄松,高秀秀.基于随机森林的逻辑回归预测抗乳腺癌药物的ADMET性质[J].内蒙古工业大学学报（自然科学版）,2023,42(6):481-487. 被引量：2

1潘晓艳,单媛媛,卢闻,张杰.“虚拟仿真”及“案例教学”在药物设计教学实践中的探索性应用[J].药学研究,2021,40(8):549-552. 被引量：2
2谢良旭,薛亮亮,李峰.神经网络的深度与宽度对药物分子pKa预测性能影响的研究[J].江苏理工学院学报,2021,27(2):1-8. 被引量：1
3吴晓华,贾若祥.高质量发展建设共同富裕示范区[J].旗帜,2021(8):49-50. 被引量：2
4崔成波.干燥机在聚乙烯醇生产中的作用分析[J].天然气化工—C1化学与化工,2021,46(4):133-136.
5汇川超大功率永磁同步电机首次应用[J].变频器世界,2021(7):17-17.
6蔡正男.南京市体校击剑队男子重剑进攻技术分析[J].体育风尚,2021(9):178-179.
7李亚峰,王洪波,李晨,王富豪,刘勐,罗静静.融合注意力机制的LSTM期货投资策略[J].计算机系统应用,2021,30(8):22-30. 被引量：4
8李青山.新疆某水利水电工程土料的物理化学性质及分散性试验研究[J].陕西水利,2021(8):227-230. 被引量：1
9金灿,刘云龙,霍淑平,吴国民,刘贵锋,孔振武.木质素基多孔炭材料及其在水体净化中的应用研究进展[J].林产化学与工业,2021,41(4):111-123. 被引量：7
10贺依依,姜祎,徐虹,邓翀,张化为,许洪波,宋小妹,刘海静.新型5-脂氧合酶激活蛋白抑制剂的设计、合成及活性评价[J].化学试剂,2021,43(9):1200-1209. 被引量：3

计算机科学

2021年第9期

浏览历史

内容加载中请稍等...

基于融合神经网络模型的药物分子性质预测被引量：12

参考文献3

二级参考文献22

共引文献190

同被引文献70

引证文献12

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

基于融合神经网络模型的药物分子性质预测 被引量：12

参考文献3

二级参考文献22

共引文献190

同被引文献70

引证文献12

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

基于融合神经网络模型的药物分子性质预测被引量：12