基于多数据源与机器学习的药物副作用预测被引量：1

Prediction of Drug Side Effects Based on Multiple Data Sources and Machine Learning

下载PDF

导出

摘要药物不良反应是疾病治疗过程中一个非常重要的考虑因素,为了指导医生有效避免或减少药物不良反应,提出一种基于多数据源与机器学习的药物副作用预测方法,将患病前后和用药前后基因的表达量变化情况作为解释变量,利用随机森林算法对药物副作用进行预测,发现使用随机森林算法针对5种副作用的测试结果都优于传统的K近邻算法,其中副作用皮疹的测试准确率达到90.24%,相比K近邻算法提升了31.70%。结果表明,利用基因表达量变化情况这一特征可以很好地预测药物副作用,同时也说明副作用的发生和基因表达量变化情况具有很强的相关性。 Adverse drug reactions(ADRs)is a very important factor in the treatment of diseases.In order to guide doctors to effectively avoid or reduce the occurrence of ADRs,we propose a drug side effect prediction method based on multiple data sources and machine learning.We use random forest algorithm to predict drug side effects by taking the changes in gene expression before and after disease and medication as explanatory variables.We found that the random forest algorithm was superior to the previous KNN algorithm in the tests of five side effects,among which the accuracy of side effect rash testreached 90.24%,which was 31.70%higher than the KNN algorithm.The results of the model show that the variation of gene expression can be used to predict the side effects of drugs,and that the occurrence of side effects has a strong correlation with the variation of gene expression.

作者杜瑶 DU Yao(Business School,University of Shanghai for Science and Technology,Shanghai 200093,China)

机构地区上海理工大学管理学院

出处《软件导刊》 2021年第5期39-43,共5页 Software Guide

关键词副作用预测基因表达机器学习多数据源 side effect prediction gene expression machine learning multiple data sources

分类号 TP306 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献4

1方匡南,吴见彬,朱建平,谢邦昌.随机森林方法研究综述[J].统计与信息论坛,2011,26(3):32-38. 被引量：681
2朱永先.基于Stacking算法与多数据源的有效药物组合[J].软件导刊,2020,19(2):100-104. 被引量：4
3唐华松,姚耀文.数据挖掘中决策树算法的探讨[J].计算机应用研究,2001,18(8):18-19. 被引量：121
4邓维斌,王国胤,王燕.基于Rough Set的加权朴素贝叶斯分类算法[J].计算机科学,2007,34(2):204-206. 被引量：43

二级参考文献56

1刘微,罗林开,王华珍.基于随机森林的基金重仓股预测[J].福州大学学报（自然科学版）,2008,36(S1):134-139. 被引量：8
2王双成,苑森淼.具有丢失数据的贝叶斯网络结构学习研究[J].软件学报,2004,15(7):1042-1048. 被引量：62
3林成德,彭国兰.随机森林在企业信用评估指标体系确定中的应用[J].厦门大学学报（自然科学版）,2007,46(2):199-203. 被引量：37
4王仲谋，数据仓库—客户/服务器计算指南，1997年
5Cooper G. Computational complexity of probablitisitie inference using Bayesian belief networks. Artificial Intelligence, 1990,42:393-405
6Friedman N,GeigerD, Goldszmidt M. Bayesian network Classifiers. Maching Learnig, 1997, 29:131-163
7Chickering D M. Learning Bayesian networks is NP-complete[A].Leamingfrom Data:AI and Statistics V[M]. New York: Springer, 1996. 121-130
8Harry Z, Sheng S. Learning Weighted Naive Bayes with Accurate Ranking. In: Fourth IEEE International Conference on Data Mining (ICDM'04), 2004. 567-570
9Pawlak Z. Rough set. International Journal oI Computer and Information Sciences, 1982,11(5):341-356
10Wang Guoyin, Zhao Jun, An Jiujiang, Wu Yu. A Comparative Study of Algebra Viewpoint and Information Viewpoint in Attribute Reduction,Fundamenta Informaticae, 2005, 68(3): 289-301

共引文献844

1郑伟,戴伊宁,孙楠楠,尹乔乔,吴青青,惠田辰,吴文昊,黄海军,童永喜,黄益澄,汪明珊,陈美娟,张家杰,严蓉,高海女,潘红英.应用随机森林模型和Logistic回归模型分析COVID-19的影响因素[J].预防医学,2021,33(7):722-725. 被引量：1
2袁鸷慧,聂胜,张合兵,王成,王宏涛,习晓环.GEDI地面高程和森林冠层高度的精度评价与影响分析[J].遥感技术与应用,2022,37(5):1056-1070. 被引量：2
3谢春,许伟.基于随机森林回归算法的锅炉沾污因数预测方法[J].上海电气技术,2022,15(1):29-32. 被引量：1
4王仁超,朱品光.基于随机森林回归方法的爆破块度预测模型研究[J].水力发电学报,2020,39(1):89-101. 被引量：23
5杨龙,王闻娟,覃哲,古悦璇.中国大学生气候认知与低碳行为及其影响因素研究——基于随机森林模型分析[J].文化与传播,2022,11(2):6-15. 被引量：1
6饶贵川,王雅楠,华伟平,林维晟,潘俊忠,廖佩莹.环境因子对人工森林蓄积量影响的机器学习分析[J].林业科技通讯,2023(12):58-63.
7王治忠,闫文明,王松伟.基于鸽子视顶盖神经元响应对不同颜色背景字符图像的重建研究[J].计算机应用研究,2020,37(1):308-312.
8宋华丽,陈欣影,王鹏,初军玲,丛源.基于随机森林的江淮各省会城市夏季降水量预报对比分析[J].湖北农业科学,2019,58(S02):190-197.
9李一民,谭振宇,杨辰,何峰,孟迪,罗菊花,段洪涛.基于多源卫星的滇池藻华提取机器学习算法研究[J].地球科学进展,2022,37(11):1141-1156. 被引量：6
10劳钰钞,刘秀峰,杨锦礼,蒋志.基于随机森林构建集装箱堆存时间预测分类器的港口翻箱研究[J].装备制造技术,2022(2):209-212.

同被引文献4

1马远浩,曾卫明,石玉虎,徐鹏.基于加权词向量和LSTM-CNN的微博文本分类研究[J].现代计算机,2018,24(17):18-22. 被引量：8
2鞠芳,唐辉,陈学亮,王岱峥.试析基于机器学习的文本分类[J].电脑编程技巧与维护,2018(11):36-39. 被引量：4
3姚路.中文分词算法在地址标准化清洗中的应用[J].中国高新科技,2020(20):126-128. 被引量：2
4崔洁.基于加权word2vec算法的文本相似度研究[J].电子测试,2021,32(21):53-55. 被引量：9

引证文献1

1沈雅婷,徐志豪.随机森林在中文图书分类中的应用和改进[J].电脑与电信,2022(8):8-14.

1蒋强.艾滋病伴发结核性脑膜炎检测中对CD4与ADA指标的应用[J].中国处方药,2020,18(6):188-189. 被引量：1

软件导刊

2021年第5期

浏览历史

内容加载中请稍等...

基于多数据源与机器学习的药物副作用预测被引量：1

参考文献4

二级参考文献56

共引文献844

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多数据源与机器学习的药物副作用预测 被引量：1

参考文献4

二级参考文献56

共引文献844

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多数据源与机器学习的药物副作用预测被引量：1