摘要
以内蒙古某旗县蒙古族农牧民高血压患者数据为例,使用Python程序设计语言,实现非结构化文本数据的分词与统计以及高血压大数据的可视化分析处理,并通过KNN、朴素贝叶斯算法、随机森林分类等机器学习算法对病例数据分别训练,并对诊断结果进行预测,找出适合此数据集的机器学习预测模型,为高血压的预防、诊断、治疗提供辅助决策。同时,提出了针对其他慢病大数据分析的建议方案。
This paper takes the hypertension patient data of Mongolian farmers and herdsmen in a county in Inner Mongolia as an example,Python programming language is used to realize word segmentation and statistics of unstructured text data and visual analysis and processing of hypertension big data.KNN,Naive Bayes algorithm,random forest classification and other machine learning algorithms were used to train the case data respectively,and to predict the diagnosis results,to find out the machine learning prediction model suitable for this data set,and to provide auxiliary decision-making for the prevention,diagnosis and treatment of hypertension.At the same time,this paper puts forward some suggestions for big data analysis of other chronic diseases.
作者
王晓东
王超
左风云
赵慧茹
马立晨
张宇鹏
吴雅琴
WANG Xiao-dong;WANG Chao;ZUO Feng-yun(School of Computer Information,Inner Mongolia Medical University,Hohhot 010110,the Inner Mongolia Autonomous Region,P.R.C.)
出处
《中国数字医学》
2019年第11期24-28,共5页
China Digital Medicine
基金
2018年内蒙古自治区高等学校在线开放课程项目-大数据背景下的智慧医院(编号:RC1900003751)
2017年度内蒙古医科大学本科教学质量工程项目-内蒙古医科大学优秀教学团队(本科)(编号:NYJXTD201702)
2018年度内蒙古医科大学本科教学质量工程项目-内蒙古医科大学第八届高等学校教坛新秀奖(本科)项目(编号:NYJTXX201803)
2019年度内蒙古医科大学本科教学质量工程项目-《医学信息系统》精品资源共享课(编号:NYJPZYGXK201905)~~
关键词
高血压
蒙古族农牧民
非结构化文本
分词
数据可视化
机器学习算法
high blood pressure
Mongolian farmers and herdsmen
unstructured text
participles
data visualization
machine learning algorithm