-
题名大数据癌症风险预测系统
被引量:5
- 1
-
-
作者
马立伟
曾强
吕秋平
范成烨
程鹏
-
机构
美国英立数据研究中心
北京一网数据研究中心
中国人民解放军总医院
安徽中医药大学第一附属医院
-
出处
《世界复合医学》
2015年第1期63-67,共5页
-
文摘
中国抗癌协会指出:90%的早期癌症没有明显症状,以至于80%的癌症患者确诊时已属于中晚期。如果我们能够早期发现癌症,至少可以挽救上百万人的生命。本研究的主要目的就是借助于大数据价值提取技术,建立一套能够早期预测癌症风险的系统。本研究对486394人,包括40217名癌症患者和446177名健康体检者进行了血常规,血生化和尿常规数据的分析预测,预测分析数据共计48项。显著性分析和预测模型的统计方法为逻辑分析法和判别分析法,显著性检验标准为p<0.05。预测分析使用的统计软件为SAS,预测分析所用数据均来自MS SQL数据库。研究结果显示血常规,血生化和尿常规数据可以用来区分癌症患者和健康者,基于血常规,血生化和尿常规数据的癌症风险预测模型可以精准锁定高风险癌症人群,准确率达95.5%。癌症风险预测模型建成后,经过2014年1—7月9931名癌症患者和110077名健康体检者数据的验证,准确率超过95%。本研究证明血常规,血生化和尿常规数据可以用来早期预测癌症的风险。
-
关键词
大数据
早期预测癌症
血常规
血生化
尿常规
-
Keywords
big data
early cancer prediction
blood chemistry
urinalysis
-
分类号
R73
[医药卫生—肿瘤]
-