-
题名基于体检大数据的健康指数建模
被引量:1
- 1
-
-
作者
谢昌锟
赵明琪
林世明
-
机构
厦门大学信息学院(国家示范性软件学院)
厦门大学数学科学学院
-
出处
《数据挖掘》
2021年第1期1-10,共10页
-
文摘
近年来,随着健康医疗大数据平台的快速发展,越来越多的体检数据整合到大数据平台上。如何挖掘并利用健康医疗海量数据提高医疗服务质量,提升医患沟通水平是一个全新的挑战。文中应用机器学习算法对45,374个体检用户,共3,529,829条体检数据进行分析数据的探索性分析和特征工程。在个人信用风险评分模型的基础上,将预测模型由梯度集成决策树改进为LASSO回归模型,增加评分卡的可解释性,同时结合体检的应用场景和输入数据,建立体检评分模型。实验结果表明在体检大数据集上,健康指数分数基本上服从正态分布,符合线性回归模型的先验假设。该评分模型同时具有稳健性和区分度的特点,可综合各项体检指标,较为客观地描述用户身体健康状况水平,降低体检用户同医生的沟通成本,督促用户更加关注身体整体健康状况水平。
-
关键词
机器学习
数据探索
LASSO回归
评分卡
健康指数
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于稳定度的异常商品识别模型研究与实现
- 2
-
-
作者
马飞燕
赵李娟
林世明
李芳
-
机构
昌吉学院信息工程学院
厦门大学信息学院(国家示范性软件学院)电子信息国家级实验教学示范中心
-
出处
《数据挖掘》
2023年第3期244-253,共10页
-
文摘
随着经济的发展,网购现已得到全方位的普及,因其有方便快捷、省时省力、送货上门等优点,越来越受到人们的青睐,成为日常生活中不可或缺的一部分。随着人们经济能力、消费水平的提高,对网购体验的需求也愈发上涨。同时网上各大零售业务间的竞争也愈发激烈,为了能够吸引消费者的目光以增加商品的销量,某些商家开始采用刷销量、刷好评、删差评等“炒信”“刷单”手段对商品进行恶意推广,侵犯消费者权益。为保障消费者的知情权和选择权,本项目通过浪潮卓数公司提供的数据集,通过数据挖掘定量分析和定性分析结合的方法来剖析商品出现异常的原因,采用数学建模和机器学习的方法,定义部分异常商品指标,并利用这些指标构建出查找和预测异常商品的模型。实验结果表明该模型效果较好,具有一定的实用性。
-
关键词
消费水平
零售业务
消费者权益
数据挖掘
识别模型
数学建模
定性分析
差评
-
分类号
F42
[经济管理—产业经济]
-