-
题名面向智慧康养的数据集构建方法及其应用
- 1
-
-
作者
张麟宇
涂志莹
杭少石
张柏林
初佃辉
-
机构
哈尔滨工业大学计算机科学与技术学院
-
出处
《计算机科学与探索》
CSCD
北大核心
2022年第7期1543-1551,共9页
-
基金
国家重点研发计划(2018YFB1004800)
国家自然科学基金(61772159)
山东省自然科学基金(ZR2017MF026)。
-
文摘
互联网和计算机技术的快速发展,使得在人口老龄化的今天发展智慧康养服务成为可能。然而,养老领域的数据问题严重地制约着该领域的智慧化进程。真实数据的缺失、脏数据的干扰以及标准样本过少等问题层出不穷。针对数据集缺失问题,在收集了某市社区康养的小样本数据基础上,提出了一种基于机器学习的三阶段数据生成模型:第一阶段,使用基于树形结构的生成策略,按照原始数据的分布生成了数据集的基础属性;第二阶段,使用朴素贝叶斯算法生成样本的基础行为能力评估指标;第三阶段,在前两个阶段的基础上采用多元线性回归的方法生成高阶行为能力指标以及评估阶段。此外,为验证该模型生成的数据集对下游任务的有效性,在生成数据基础上,利用神经网络设计多个康复训练计划推荐模型,实现5个多分类任务和2个多标签分类任务。通过对实验结果的分析以及专家知识的注入,验证了生成数据的真实性和有效性。
-
关键词
智慧康养服务
小样本数据
朴素贝叶斯
多元线性回归
-
Keywords
smart health care service
small sample data
naive Bayes
multiple linear regression
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-