-
题名基于混合特征选择的中小学生近视影响因素及预测分析
- 1
-
-
作者
邢蒙
李红梅
张雪
王铭
李依霏
-
机构
西安市新城区疾病预防控制中心学校卫生科
西安市新城区疾病预防控制中心传染病控制科
-
出处
《预防医学论坛》
2024年第5期362-367,共6页
-
文摘
目的 建立近视预测模型,分析西安市新城区中小学生近视影响因素,为制定学生近视防控策略以及干预措施的实施提供科学依据。方法 基于2022年陕西省学生常见病监测项目,使用5 m标准对数视力表进行视力检查,并用台式电脑验光仪对学生眼睛进行屈光度检测。将参与视力筛查及填写调查问卷的2 511名学生纳入研究,分别使用支持向量机递归特征消除(SVM-RFE)、基于交叉验证的最小绝对收缩和选择算子回归(LASSOCV)、χ^(2)检验-SelectKBest、决策树-SelectFromModel、互信息法用于近视影响因素的筛选,将筛选出的变量分别纳入多因素logistic回归和5种分类预测模型,进行近视发生风险预测。结果 共检出近视1 780名,近视率为70.89%(1 780/2 511),男生近视率为69.24%(833/1 203)、女生近视率为72.4%(947/1 203)。小学、初中、高中和职高学生近视率分别为54.69%(560/1 024)、78.96%(473/599)、84.12%(747/888)。所有变量在5种特征选择方法前15名中出现3次及以上的共17个。5种特征选择方法中,5种均选择了年龄、父母是否近视;4种选择了父母是否提醒注意读写姿势,读写时胸口离桌子边沿超过一拳,参加英语、数学、写作等文化类补习班时间。logistic回归结果显示,年龄(O R=1.329,95%CI:1.286~1.373,P<0.001)、父母近视情况(父母一方近视O R=1.808,95%C I:1.453~2.251,P<0.0001;父母均近视O R=3.566,95%CI:2.691~4.726,P<0.001)、父母提醒注意读写姿势(O R=1.349,95%CI:1.092~1.666,P=0.006)、课间休息时在户外活动(O R=0.774,95%CI:0.636~0.943,P=0.011)、看电视时眼睛距离电视显示屏超过3 m(经常或总是O R=0.792,95%CI:0.589~1.064,P=0.122;从不或者偶尔O R=1.099,95%CI:0.835~1.445,P=0.501)、平均每天放学后做作业读书时间(O R=1.342,95%CI:1.105~1.631,P=0.003)是近视发生的影响因素。5种模型预测结果显示,各模型变量筛选后性能均优于变量筛选前。变量筛选后的SVM-RBF取得了最优的分类性能[受试者工作特征曲线下面积(AUC)=0.73,准确度(accuracy)=0.72,f1值(f1-score)=0.74,精确度(precision)=0.78,召回值(recall)=0.72],其次为变量筛选后的SVM-POLY(AUC=0.73,accuracy=0.71,f1-score=0.73,precision=0.78,recall=0.71),说明并不是纳入的变量越多、模型的预测性能越好。结论 学生近视率随着年龄、学段增长而快速增长,也与随着年级增长学生课业负担增加及使用手机等电子产品时间增加有关。
-
关键词
中小学生
近视
风险预测
混合特征选择
机器学习
-
Keywords
Primary and secondary school students
Myopia
Risk prediction
Hybrid feature selection
Machine learning
-
分类号
R778.11
[医药卫生—眼科]
G478
[文化科学—教育技术学]
-