摘要
目的探索基于深度学习模型联合正则化方法在小样本高维数据特征筛选中的优势。方法通过模拟实验和实际数据分析比较深度学习模型单独及联合正则化方法在小样本高维特征筛选准确性方面的差异;采用测试集中C指数作为两种模型泛化能力评价指标。结果在小样本研究中单纯的深度学习模型在变量之间存在复杂相关性时会表现过拟合,而深度学习模型联合正则化的方法比单独的深度学习模型在测试集中体现出防止过拟合的作用,具有更好的泛化能力。通过比较不同正则化的方法,发现深度学习联合组lasso相比于lasso在测试集中表现出更好的泛化能力。结论深度学习模型联合正则化的方法在小样本高维数据特征筛选中可以防止过拟合,保证外部测试具有较好的预测效果。
出处
《中国卫生统计》
CSCD
北大核心
2021年第1期73-75,80,共4页
Chinese Journal of Health Statistics
基金
国家自然科学基金资助(81773550,81773551)
黑龙江省留学归国择优资助经费。