为应对基于游戏的学习平台在知识追踪应用方面的不足,本研究利用Field Day Lab提供的教育游戏用户日志进行深入分析。采用方差法和Null Importance方法对数据集进行降维处理,并结合K折交叉验证与LightGBM算法,建立了一个高效的预测模型...为应对基于游戏的学习平台在知识追踪应用方面的不足,本研究利用Field Day Lab提供的教育游戏用户日志进行深入分析。采用方差法和Null Importance方法对数据集进行降维处理,并结合K折交叉验证与LightGBM算法,建立了一个高效的预测模型。此外,通过集成Logistic模型,构建起Stacking模型。研究表明,该模型在验证集上的Macro-F1值显著提升至0.699,同时也在测试集上显示出优异的泛化能力。本研究为教育游戏领域的知识追踪提供了创新方法,并为游戏开发与教育实践提供了宝贵参考,支持教育游戏的开发者为学生创造更有效的学习体验。展开更多
随着中国新能源汽车的兴起,关于汽车保险诈骗的问题日益突出。为了对保险诈骗行为进行有效识别,本文基于机器学习的相关理论,利用模拟退火算法调参的Stacking融合模型对保险欺诈进行预测。首先,利用随机森林和XGBoost算法筛选得到两个...随着中国新能源汽车的兴起,关于汽车保险诈骗的问题日益突出。为了对保险诈骗行为进行有效识别,本文基于机器学习的相关理论,利用模拟退火算法调参的Stacking融合模型对保险欺诈进行预测。首先,利用随机森林和XGBoost算法筛选得到两个不同特征的训练数据集,然后通过差异化的数据来优化Stacking模型的预测能力,并利用交叉验证法得到最优模型,其准确率为87.43%。实证分析表明,相较于未使用差异化数据的Stacking模型,本文所建的融合模型对汽车保险欺诈行为有更高的识别能力。With the rise of new energy vehicles in China, the issue of car insurance fraud has become increasingly prominent. In order to effectively identify fraudulent insurance activities, this study employs the Stacking ensemble model, optimized using simulated annealing algorithm tuning based on machine learning theories, to predict insurance fraud. Initially, utilizing the Random Forest and XGBoost algorithms, two distinct feature sets are selected to construct training datasets. Subsequently, by employing differentiated data, the predictive capability of the Stacking model is enhanced. Through cross-validation, the optimal model is obtained and its accuracy is 87.43%. Empirical analysis shows that compared to the Stacking model without differentiated data, the ensemble model developed in this study exhibits superior capability in identifying fraudulent behaviors in car insurance.展开更多
文摘为应对基于游戏的学习平台在知识追踪应用方面的不足,本研究利用Field Day Lab提供的教育游戏用户日志进行深入分析。采用方差法和Null Importance方法对数据集进行降维处理,并结合K折交叉验证与LightGBM算法,建立了一个高效的预测模型。此外,通过集成Logistic模型,构建起Stacking模型。研究表明,该模型在验证集上的Macro-F1值显著提升至0.699,同时也在测试集上显示出优异的泛化能力。本研究为教育游戏领域的知识追踪提供了创新方法,并为游戏开发与教育实践提供了宝贵参考,支持教育游戏的开发者为学生创造更有效的学习体验。
文摘随着中国新能源汽车的兴起,关于汽车保险诈骗的问题日益突出。为了对保险诈骗行为进行有效识别,本文基于机器学习的相关理论,利用模拟退火算法调参的Stacking融合模型对保险欺诈进行预测。首先,利用随机森林和XGBoost算法筛选得到两个不同特征的训练数据集,然后通过差异化的数据来优化Stacking模型的预测能力,并利用交叉验证法得到最优模型,其准确率为87.43%。实证分析表明,相较于未使用差异化数据的Stacking模型,本文所建的融合模型对汽车保险欺诈行为有更高的识别能力。With the rise of new energy vehicles in China, the issue of car insurance fraud has become increasingly prominent. In order to effectively identify fraudulent insurance activities, this study employs the Stacking ensemble model, optimized using simulated annealing algorithm tuning based on machine learning theories, to predict insurance fraud. Initially, utilizing the Random Forest and XGBoost algorithms, two distinct feature sets are selected to construct training datasets. Subsequently, by employing differentiated data, the predictive capability of the Stacking model is enhanced. Through cross-validation, the optimal model is obtained and its accuracy is 87.43%. Empirical analysis shows that compared to the Stacking model without differentiated data, the ensemble model developed in this study exhibits superior capability in identifying fraudulent behaviors in car insurance.