-
题名数据流下部分线性模型的在线估计
- 1
-
-
作者
卢果林
-
机构
中国科学技术大学人工智能与数据科学学院
-
出处
《计算机系统应用》
2024年第10期152-162,共11页
-
文摘
部分线性模型作为一种重要的半参数回归模型,因其在复杂数据结构分析中表现出的灵活适应性,广泛应用于各领域.然而,在大数据背景下,该模型的研究和应用面临着多重挑战,其中最为关键的难点在于计算速度和数据存储.本文针对以数据块形式连续观测的数据流场景,提出一种在线估计的计算方法,用于估计部分线性模型中线性部分的参数和非线性部分的未知函数.该方法仅需利用当前数据块和之前计算过的汇总统计量即可实现实时估算.数值模拟从两个角度进行验证有效性:分别改变数据流的单位数据块大小和总样本规模,以比较在线估计方法和传统估计方法的偏差、标准误差以及均方误差.实验表明,与传统方法相比,本文的方法具有快速计算和无需重新访问历史数据的优势,同时在均方误差方面接近传统方法.最后,基于中国综合社会调查(CGSS)数据,本文应用在线估计方法分析我国劳动年龄人口生活质量的影响因素,得出周工作时间在30–60 h范围内的全职工作对提升生活质量具有积极作用的结论,为相关政策制定提供了一定参考价值.
-
关键词
在线估计
部分线性模型
核回归
大数据
数据压缩
-
Keywords
online estimation
partially linear model
kernel regression
big data
data compression
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-