时间序列插补旨在根据现有数据填补缺失值以恢复数据的完整性.目前基于RNN的插补方法存在较大的误差,并且增加网络层数容易出现梯度爆炸和消失问题,而基于GAN和VAE的插补方法经常面临训练困难和模式崩溃的挑战.为解决上述问题,本文提出...时间序列插补旨在根据现有数据填补缺失值以恢复数据的完整性.目前基于RNN的插补方法存在较大的误差,并且增加网络层数容易出现梯度爆炸和消失问题,而基于GAN和VAE的插补方法经常面临训练困难和模式崩溃的挑战.为解决上述问题,本文提出了一种基于扩散与时频注意力的时间序列插补模型DTFA (diffusion model and time-frequency attention),通过反向扩散实现从高斯噪声中重建缺失数据.具体而言,本研究利用多尺度卷积模块与二维注意力机制捕获时域数据中的时间依赖性,并利用MLP与二维注意力机制学习频域数据的实部与虚部信息.此外,本研究通过线性插补模块以对现有的观测数据进行初步的数据增强,从而更好地指导模型的插补过程.最后,本研究通过最小化真实噪声与估计噪声的欧氏距离来训练噪声估计网络,并利用反向扩散实现对时序数据的缺失插补.本研究的实验结果表明, DTFA在ETTm1、WindPower和Electricity这3个公开数据集上的插补效果均优于近年主流的基线模型.展开更多
文摘时间序列插补旨在根据现有数据填补缺失值以恢复数据的完整性.目前基于RNN的插补方法存在较大的误差,并且增加网络层数容易出现梯度爆炸和消失问题,而基于GAN和VAE的插补方法经常面临训练困难和模式崩溃的挑战.为解决上述问题,本文提出了一种基于扩散与时频注意力的时间序列插补模型DTFA (diffusion model and time-frequency attention),通过反向扩散实现从高斯噪声中重建缺失数据.具体而言,本研究利用多尺度卷积模块与二维注意力机制捕获时域数据中的时间依赖性,并利用MLP与二维注意力机制学习频域数据的实部与虚部信息.此外,本研究通过线性插补模块以对现有的观测数据进行初步的数据增强,从而更好地指导模型的插补过程.最后,本研究通过最小化真实噪声与估计噪声的欧氏距离来训练噪声估计网络,并利用反向扩散实现对时序数据的缺失插补.本研究的实验结果表明, DTFA在ETTm1、WindPower和Electricity这3个公开数据集上的插补效果均优于近年主流的基线模型.