样本有限的表格型数据缺乏不变性结构和足够样本,使得传统数据增强方法和生成式数据增强方法难以获得符合原始数据分布且具有多样性的数据.为此,文中依据表格型数据的特点和邻域风险最小化原则,提出基于邻域分布的去噪扩散概率模型(Vici...样本有限的表格型数据缺乏不变性结构和足够样本,使得传统数据增强方法和生成式数据增强方法难以获得符合原始数据分布且具有多样性的数据.为此,文中依据表格型数据的特点和邻域风险最小化原则,提出基于邻域分布的去噪扩散概率模型(Vicinal Distribution Based Denoising Diffusion Probabilistic Model,VD-DDPM)及相应算法.首先,分析样本有限表格型数据的特征,通过先验知识选择弱相关特征,并构建样本的邻域分布.然后,利用邻域分布采样数据构建VD-DDPM模型,并使用VD-DDPM数据生成算法生成符合原始数据分布且具有多样性的数据集.在多个数据集上针对数据生成质量、下游模型性能等进行实验,验证VD-DDPM的有效性.展开更多
针对传统数值预报模式计算时间长和计算资源消耗大的问题,以及现有深度学习预报方法在温度预报结果上不精确,且预测结果模糊的问题,提出了一个新的温度预报模型。首先,设计了一个时空信息捕捉模块,将该模块捕获的长期依赖信息,作为扩散...针对传统数值预报模式计算时间长和计算资源消耗大的问题,以及现有深度学习预报方法在温度预报结果上不精确,且预测结果模糊的问题,提出了一个新的温度预报模型。首先,设计了一个时空信息捕捉模块,将该模块捕获的长期依赖信息,作为扩散模型的生成条件,赋予扩散模型预报的能力;其次,设计了一个新的平衡损失函数,同时保护了扩散模型的生成能力和时空信息捕捉模块对时空信息的捕捉能力;最后,基于美国国家环境预报中心的再分析数据进行预报,与现有的深度学习方法相比,所提模型预报结果的质量在均方误差(mean square error,MSE)上降低了17.3%,在均方根误差(root mean square error,RMSE)上降低了9.14%,在峰值信噪比(peak signal to noise ratio,PSNR)上提升了5.1%。改进的扩散模型能有效地捕捉时空依赖的关系,有效地进行时空序列预测,效果优于其他对比方法。展开更多
文摘样本有限的表格型数据缺乏不变性结构和足够样本,使得传统数据增强方法和生成式数据增强方法难以获得符合原始数据分布且具有多样性的数据.为此,文中依据表格型数据的特点和邻域风险最小化原则,提出基于邻域分布的去噪扩散概率模型(Vicinal Distribution Based Denoising Diffusion Probabilistic Model,VD-DDPM)及相应算法.首先,分析样本有限表格型数据的特征,通过先验知识选择弱相关特征,并构建样本的邻域分布.然后,利用邻域分布采样数据构建VD-DDPM模型,并使用VD-DDPM数据生成算法生成符合原始数据分布且具有多样性的数据集.在多个数据集上针对数据生成质量、下游模型性能等进行实验,验证VD-DDPM的有效性.
文摘针对传统数值预报模式计算时间长和计算资源消耗大的问题,以及现有深度学习预报方法在温度预报结果上不精确,且预测结果模糊的问题,提出了一个新的温度预报模型。首先,设计了一个时空信息捕捉模块,将该模块捕获的长期依赖信息,作为扩散模型的生成条件,赋予扩散模型预报的能力;其次,设计了一个新的平衡损失函数,同时保护了扩散模型的生成能力和时空信息捕捉模块对时空信息的捕捉能力;最后,基于美国国家环境预报中心的再分析数据进行预报,与现有的深度学习方法相比,所提模型预报结果的质量在均方误差(mean square error,MSE)上降低了17.3%,在均方根误差(root mean square error,RMSE)上降低了9.14%,在峰值信噪比(peak signal to noise ratio,PSNR)上提升了5.1%。改进的扩散模型能有效地捕捉时空依赖的关系,有效地进行时空序列预测,效果优于其他对比方法。