样本有限的表格型数据缺乏不变性结构和足够样本,使得传统数据增强方法和生成式数据增强方法难以获得符合原始数据分布且具有多样性的数据.为此,文中依据表格型数据的特点和邻域风险最小化原则,提出基于邻域分布的去噪扩散概率模型(Vici...样本有限的表格型数据缺乏不变性结构和足够样本,使得传统数据增强方法和生成式数据增强方法难以获得符合原始数据分布且具有多样性的数据.为此,文中依据表格型数据的特点和邻域风险最小化原则,提出基于邻域分布的去噪扩散概率模型(Vicinal Distribution Based Denoising Diffusion Probabilistic Model,VD-DDPM)及相应算法.首先,分析样本有限表格型数据的特征,通过先验知识选择弱相关特征,并构建样本的邻域分布.然后,利用邻域分布采样数据构建VD-DDPM模型,并使用VD-DDPM数据生成算法生成符合原始数据分布且具有多样性的数据集.在多个数据集上针对数据生成质量、下游模型性能等进行实验,验证VD-DDPM的有效性.展开更多
为了使差分进化算法(differential evolution,DE)能够更好地利用个体邻域和整个种群的信息,提出了邻域精英信息和种群全局信息自适应的多策略差分进化算法(adaptive multi-strategy differential evolution algorithm for neighborhood ...为了使差分进化算法(differential evolution,DE)能够更好地利用个体邻域和整个种群的信息,提出了邻域精英信息和种群全局信息自适应的多策略差分进化算法(adaptive multi-strategy differential evolution algorithm for neighborhood elite collective information and population global information,MSDE-NECPG)。首先,充分利用个体邻域中多个精英个体的信息对变异策略进行引导,使搜索向更好的方向移动,提高开发能力。其次,为了让邻域的状态能够随着搜索过程不断地进化,引入邻域更新机制。当邻域最优个体连续多代更新失败,邻域可能陷入局部最优,此时扩大邻域半径,提高探索能力。同时,引入变异策略“DE/current-to-pbest”,这一策略不划分邻域,是基于种群的全局信息。两个策略基于个体的改进率进行多策略的自适应,在局部信息和全局信息之间进行平衡。此外,为了防止参数的错误交互,缩放因子F、交叉率CR根据成功历史积累进行更新,采用分组的参数自适应机制,不断适应搜索过程。最后,为了验证其有效性,在CEC2014的30个基准函数上,与5种迄今为止比较先进的差分进化算法进行比较,实验结果表明,所提算法的精度、稳定性和收敛速度比得上这5种先进的算法。展开更多
文摘样本有限的表格型数据缺乏不变性结构和足够样本,使得传统数据增强方法和生成式数据增强方法难以获得符合原始数据分布且具有多样性的数据.为此,文中依据表格型数据的特点和邻域风险最小化原则,提出基于邻域分布的去噪扩散概率模型(Vicinal Distribution Based Denoising Diffusion Probabilistic Model,VD-DDPM)及相应算法.首先,分析样本有限表格型数据的特征,通过先验知识选择弱相关特征,并构建样本的邻域分布.然后,利用邻域分布采样数据构建VD-DDPM模型,并使用VD-DDPM数据生成算法生成符合原始数据分布且具有多样性的数据集.在多个数据集上针对数据生成质量、下游模型性能等进行实验,验证VD-DDPM的有效性.
文摘为了使差分进化算法(differential evolution,DE)能够更好地利用个体邻域和整个种群的信息,提出了邻域精英信息和种群全局信息自适应的多策略差分进化算法(adaptive multi-strategy differential evolution algorithm for neighborhood elite collective information and population global information,MSDE-NECPG)。首先,充分利用个体邻域中多个精英个体的信息对变异策略进行引导,使搜索向更好的方向移动,提高开发能力。其次,为了让邻域的状态能够随着搜索过程不断地进化,引入邻域更新机制。当邻域最优个体连续多代更新失败,邻域可能陷入局部最优,此时扩大邻域半径,提高探索能力。同时,引入变异策略“DE/current-to-pbest”,这一策略不划分邻域,是基于种群的全局信息。两个策略基于个体的改进率进行多策略的自适应,在局部信息和全局信息之间进行平衡。此外,为了防止参数的错误交互,缩放因子F、交叉率CR根据成功历史积累进行更新,采用分组的参数自适应机制,不断适应搜索过程。最后,为了验证其有效性,在CEC2014的30个基准函数上,与5种迄今为止比较先进的差分进化算法进行比较,实验结果表明,所提算法的精度、稳定性和收敛速度比得上这5种先进的算法。