在茶园水资源管理中,蒸散量(Evapotranspiration,ET)是评估作物水分需求的关键指标,由于茶园蒸散量预测具有时序性、不稳定性以及非线性耦合等特点,目前的茶园蒸散量预测模型存在预测精度较低的问题,针对此问题本文提出了一种新型的茶...在茶园水资源管理中,蒸散量(Evapotranspiration,ET)是评估作物水分需求的关键指标,由于茶园蒸散量预测具有时序性、不稳定性以及非线性耦合等特点,目前的茶园蒸散量预测模型存在预测精度较低的问题,针对此问题本文提出了一种新型的茶园蒸散量预测模型。首先使用互信息算法(Mutual information,MI)与主成分分析算法(Principal component analysis,PCA)相融合的数据处理算法(MIPCA),筛选强相关的特征并提取主成分;其次将时域卷积网络(Temporal convolutional network,TCN)与Transformer融合,利用灰狼算法(Grey wolf optimization,GWO)优化超参数,捕捉茶园数据的全局依赖关系;最后整合2个网络构建了MIPCA-TCN-GWO-Transformer模型,通过消融试验和对比试验验证了模型性能,并对模型在不同时间步长下的性能进行测试。结果表明,该模型平均绝对百分比误差(Mean absolute percentage error,MAPE)、均方根误差(Root mean square error,RMSE)和决定系数(Coefficient of determination,R^(2))3个评价指标分别为0.015 mm/d、0.312 mm/d和0.962,优于长短期记忆模型(Long short term memory,LSTM)等传统预测模型。在小时尺度、日尺度和月尺度下的R^(2)分别为0.986、0.978和0.946,在不同时间步长下展现了良好的适应性和准确性。本文构建的MIPCA-TCN-GWO-Transformer模型具有较高的预测精度和稳定性,可为茶园水资源优化管理和灌溉制度制定提供科学参考。展开更多
针对步态识别易受拍摄视角、外观变化等影响的问题,提出一种基于双支路卷积网络的步态识别方法。首先,提出随机裁剪随机遮挡的数据增强方法RRDA(Restricted Random Data Augmentation),以扩展外观变化的数据样本,提高模型遮挡的鲁棒性;...针对步态识别易受拍摄视角、外观变化等影响的问题,提出一种基于双支路卷积网络的步态识别方法。首先,提出随机裁剪随机遮挡的数据增强方法RRDA(Restricted Random Data Augmentation),以扩展外观变化的数据样本,提高模型遮挡的鲁棒性;其次,采用结合注意力机制的两路复合卷积层(C-Conv)提取步态特征,一个分支通过水平金字塔映射(HPM)提取行人外观全局和最具辨识度的信息;另一分支通过多个并行的微动作捕捉模块(MCM)提取短时间的步态时空信息;最后,将两个分支的特征信息相加融合,再通过全连接层实现步态识别。基于平衡样本特征的区分能力和模型的收敛性构造联合损失函数,以加速模型的收敛。在CASIA-B步态数据集上进行实验,所提方法在3种行走状态下的平均识别率分别达到97.40%、93.67%和81.19%,均高于GaitSet方法、CapsNet方法、双流步态方法和GaitPart方法;在正常行走状态下比GaitSet方法的识别准确率提升了1.30个百分点,在携带背包状态下提升了2.87个百分点,在穿着外套状态下提升了10.89个百分点。实验结果表明,所提方法是可行、有效的。展开更多
目前主流人体动作识别大部分都是基于卷积神经网络(Convolutional Neural Network,CNN)实现,而CNN容易忽略视频中的空间位置信息,从而降低了视频空间频域中动作识别能力。同时传统CNN不能快速定位到关键的特征位置,并且在训练过程中不...目前主流人体动作识别大部分都是基于卷积神经网络(Convolutional Neural Network,CNN)实现,而CNN容易忽略视频中的空间位置信息,从而降低了视频空间频域中动作识别能力。同时传统CNN不能快速定位到关键的特征位置,并且在训练过程中不能并行计算导致效率低。为了解决传统CNN在处理时间频域和多并行计算问题,提出了基于视觉Transformer(Vision Transformer,ViT)和3D卷积网络学习时空特征(Learning Spatiotemporal Features with 3D Convolutional Network,C3D)的人体动作识别算法。使用C3D提取视频的多维特征图、ViT的特征切片窗口对多维特征进行全局特征分割;使用Transformer的编码-解码模块对视频中人体动作进行预测。实验结果表明,所提的人体动作识别算法在UCF-101、HMDB51数据集上提高了动作识别的准确率。展开更多
文摘在茶园水资源管理中,蒸散量(Evapotranspiration,ET)是评估作物水分需求的关键指标,由于茶园蒸散量预测具有时序性、不稳定性以及非线性耦合等特点,目前的茶园蒸散量预测模型存在预测精度较低的问题,针对此问题本文提出了一种新型的茶园蒸散量预测模型。首先使用互信息算法(Mutual information,MI)与主成分分析算法(Principal component analysis,PCA)相融合的数据处理算法(MIPCA),筛选强相关的特征并提取主成分;其次将时域卷积网络(Temporal convolutional network,TCN)与Transformer融合,利用灰狼算法(Grey wolf optimization,GWO)优化超参数,捕捉茶园数据的全局依赖关系;最后整合2个网络构建了MIPCA-TCN-GWO-Transformer模型,通过消融试验和对比试验验证了模型性能,并对模型在不同时间步长下的性能进行测试。结果表明,该模型平均绝对百分比误差(Mean absolute percentage error,MAPE)、均方根误差(Root mean square error,RMSE)和决定系数(Coefficient of determination,R^(2))3个评价指标分别为0.015 mm/d、0.312 mm/d和0.962,优于长短期记忆模型(Long short term memory,LSTM)等传统预测模型。在小时尺度、日尺度和月尺度下的R^(2)分别为0.986、0.978和0.946,在不同时间步长下展现了良好的适应性和准确性。本文构建的MIPCA-TCN-GWO-Transformer模型具有较高的预测精度和稳定性,可为茶园水资源优化管理和灌溉制度制定提供科学参考。
文摘针对步态识别易受拍摄视角、外观变化等影响的问题,提出一种基于双支路卷积网络的步态识别方法。首先,提出随机裁剪随机遮挡的数据增强方法RRDA(Restricted Random Data Augmentation),以扩展外观变化的数据样本,提高模型遮挡的鲁棒性;其次,采用结合注意力机制的两路复合卷积层(C-Conv)提取步态特征,一个分支通过水平金字塔映射(HPM)提取行人外观全局和最具辨识度的信息;另一分支通过多个并行的微动作捕捉模块(MCM)提取短时间的步态时空信息;最后,将两个分支的特征信息相加融合,再通过全连接层实现步态识别。基于平衡样本特征的区分能力和模型的收敛性构造联合损失函数,以加速模型的收敛。在CASIA-B步态数据集上进行实验,所提方法在3种行走状态下的平均识别率分别达到97.40%、93.67%和81.19%,均高于GaitSet方法、CapsNet方法、双流步态方法和GaitPart方法;在正常行走状态下比GaitSet方法的识别准确率提升了1.30个百分点,在携带背包状态下提升了2.87个百分点,在穿着外套状态下提升了10.89个百分点。实验结果表明,所提方法是可行、有效的。
文摘目前主流人体动作识别大部分都是基于卷积神经网络(Convolutional Neural Network,CNN)实现,而CNN容易忽略视频中的空间位置信息,从而降低了视频空间频域中动作识别能力。同时传统CNN不能快速定位到关键的特征位置,并且在训练过程中不能并行计算导致效率低。为了解决传统CNN在处理时间频域和多并行计算问题,提出了基于视觉Transformer(Vision Transformer,ViT)和3D卷积网络学习时空特征(Learning Spatiotemporal Features with 3D Convolutional Network,C3D)的人体动作识别算法。使用C3D提取视频的多维特征图、ViT的特征切片窗口对多维特征进行全局特征分割;使用Transformer的编码-解码模块对视频中人体动作进行预测。实验结果表明,所提的人体动作识别算法在UCF-101、HMDB51数据集上提高了动作识别的准确率。