针对传统的基于自编码器的无监督异常声音检测方法存在特征表达能力不足的问题,提出一种基于注意力-跳跃自编码器-生成对抗网络的无监督异常声音检测方法ASAE-GAN(Attentional Skip-connected Auto Encoder and Generative Adversarial ...针对传统的基于自编码器的无监督异常声音检测方法存在特征表达能力不足的问题,提出一种基于注意力-跳跃自编码器-生成对抗网络的无监督异常声音检测方法ASAE-GAN(Attentional Skip-connected Auto Encoder and Generative Adversarial Network)。ASAE-GAN在跳跃自编码器和生成对抗网络的基础上,引入通道间注意力机制和时间注意力机制,增强模型的特征表达能力。使用MIMII数据集中的pump声音数据进行实验,评价指标使用AUC分数。结果表明:ASAE-GAN的平均AUC分数相比较于AE、UNET和Skip-GANomaly分别提升了16.27%、14.23%和6.55%,验证了其在无监督异常声音检测方面的优越性。展开更多
在自动驾驶感知系统中视觉传感器与激光雷达是关键的信息来源,但在目前的3D目标检测任务中大部分纯点云的网络检测能力都优于图像和激光点云融合的网络,现有的研究将其原因总结为图像与雷达信息的视角错位以及异构特征难以匹配,单阶段...在自动驾驶感知系统中视觉传感器与激光雷达是关键的信息来源,但在目前的3D目标检测任务中大部分纯点云的网络检测能力都优于图像和激光点云融合的网络,现有的研究将其原因总结为图像与雷达信息的视角错位以及异构特征难以匹配,单阶段融合算法难以充分融合二者的特征.为此,本文提出一种新的多层多模态融合的3D目标检测方法:首先,前融合阶段通过在2D检测框形成的锥视区内对点云进行局部顺序的色彩信息(Red Green Blue,RGB)涂抹编码;然后将编码后点云输入融合了自注意力机制上下文感知的通道扩充PointPillars检测网络;后融合阶段将2D候选框与3D候选框在非极大抑制之前编码为两组稀疏张量,利用相机激光雷达对象候选融合网络得出最终的3D目标检测结果.在KITTI数据集上进行的实验表明,本融合检测方法相较于纯点云网络的基线上有了显著的性能提升,平均mAP提高了6.24%.展开更多
针对现有恶意域名检测算法对于家族恶意域名检测精度不高和实时性不强的问题,提出一种基于BiLSTM-DAE的恶意域名检测算法。通过利用双向长短时记忆神经网络(Bi-directional Long Short Term Memory,BiLSTM)提取域名字符组合的上下文序...针对现有恶意域名检测算法对于家族恶意域名检测精度不高和实时性不强的问题,提出一种基于BiLSTM-DAE的恶意域名检测算法。通过利用双向长短时记忆神经网络(Bi-directional Long Short Term Memory,BiLSTM)提取域名字符组合的上下文序列特征,并结合深度自编码网络(Deep Auto-Encoder,DAE)逐层压缩感知提取类内有共性和类间有区分性的强字符构词特征并进行分类。实验结果表明,与当前主流恶意域名检测算法相比,该算法在保持检测开销较小的基础上,具有更高的检测精度。展开更多
针对夜间低光照场景下目标特征提取困难和跟踪不稳定的问题,提出了基于自编码器结构及改进Bytetrack的多目标行人检测及跟踪算法。在检测阶段,基于YOLOX(you only look once X)搭建多任务自编码变换模型框架,以一种自监督的方式考虑物...针对夜间低光照场景下目标特征提取困难和跟踪不稳定的问题,提出了基于自编码器结构及改进Bytetrack的多目标行人检测及跟踪算法。在检测阶段,基于YOLOX(you only look once X)搭建多任务自编码变换模型框架,以一种自监督的方式考虑物理噪声模型和图像信号处理(image signal processing,ISP)的过程,通过对真实光照退化变换过程进行编码与解码学习内在视觉结构,并基于这种表示通过解码边界框坐标与类实现目标检测任务。为了抑制背景噪声的干扰,在目标解码器颈部网络引入自适应特征融合模块ASFF。跟踪阶段,基于Bytetrack算法进行改进,将基于Tranformer重识别网络提取到的外观嵌入信息与NSA卡尔曼滤波获得的运动信息通过自适应加权的方法完成数据关联,并通过Byte两次匹配的算法完成夜间行人的跟踪。在自建夜间行人检测数据集上测试检测模型的泛化能力,mAP@0.5达到了94.9%,结果表明本文的退化变换过程符合现实条件,具有良好的泛化能力。最后通过自建夜间行人跟踪数据集验证多目标跟踪性能,实验结果表明,本文提出的夜间低光照行人多目标跟踪算法MOTA(multiple object tracking accuracy)为89.55%,IDF1(identity F1 score)为88.34%,IDs(ID switches)为15。与基准方法Bytetrack相比,MOTA提高了10.72%,IDF1提高了6.19%,IDs减少了50%。结果表明,本文提出的基于自编码结构及改进Bytetrack的多目标跟踪算法可以有效解决在夜间低光照场景下行人跟踪困难的问题。展开更多
Roller is an important workpiece of automatic spinning machine. Only if the chamferR on the root bottom of roller's guide pillar meets processing accuracy requirement can the end face of one roller's guide pillar ma...Roller is an important workpiece of automatic spinning machine. Only if the chamferR on the root bottom of roller's guide pillar meets processing accuracy requirement can the end face of one roller's guide pillar match the correct position of another roller's end face on the guide hole. Therefore, the size of chamfer R on the root bottomof the roller's guide pillar has an important influence on the operating state of automatic spinning machine. In order to achieve the rapid, automatic and precise measurement of chamfer R on the root bottom of roller, an auto detection system }'or roller~ s chamfer based on computer vision technology is proposed. Firstly, the principle of measurement based on computer vision technology is introduced. And then the extraction method of charnfer^s characteristic parameters is presented, which uses image processing technique to obtain these characteristic parameters by means of collected images of roller contour, including extraction of region of interest, extraction of subpixel precise edge, segmentation of arc and line, fittingof geometric primitives, etc. Finally, after experimental verification, the measurement error is within + 5 μm and repeated accuracy is 0.1 pm. The results show that this measurement method is applicable to not only the chamfer on the textile workpiece, but also the workpieces of shaft type with various of sizes.展开更多
文摘针对传统的基于自编码器的无监督异常声音检测方法存在特征表达能力不足的问题,提出一种基于注意力-跳跃自编码器-生成对抗网络的无监督异常声音检测方法ASAE-GAN(Attentional Skip-connected Auto Encoder and Generative Adversarial Network)。ASAE-GAN在跳跃自编码器和生成对抗网络的基础上,引入通道间注意力机制和时间注意力机制,增强模型的特征表达能力。使用MIMII数据集中的pump声音数据进行实验,评价指标使用AUC分数。结果表明:ASAE-GAN的平均AUC分数相比较于AE、UNET和Skip-GANomaly分别提升了16.27%、14.23%和6.55%,验证了其在无监督异常声音检测方面的优越性。
文摘在自动驾驶感知系统中视觉传感器与激光雷达是关键的信息来源,但在目前的3D目标检测任务中大部分纯点云的网络检测能力都优于图像和激光点云融合的网络,现有的研究将其原因总结为图像与雷达信息的视角错位以及异构特征难以匹配,单阶段融合算法难以充分融合二者的特征.为此,本文提出一种新的多层多模态融合的3D目标检测方法:首先,前融合阶段通过在2D检测框形成的锥视区内对点云进行局部顺序的色彩信息(Red Green Blue,RGB)涂抹编码;然后将编码后点云输入融合了自注意力机制上下文感知的通道扩充PointPillars检测网络;后融合阶段将2D候选框与3D候选框在非极大抑制之前编码为两组稀疏张量,利用相机激光雷达对象候选融合网络得出最终的3D目标检测结果.在KITTI数据集上进行的实验表明,本融合检测方法相较于纯点云网络的基线上有了显著的性能提升,平均mAP提高了6.24%.
文摘针对现有恶意域名检测算法对于家族恶意域名检测精度不高和实时性不强的问题,提出一种基于BiLSTM-DAE的恶意域名检测算法。通过利用双向长短时记忆神经网络(Bi-directional Long Short Term Memory,BiLSTM)提取域名字符组合的上下文序列特征,并结合深度自编码网络(Deep Auto-Encoder,DAE)逐层压缩感知提取类内有共性和类间有区分性的强字符构词特征并进行分类。实验结果表明,与当前主流恶意域名检测算法相比,该算法在保持检测开销较小的基础上,具有更高的检测精度。
文摘针对夜间低光照场景下目标特征提取困难和跟踪不稳定的问题,提出了基于自编码器结构及改进Bytetrack的多目标行人检测及跟踪算法。在检测阶段,基于YOLOX(you only look once X)搭建多任务自编码变换模型框架,以一种自监督的方式考虑物理噪声模型和图像信号处理(image signal processing,ISP)的过程,通过对真实光照退化变换过程进行编码与解码学习内在视觉结构,并基于这种表示通过解码边界框坐标与类实现目标检测任务。为了抑制背景噪声的干扰,在目标解码器颈部网络引入自适应特征融合模块ASFF。跟踪阶段,基于Bytetrack算法进行改进,将基于Tranformer重识别网络提取到的外观嵌入信息与NSA卡尔曼滤波获得的运动信息通过自适应加权的方法完成数据关联,并通过Byte两次匹配的算法完成夜间行人的跟踪。在自建夜间行人检测数据集上测试检测模型的泛化能力,mAP@0.5达到了94.9%,结果表明本文的退化变换过程符合现实条件,具有良好的泛化能力。最后通过自建夜间行人跟踪数据集验证多目标跟踪性能,实验结果表明,本文提出的夜间低光照行人多目标跟踪算法MOTA(multiple object tracking accuracy)为89.55%,IDF1(identity F1 score)为88.34%,IDs(ID switches)为15。与基准方法Bytetrack相比,MOTA提高了10.72%,IDF1提高了6.19%,IDs减少了50%。结果表明,本文提出的基于自编码结构及改进Bytetrack的多目标跟踪算法可以有效解决在夜间低光照场景下行人跟踪困难的问题。
基金National Science and Technology Major Project of China(No.2016ZX04003001)High-tech Ship Research Project(1st phase of Low-speed Marine Engine Engineering)
文摘Roller is an important workpiece of automatic spinning machine. Only if the chamferR on the root bottom of roller's guide pillar meets processing accuracy requirement can the end face of one roller's guide pillar match the correct position of another roller's end face on the guide hole. Therefore, the size of chamfer R on the root bottomof the roller's guide pillar has an important influence on the operating state of automatic spinning machine. In order to achieve the rapid, automatic and precise measurement of chamfer R on the root bottom of roller, an auto detection system }'or roller~ s chamfer based on computer vision technology is proposed. Firstly, the principle of measurement based on computer vision technology is introduced. And then the extraction method of charnfer^s characteristic parameters is presented, which uses image processing technique to obtain these characteristic parameters by means of collected images of roller contour, including extraction of region of interest, extraction of subpixel precise edge, segmentation of arc and line, fittingof geometric primitives, etc. Finally, after experimental verification, the measurement error is within + 5 μm and repeated accuracy is 0.1 pm. The results show that this measurement method is applicable to not only the chamfer on the textile workpiece, but also the workpieces of shaft type with various of sizes.