期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于轻量级卷积神经网络的车辆声学识别
1
作者
封慧杰
赵红东
+1 位作者
于快快
刘赫
《传感器与微系统》
CSCD
北大核心
2024年第7期136-140,共5页
车型识别技术对交通监测具有重要意义。针对行驶中车辆的视觉信息易受环境干扰等问题,提出了一种基于ShuffleNet V2的车辆声学特征识别模型S-ShuffleNet,包含对ShuffleNet V2网络深度的缩减以及深度可分离卷积(DSC)中卷积(Conv)核大小...
车型识别技术对交通监测具有重要意义。针对行驶中车辆的视觉信息易受环境干扰等问题,提出了一种基于ShuffleNet V2的车辆声学特征识别模型S-ShuffleNet,包含对ShuffleNet V2网络深度的缩减以及深度可分离卷积(DSC)中卷积(Conv)核大小的改进,通过提取车辆声信号的对数—梅尔谱图(LMS)特征作为该模型的输入,进行车型识别。同时,将风、雨、雷暴噪声叠加在车辆音频上,以验证不同环境噪声的影响。实验结果表明:该模型参数量少、训练速度快,在VS10数据集上识别精度比基础网络ShuffleNet V2提高2.4%,识别准确率可达97.5%,与不同分类网络相比,S-ShuffleNet也具有良好性能。
展开更多
关键词
车型识别
声学特征
对数
梅尔
谱
图
轻量级
卷积神经网络
环境噪声
下载PDF
职称材料
可变形特征图残差网络用于城市声音识别
被引量:
2
2
作者
刘芙伶
李伟红
龚卫国
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2020年第11期1853-1862,共10页
针对城市声音识别过程中时频图像特征提取较困难的问题,提出一种可变形特征图残差网络用于城市声音识别.首先设计可变形特征图残差模块,包括偏移层与卷积层.偏移层将输入特征图的像素点移位,移位后的特征图通过快捷连接与卷积层提取到...
针对城市声音识别过程中时频图像特征提取较困难的问题,提出一种可变形特征图残差网络用于城市声音识别.首先设计可变形特征图残差模块,包括偏移层与卷积层.偏移层将输入特征图的像素点移位,移位后的特征图通过快捷连接与卷积层提取到的特征图叠加,使网络集中在感兴趣的特征图区域采样,并向下级网络传递移位后特征图信息;其次设计可变形卷积残差网络;最后将该网络提取的特征与城市声音的梅尔倒谱系数融合,经压缩激励模块重标定后输入全连接层分类.在城市声音数据集上进行了实验,结果表明,与卷积神经网络的方法相比,该方法用于城市声音识别准确率提高5%以上.
展开更多
关键词
可变形卷积
残差模块
残差网络
城市声音
对数
梅尔
谱
图
下载PDF
职称材料
基于改进Inception网络的语音分类模型
被引量:
2
3
作者
张秋余
王煜坤
《计算机应用》
CSCD
北大核心
2023年第3期909-915,共7页
针对传统音频分类模型提取音频特征的过程繁琐,以及现有神经网络模型存在过拟合、分类精度不高、梯度消失等问题,提出一种基于改进Inception网络的语音分类模型。首先,在模型中加入ResNet中的残差跳连思想以改进传统的InceptionV2模型,...
针对传统音频分类模型提取音频特征的过程繁琐,以及现有神经网络模型存在过拟合、分类精度不高、梯度消失等问题,提出一种基于改进Inception网络的语音分类模型。首先,在模型中加入ResNet中的残差跳连思想以改进传统的InceptionV2模型,使网络模型在加深的同时避免梯度消失;其次,优化Inception模块中的卷积核大小,并利用不同尺寸卷积对原始语音的Log-Mel谱图进行深度特征提取,使模型通过自主学习的方式选择合适的卷积处理数据;同时,在深度与宽度两个维度改进模型以提高分类精度;最后,利用训练好的网络模型对语音数据进行分类预测,并通过Softmax函数得到分类结果。在清华大学汉语语音数据集THCHS-30与环境声音数据集UrbanSound8K数据集上的实验结果表明,改进的Inception网络模型在上述两个数据集上分类准确率分别为92.76%与93.34%。相较于VGG16、InceptionV2、GoogLeNet等模型,所提模型的分类准确率取得了最优,最多提高了27.30个百分点。所提模型具有更强的特征融合能力和更准确的分类结果,能够解决过拟合、梯度消失等问题。
展开更多
关键词
语音分类
卷积神经网络
残差跳连
对数
梅尔
谱
图
深度特征
下载PDF
职称材料
基于域泛化的无监督机器设备异常声检测
4
作者
章林柯
许艳武
余永升
《海军工程大学学报》
CAS
北大核心
2023年第6期52-56,70,共6页
在基于声信号的机器设备异常检测中,机器运行时发出的声音可能会因机器运转状态的改变而发生变化,环境噪声也会改变场景中的声学特征,而传统的机器异常声音检测系统会因为声学特征的改变导致正常的声音被错误地标记为异常。针对这一问题...
在基于声信号的机器设备异常检测中,机器运行时发出的声音可能会因机器运转状态的改变而发生变化,环境噪声也会改变场景中的声学特征,而传统的机器异常声音检测系统会因为声学特征的改变导致正常的声音被错误地标记为异常。针对这一问题,提出了基于域泛化技术的无监督机器异常声音检测方法。首先,将声信号的对数梅尔谱图输入深度学习神经网络模型,结合域混合方法和坐标注意力机制模块,提高系统域泛化能力和异常识别性能;然后,在DCASE开源数据集上进行实验,与两种基线评估系统的AUC和pAUC得分进行对比。结果表明,所提出的方法在域泛化条件下的异常检测性能得到明显提升。
展开更多
关键词
无监督深度学习
异常声音检测
域泛化
对数
梅尔
谱
图
下载PDF
职称材料
基于深度学习模型的电力变压器故障声音诊断方法研究
被引量:
8
5
作者
吴帆
刘艳霞
+1 位作者
刘力铭
何彦德
《电声技术》
2020年第1期76-80,共5页
利用声音信号对电力变压器进行故障诊断是一种不停机的设备维护方法,可以诊断变压器故障类型或预测故障产生的时间。声音诊断相对于其他诊断方式有许多优点,但是传统的声音自动诊断方法识别率不够理想。为了探索深度学习技术在声音故障...
利用声音信号对电力变压器进行故障诊断是一种不停机的设备维护方法,可以诊断变压器故障类型或预测故障产生的时间。声音诊断相对于其他诊断方式有许多优点,但是传统的声音自动诊断方法识别率不够理想。为了探索深度学习技术在声音故障诊断方面的可行性,本文采集了真实变压器在正常状态、老化和放电两种故障运行状态下发出的声音信号,对信号分别进行了声谱图转换和梅尔对数谱图的转换,输入一种高效轻量级卷积神经网络--Mobile Net深度学习模型中开展了训练。训练结果表明,将卷积神经网络应用在变压器故障声音诊断上能够得到较高的准确率,尤其是采用梅尔对数谱图对三种状态下识别准确率均能达到99%以上,而采用声谱图进行训练对放电类型的故障识别率较高,老化故障识别率不够理想。
展开更多
关键词
电力变压器声音故障诊断
卷积神经网络
MOBILE
NET
声
谱
图
梅尔对数谱图
下载PDF
职称材料
采用混合域注意力机制的无人机识别方法
被引量:
7
6
作者
薛珊
卫立炜
+1 位作者
顾宸瑜
吕琼莹
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2022年第10期141-150,共10页
针对在城市公园、广场和大型游乐场等公共环境中,雷达和无线电识别无人机易受到电子干扰、图像识别无人机易受到光线和遮挡物干扰的问题,提出了一种经济便捷、不易受到干扰的运用声音和采用通道空间混合域注意力机制多尺度分组卷积网络(...
针对在城市公园、广场和大型游乐场等公共环境中,雷达和无线电识别无人机易受到电子干扰、图像识别无人机易受到光线和遮挡物干扰的问题,提出了一种经济便捷、不易受到干扰的运用声音和采用通道空间混合域注意力机制多尺度分组卷积网络(ECSANet)的无人机识别方法。首先,建立民用的9大类无人机声音数据集,提取数据集的对数梅尔谱图及其动态特征;其次,为了网络参数量少,避免过拟合,设计了基于分组卷积、通道混洗和残差结构的通道混洗多尺度分组卷积网络(MSSGNet);然后,为了能更多、更有效地提取无人机声音特征,设计了通道空间混合域注意力机制模块(ECSA);最后,将ECSA模块插入MSSGNet网络构成改进的通道空间混合域注意力机制的多尺度分组卷积网络(ECSANet),形成新型声音识别无人机的方法。运用设计的ECSANet网络对自建的民用无人机声音数据集和Urbansound8K环境声音数据集进行了声音识别,识别结果表明:与ResNet18、ResNet34、ResNeXt18和MobileNetV2等基准网络相比,MSSGNet网络参数更少,识别准确率更高,达到了95.1%;ECSA模块可以插入多种网络,在不增加很多参数的情况下令网络模型的识别准确率获得提升,在无人机等声音分类任务上具有很好的效果;与MSSGNet网络相比,改进的ECSANet网络识别准确率能达到95.9%,提高了0.8%,表明了该网络在识别小样本无人机方面的优越性和可行性。
展开更多
关键词
无人机
声音识别
对数
梅尔
谱
图
神经网络
混合域注意力机制
下载PDF
职称材料
基于改进残差网络的低空无人机声音识别方法
被引量:
3
7
作者
薛珊
卫立炜
+2 位作者
顾宸瑜
孟宪宇
贾冰
《长春理工大学学报(自然科学版)》
2022年第4期100-107,共8页
“黑飞”无人机的泛滥给人们的生活带来了极大威胁。抵制“黑飞”无人机的首要任务是识别它。针对低空无人机识别问题,设计了一种基于改进残差网络的无人机声音识别方法。首先,采集低空无人机声音数据并进行预处理,建立数据集;其次,研...
“黑飞”无人机的泛滥给人们的生活带来了极大威胁。抵制“黑飞”无人机的首要任务是识别它。针对低空无人机识别问题,设计了一种基于改进残差网络的无人机声音识别方法。首先,采集低空无人机声音数据并进行预处理,建立数据集;其次,研究并比较了梅尔频率倒谱系数(MFCC)、对数梅尔谱图(Log-Mel)及其一阶差分等音频特征;然后,设计了基于残差块改进的神经网络(IRBNet);最后,运用设计的IRBNet以及CNN-1、CNN-2、ResNet和IRBNet-1等基准网络对无人机进行识别实验。实验结果表明,IRBNet的识别准确率为97.45%,与其他基准网络相比,准确率更高;设计的IRBNet具有识别无人机的可行性和有效性。
展开更多
关键词
无人机
声音识别
特征提取
对数
梅尔
谱
图
卷积神经网络
下载PDF
职称材料
题名
基于轻量级卷积神经网络的车辆声学识别
1
作者
封慧杰
赵红东
于快快
刘赫
机构
河北工业大学电子信息工程学院
光电信息控制和安全技术重点实验室
天津金沃能源科技股份有限公司
出处
《传感器与微系统》
CSCD
北大核心
2024年第7期136-140,共5页
基金
天津市科技计划资助项目(21YDTPJC00050)
光电信息控制和安全技术重点实验室基金资助项目(2021JCJQLB055008)。
文摘
车型识别技术对交通监测具有重要意义。针对行驶中车辆的视觉信息易受环境干扰等问题,提出了一种基于ShuffleNet V2的车辆声学特征识别模型S-ShuffleNet,包含对ShuffleNet V2网络深度的缩减以及深度可分离卷积(DSC)中卷积(Conv)核大小的改进,通过提取车辆声信号的对数—梅尔谱图(LMS)特征作为该模型的输入,进行车型识别。同时,将风、雨、雷暴噪声叠加在车辆音频上,以验证不同环境噪声的影响。实验结果表明:该模型参数量少、训练速度快,在VS10数据集上识别精度比基础网络ShuffleNet V2提高2.4%,识别准确率可达97.5%,与不同分类网络相比,S-ShuffleNet也具有良好性能。
关键词
车型识别
声学特征
对数
梅尔
谱
图
轻量级
卷积神经网络
环境噪声
Keywords
vehicle type recognition
acoustic feature
log-Mel spectrogram(LMS)
lightweight
convolutional neural network(CNN)
environmental noise
分类号
TP391.42 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
可变形特征图残差网络用于城市声音识别
被引量:
2
2
作者
刘芙伶
李伟红
龚卫国
机构
光电技术及系统教育部重点实验室
重庆大学光电工程学院
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2020年第11期1853-1862,共10页
基金
国家科技惠民计划(2013GS500303)
红树林生态环境监测系统关键技术研究与集成应用示范(桂科AA17129002).
文摘
针对城市声音识别过程中时频图像特征提取较困难的问题,提出一种可变形特征图残差网络用于城市声音识别.首先设计可变形特征图残差模块,包括偏移层与卷积层.偏移层将输入特征图的像素点移位,移位后的特征图通过快捷连接与卷积层提取到的特征图叠加,使网络集中在感兴趣的特征图区域采样,并向下级网络传递移位后特征图信息;其次设计可变形卷积残差网络;最后将该网络提取的特征与城市声音的梅尔倒谱系数融合,经压缩激励模块重标定后输入全连接层分类.在城市声音数据集上进行了实验,结果表明,与卷积神经网络的方法相比,该方法用于城市声音识别准确率提高5%以上.
关键词
可变形卷积
残差模块
残差网络
城市声音
对数
梅尔
谱
图
Keywords
deformable convolution
residual block
residual network
urban sound
logarithmic Mel spectrum
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于改进Inception网络的语音分类模型
被引量:
2
3
作者
张秋余
王煜坤
机构
兰州理工大学计算机与通信学院
出处
《计算机应用》
CSCD
北大核心
2023年第3期909-915,共7页
基金
国家自然科学基金资助项目(61862041)。
文摘
针对传统音频分类模型提取音频特征的过程繁琐,以及现有神经网络模型存在过拟合、分类精度不高、梯度消失等问题,提出一种基于改进Inception网络的语音分类模型。首先,在模型中加入ResNet中的残差跳连思想以改进传统的InceptionV2模型,使网络模型在加深的同时避免梯度消失;其次,优化Inception模块中的卷积核大小,并利用不同尺寸卷积对原始语音的Log-Mel谱图进行深度特征提取,使模型通过自主学习的方式选择合适的卷积处理数据;同时,在深度与宽度两个维度改进模型以提高分类精度;最后,利用训练好的网络模型对语音数据进行分类预测,并通过Softmax函数得到分类结果。在清华大学汉语语音数据集THCHS-30与环境声音数据集UrbanSound8K数据集上的实验结果表明,改进的Inception网络模型在上述两个数据集上分类准确率分别为92.76%与93.34%。相较于VGG16、InceptionV2、GoogLeNet等模型,所提模型的分类准确率取得了最优,最多提高了27.30个百分点。所提模型具有更强的特征融合能力和更准确的分类结果,能够解决过拟合、梯度消失等问题。
关键词
语音分类
卷积神经网络
残差跳连
对数
梅尔
谱
图
深度特征
Keywords
speech classification
convolutional neural network
residual skip connection
Log-Mel spectrogram
depth feature
分类号
TN912.3 [电子电信—通信与信息系统]
TP183 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于域泛化的无监督机器设备异常声检测
4
作者
章林柯
许艳武
余永升
机构
武汉理工大学船海与能源动力工程学院
武汉理工大学硅酸盐建筑材料国家重点实验室
出处
《海军工程大学学报》
CAS
北大核心
2023年第6期52-56,70,共6页
基金
湖北省重点研发计划资助项目(2022BAA099)。
文摘
在基于声信号的机器设备异常检测中,机器运行时发出的声音可能会因机器运转状态的改变而发生变化,环境噪声也会改变场景中的声学特征,而传统的机器异常声音检测系统会因为声学特征的改变导致正常的声音被错误地标记为异常。针对这一问题,提出了基于域泛化技术的无监督机器异常声音检测方法。首先,将声信号的对数梅尔谱图输入深度学习神经网络模型,结合域混合方法和坐标注意力机制模块,提高系统域泛化能力和异常识别性能;然后,在DCASE开源数据集上进行实验,与两种基线评估系统的AUC和pAUC得分进行对比。结果表明,所提出的方法在域泛化条件下的异常检测性能得到明显提升。
关键词
无监督深度学习
异常声音检测
域泛化
对数
梅尔
谱
图
Keywords
unsupervised deep learning
anomalous sound detection
domain generalization
Log-Mel spectrogram
分类号
TP391.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于深度学习模型的电力变压器故障声音诊断方法研究
被引量:
8
5
作者
吴帆
刘艳霞
刘力铭
何彦德
机构
北京联合大学机器人学院
北京联合大学城市轨道交通与物流学院
出处
《电声技术》
2020年第1期76-80,共5页
基金
国家自然基金项目(61602041)。
文摘
利用声音信号对电力变压器进行故障诊断是一种不停机的设备维护方法,可以诊断变压器故障类型或预测故障产生的时间。声音诊断相对于其他诊断方式有许多优点,但是传统的声音自动诊断方法识别率不够理想。为了探索深度学习技术在声音故障诊断方面的可行性,本文采集了真实变压器在正常状态、老化和放电两种故障运行状态下发出的声音信号,对信号分别进行了声谱图转换和梅尔对数谱图的转换,输入一种高效轻量级卷积神经网络--Mobile Net深度学习模型中开展了训练。训练结果表明,将卷积神经网络应用在变压器故障声音诊断上能够得到较高的准确率,尤其是采用梅尔对数谱图对三种状态下识别准确率均能达到99%以上,而采用声谱图进行训练对放电类型的故障识别率较高,老化故障识别率不够理想。
关键词
电力变压器声音故障诊断
卷积神经网络
MOBILE
NET
声
谱
图
梅尔对数谱图
Keywords
power transformer fault diagnosis by sound
convolutional neural network
mobile net
spectrogram
mel logarithmic spectrum
分类号
TM407 [电气工程—电器]
下载PDF
职称材料
题名
采用混合域注意力机制的无人机识别方法
被引量:
7
6
作者
薛珊
卫立炜
顾宸瑜
吕琼莹
机构
长春理工大学机电工程学院
长春理工大学重庆研究院
西安交通大学信息与通信工程学院
出处
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2022年第10期141-150,共10页
基金
吉林省重点科技研发资助项目(20180201058SF)
吉林省教育厅科学技术研究资助项目(JJKH20210812KJ)。
文摘
针对在城市公园、广场和大型游乐场等公共环境中,雷达和无线电识别无人机易受到电子干扰、图像识别无人机易受到光线和遮挡物干扰的问题,提出了一种经济便捷、不易受到干扰的运用声音和采用通道空间混合域注意力机制多尺度分组卷积网络(ECSANet)的无人机识别方法。首先,建立民用的9大类无人机声音数据集,提取数据集的对数梅尔谱图及其动态特征;其次,为了网络参数量少,避免过拟合,设计了基于分组卷积、通道混洗和残差结构的通道混洗多尺度分组卷积网络(MSSGNet);然后,为了能更多、更有效地提取无人机声音特征,设计了通道空间混合域注意力机制模块(ECSA);最后,将ECSA模块插入MSSGNet网络构成改进的通道空间混合域注意力机制的多尺度分组卷积网络(ECSANet),形成新型声音识别无人机的方法。运用设计的ECSANet网络对自建的民用无人机声音数据集和Urbansound8K环境声音数据集进行了声音识别,识别结果表明:与ResNet18、ResNet34、ResNeXt18和MobileNetV2等基准网络相比,MSSGNet网络参数更少,识别准确率更高,达到了95.1%;ECSA模块可以插入多种网络,在不增加很多参数的情况下令网络模型的识别准确率获得提升,在无人机等声音分类任务上具有很好的效果;与MSSGNet网络相比,改进的ECSANet网络识别准确率能达到95.9%,提高了0.8%,表明了该网络在识别小样本无人机方面的优越性和可行性。
关键词
无人机
声音识别
对数
梅尔
谱
图
神经网络
混合域注意力机制
Keywords
drone
voice recognition
log Mel-spectrogram
neural network
mixed domain attention mechanism
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于改进残差网络的低空无人机声音识别方法
被引量:
3
7
作者
薛珊
卫立炜
顾宸瑜
孟宪宇
贾冰
机构
长春理工大学机电工程学院
长春理工大学重庆研究院
西安交通大学信息与通信工程学院
出处
《长春理工大学学报(自然科学版)》
2022年第4期100-107,共8页
基金
吉林省重点科技研发资助项目(20180201058SF)
吉林省教育厅科学技术研究项目(JJKH20210812KJ)。
文摘
“黑飞”无人机的泛滥给人们的生活带来了极大威胁。抵制“黑飞”无人机的首要任务是识别它。针对低空无人机识别问题,设计了一种基于改进残差网络的无人机声音识别方法。首先,采集低空无人机声音数据并进行预处理,建立数据集;其次,研究并比较了梅尔频率倒谱系数(MFCC)、对数梅尔谱图(Log-Mel)及其一阶差分等音频特征;然后,设计了基于残差块改进的神经网络(IRBNet);最后,运用设计的IRBNet以及CNN-1、CNN-2、ResNet和IRBNet-1等基准网络对无人机进行识别实验。实验结果表明,IRBNet的识别准确率为97.45%,与其他基准网络相比,准确率更高;设计的IRBNet具有识别无人机的可行性和有效性。
关键词
无人机
声音识别
特征提取
对数
梅尔
谱
图
卷积神经网络
Keywords
drones
sound recognition
MFCC
Log Mel-spectrogram
CNN
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于轻量级卷积神经网络的车辆声学识别
封慧杰
赵红东
于快快
刘赫
《传感器与微系统》
CSCD
北大核心
2024
0
下载PDF
职称材料
2
可变形特征图残差网络用于城市声音识别
刘芙伶
李伟红
龚卫国
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2020
2
下载PDF
职称材料
3
基于改进Inception网络的语音分类模型
张秋余
王煜坤
《计算机应用》
CSCD
北大核心
2023
2
下载PDF
职称材料
4
基于域泛化的无监督机器设备异常声检测
章林柯
许艳武
余永升
《海军工程大学学报》
CAS
北大核心
2023
0
下载PDF
职称材料
5
基于深度学习模型的电力变压器故障声音诊断方法研究
吴帆
刘艳霞
刘力铭
何彦德
《电声技术》
2020
8
下载PDF
职称材料
6
采用混合域注意力机制的无人机识别方法
薛珊
卫立炜
顾宸瑜
吕琼莹
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2022
7
下载PDF
职称材料
7
基于改进残差网络的低空无人机声音识别方法
薛珊
卫立炜
顾宸瑜
孟宪宇
贾冰
《长春理工大学学报(自然科学版)》
2022
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部