期刊文献+
共找到688篇文章
< 1 2 35 >
每页显示 20 50 100
Health Monitoring of Milling Tool Inserts Using CNN Architectures Trained by Vibration Spectrograms 被引量:1
1
作者 Sonali S.Patil Sujit S.Pardeshi Abhishek D.Patange 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第7期177-199,共23页
In-process damage to a cutting tool degrades the surface􀀀nish of the job shaped by machining and causes a signi􀀀cant􀀀nancial loss.This stimulates the need for Tool Condition Monitoring(TCM)t... In-process damage to a cutting tool degrades the surface􀀀nish of the job shaped by machining and causes a signi􀀀cant􀀀nancial loss.This stimulates the need for Tool Condition Monitoring(TCM)to assist detection of failure before it extends to the worse phase.Machine Learning(ML)based TCM has been extensively explored in the last decade.However,most of the research is now directed toward Deep Learning(DL).The“Deep”formulation,hierarchical compositionality,distributed representation and end-to-end learning of Neural Nets need to be explored to create a generalized TCM framework to perform eciently in a high-noise environment of cross-domain machining.With this motivation,the design of dierent CNN(Convolutional Neural Network)architectures such as AlexNet,ResNet-50,LeNet-5,and VGG-16 is presented in this paper.Real-time spindle vibrations corresponding to healthy and various faulty con􀀀gurations of milling cutter were acquired.This data was transformed into the time-frequency domain and further processed by proposed architectures in graphical form,i.e.,spectrogram.The model is trained,tested,and validated considering dierent datasets and showcased promising results. 展开更多
关键词 Milling tool inserts health monitoring vibration spectrograms deep learning convolutional neural network
下载PDF
一个面向短波通信的LHOG话音检测方法
2
作者 白洁 田瑞丽 +1 位作者 任一夫 员建厦 《计算机科学》 CSCD 北大核心 2024年第S01期1144-1148,共5页
噪声环境下语音检测准确率偏低是短波通话面临的公开挑战。当前已有方法应用有限,其根源在于难以可靠地在噪音环境下提取准确且高效的语音特征。针对上述问题,提出了一个面向短波通信的低秩方向梯度直方图(Low-rank Histogram of Orient... 噪声环境下语音检测准确率偏低是短波通话面临的公开挑战。当前已有方法应用有限,其根源在于难以可靠地在噪音环境下提取准确且高效的语音特征。针对上述问题,提出了一个面向短波通信的低秩方向梯度直方图(Low-rank Histogram of Oriented Gradient,LHOG)话音检测方法。首先,对目标音频源数据进行预处理,实现噪声环境下语音信息的可视化表征;然后,在HOG特征提取器中嵌入低秩化结构,缓解特征中的冗余信息,并降低噪声干扰,从而获得准确且高效的特征;最后,通过常用的SVM分类模型便可在噪声环境中准确快速地区分话音和噪声。测试结果表明,该方法的准确率达到了95.12%,误报率仅为0.96%,漏报率为13.14%。与现有主流方法的对比实验证明,该方法话音检测准确率高,资源占用少,能够有效提高短波通信侦控效率。 展开更多
关键词 模式识别 语谱图 方向梯度直方图 低秩结构 支持向量机
下载PDF
心音频谱图在二尖瓣反流患者左心室功能监测中的作用
3
作者 张文俐 屈雪蒸 +1 位作者 宋蓓 张瑞岩 《心脑血管病防治》 2024年第1期9-12,20,共5页
目的探求使用可穿戴设备获取心音频谱图,观察不同程度二尖瓣反流(MR)患者心音频谱特征在左心室功能监测中的作用。方法入选2020年6月至2021年5月因心血管疾病入住上海交通大学医学院附属瑞金医院的102例MR患者,根据心脏超声MR反流束面积... 目的探求使用可穿戴设备获取心音频谱图,观察不同程度二尖瓣反流(MR)患者心音频谱特征在左心室功能监测中的作用。方法入选2020年6月至2021年5月因心血管疾病入住上海交通大学医学院附属瑞金医院的102例MR患者,根据心脏超声MR反流束面积/左心房面积比值超过20%将其分为轻度MR组72例和中度及以上MR组30例。基于心音频谱图对心音持续时间、最大声强、最大心音振幅进行分析,并与心脏超声测定的左心室射血分数(LVEF)进行相关性分析。结果心音频谱图第一心音持续时间与收缩期持续时间比值(S11-S12/S11-S21)与LVEF呈线性负相关(r=-0.535,P<0.01),S11-S12/S11-S21用于判定LVEF降低(LVEF<50%)曲线下面积为0.840(95%CI=0.756~0.924,P<0.01),截断值是55.50%,敏感度78.6%,特异度83.3%。结论心音频谱图提示,MR患者心脏收缩期第一心音持续时间占比与LVEF呈负相关性,在二尖瓣病患的心功能居家监测中存在潜在的应用价值。 展开更多
关键词 二尖瓣反流 心音频谱图 收缩期持续时间 左心室射血分数
下载PDF
基于语谱图的管制员疲劳状态检测研究
4
作者 杨昌其 冯筱晴 +1 位作者 张雨萱 蔡子牛 《航空工程进展》 CSCD 2024年第2期49-55,共7页
现阶段利用陆空通话语音对管制员疲劳状态的研究中,大多只考虑了语音在时域或频域的变化,而忽视了疲劳会同时在时域与频域上产生影响。将三种疲劳状态下的陆空通话语音分别转化为可同时反映时域与频域特性的语音频谱图像,利用灰度共生... 现阶段利用陆空通话语音对管制员疲劳状态的研究中,大多只考虑了语音在时域或频域的变化,而忽视了疲劳会同时在时域与频域上产生影响。将三种疲劳状态下的陆空通话语音分别转化为可同时反映时域与频域特性的语音频谱图像,利用灰度共生矩阵提取四维典型的特征参数,对比管制员在不同状态下特征参数的变化情况,构建管制员疲劳检测模型并对输入特征进行检测。结果表明:利用语谱图特征结合传统特征作为输入特征的检测准确率最高,达到95.49%,较单一使用传统特征的检测准确率高出4%;管制员疲劳状态的变化会直观地反映在语谱图上,会对其特征值产生影响,利用这种影响对管制员疲劳状态进行检测,可以得到良好的检测结果。 展开更多
关键词 管制员 疲劳检测 语谱图 灰度共生矩阵 机器学习
下载PDF
双解码卷积循环网络风噪声有源控制
5
作者 吴礼福 葛文昌 +1 位作者 陈晨 王绍博 《南京信息工程大学学报》 CAS 北大核心 2024年第5期678-687,共10页
本文提出一种利用双解码卷积循环网络(Dual-decoder Convolutional Recurrent Network,DCRN)代替FxLMS(Filtered-x Least Mean Square)算法的有源噪声控制方法,考虑到相位信息在有源噪声控制(Active Noise Control,ANC)中的重要性,DCRN... 本文提出一种利用双解码卷积循环网络(Dual-decoder Convolutional Recurrent Network,DCRN)代替FxLMS(Filtered-x Least Mean Square)算法的有源噪声控制方法,考虑到相位信息在有源噪声控制(Active Noise Control,ANC)中的重要性,DCRN网络的输入特征为噪声信号的复数频谱(包括实部谱和虚部谱).网络结构中,采用编码模块从噪声复数频谱中提取特征,利用双解码模块分别估计网络输出的实部谱和虚部谱,采用参数共享机制和组策略以降低训练参数的数量并提高网络的学习能力和泛化能力.特别是针对风噪声,选用新的损失函数以及对训练数据进行正则化处理以提升DCRN的性能.实验结果表明,DCRN方法在仿真环境与有源降噪耳机环境下对一般噪声和风噪声都表现出良好的降噪性能和鲁棒性. 展开更多
关键词 双解码卷积循环网络 有源噪声控制 FXLMS算法 复数频谱
下载PDF
基于最小二乘图像坐标修正的中阶梯光谱仪谱图还原算法
6
作者 欧阳羽轩 傅骁 +2 位作者 段发阶 王宽 吴靓昕 《光电工程》 CAS CSCD 北大核心 2024年第7期125-138,共14页
中阶梯光谱仪具有交叉色散特征,二维谱图还原是决定其波长测量准确性的关键环节,但是环境变化、加工装调等引起的光斑坐标变化对谱图还原精度造成严重影响。本文提出了一种基于最小二乘图像坐标修正的中阶梯光谱仪谱图还原算法,首先提... 中阶梯光谱仪具有交叉色散特征,二维谱图还原是决定其波长测量准确性的关键环节,但是环境变化、加工装调等引起的光斑坐标变化对谱图还原精度造成严重影响。本文提出了一种基于最小二乘图像坐标修正的中阶梯光谱仪谱图还原算法,首先提取校准汞灯光源多波长光斑质心坐标,利用理论像点和实际像点坐标构建系数矩阵,通过最小二乘法估计获得二维像面的平移、缩放、旋转系数,再采用多项式拟合减小残差影响,实现不同波长光斑的图像坐标修正,进而实现波长精确解算。实验结果显示,该算法能有效提高中阶梯光谱仪的谱图还原精度,在模拟较大装调误差条件下,修正后坐标与理想坐标偏差小于0.6个像元,证明了该算法具有较高的精度。 展开更多
关键词 光谱学 光谱仪 二维光谱图 质心提取 谱图还原
下载PDF
合成语声的声学分析及识别特征算法 被引量:1
7
作者 周峻林 胡晓光 +2 位作者 黄子旭 汪旭 付哲宇 《应用声学》 CSCD 北大核心 2024年第1期131-141,共11页
当前社会新型犯罪中电信诈骗案件频发,急需一种能够自动有效区分语声真伪的方法。为进一步增强目前深度学习领域识别合成语声的能力,为保障语声信息安全提供技术上的支持,针对合成语声声学特性上异于真实语声的特点,分析对比合成语声和... 当前社会新型犯罪中电信诈骗案件频发,急需一种能够自动有效区分语声真伪的方法。为进一步增强目前深度学习领域识别合成语声的能力,为保障语声信息安全提供技术上的支持,针对合成语声声学特性上异于真实语声的特点,分析对比合成语声和真实语声的声学特性,设计了一种声学特征均方根角量化语声声强变化程度,结合基频变化率和语声窄带频谱图声学特征进行融合,量化了声学特性差异,聚焦了合成语声中关键声学信息。在神经网络模型中融合输入声学特征,在FoR数据集的验证集上得到了0.6%的等错误率,在测试集上最好结果达到了10.8%的等错误率。该文成功实现了对合成语声的识别,证实了声学特征的有效性和研究方案的可行性,在一定程度上拓宽了合成语声特征设计的研究思路。 展开更多
关键词 声学特征 声强 基频 语声频谱图 神经网络
下载PDF
基于Mel声谱图与改进SEResNet的鱼类行为识别 被引量:1
8
作者 杨雨欣 于红 +3 位作者 杨宗轶 涂万 张鑫 林远山 《渔业现代化》 CSCD 北大核心 2024年第1期56-63,共8页
养殖环境中饲料投放、水流变化等刺激源导致鱼类声音分辨难,使行为识别准确率不高,为解决上述问题,提出基于Mel声谱图(Mel spectrogram)与改进SEResNet的鱼类行为识别模型TAP-SEResNet。首先针对鱼类行为声音频率波动大、特征差异小,造... 养殖环境中饲料投放、水流变化等刺激源导致鱼类声音分辨难,使行为识别准确率不高,为解决上述问题,提出基于Mel声谱图(Mel spectrogram)与改进SEResNet的鱼类行为识别模型TAP-SEResNet。首先针对鱼类行为声音频率波动大、特征差异小,造成特征提取难的问题,采用高分辨率、特征表示较好的Mel声谱图以捕捉鱼类声音的频谱特征。其次针对鱼类声音特征关键信息易丢失的难题,提出在SEResNet模型中融合时序聚合池化层(Temporal Aggregated Pooling,TAP),提取池化区域的最大值和平均值,保留鱼类行为更多细粒度声音特征,提高识别准确率。为验证所提模型的有效性,分别设计了消融试验和模型性能对比试验,试验结果显示:TAP-SEResNet相比SEResNet在不降低检测速度的条件下准确率提升了3.23%;相比PANNS-CNN14、ECAPA-TDNN及MFCC+ResNet等先进声音识别模型,TAP-SEResNet在准确率上分别提升了5.32%、2.80%和1.64%。所提模型有助于养殖过程中对鱼类行为实现精准监测,对精准养殖具有重要的推动作用。 展开更多
关键词 鱼类行为识别 被动水声信号 Mel声谱图 SEResNet
下载PDF
基于实体GIS设备试验的局部放电光学信号传播特性研究 被引量:1
9
作者 韩旭涛 史天一 +7 位作者 王昊天 周阳 陈欢 张轩瑞 李军浩 李兴旺 姚聪伟 孙帅 《广东电力》 北大核心 2024年第3期82-89,共8页
光测法具有电磁免疫性,特别适用于具有封闭结构的气体绝缘开关设备(gas insulated switchgear, GIS)局部放电检测,但是光信号在传播过程中易因传播距离增加或部件遮挡而快速衰减。为此,基于110 kV实际GIS设备开展局部放电光学信号传播... 光测法具有电磁免疫性,特别适用于具有封闭结构的气体绝缘开关设备(gas insulated switchgear, GIS)局部放电检测,但是光信号在传播过程中易因传播距离增加或部件遮挡而快速衰减。为此,基于110 kV实际GIS设备开展局部放电光学信号传播特性试验,研究传播距离和绝缘子遮挡对导杆尖刺缺陷和悬浮电位缺陷局部放电光信号的影响规律。结果表明,随着传播距离的增加:尖刺缺陷检测到光信号最大幅值和放电数均有所衰减,放电谱图变化不大;悬浮缺陷放电光信号幅值明显衰减,放电数不变,放电谱图特征逐渐失去“矩形”特征。此外,当光学信号透过带有通气孔的绝缘子传播时,光学信号明显衰减,且幅值波动较大。 展开更多
关键词 气体绝缘开关设备 光测法 传播特性 实体设备 放电谱图
下载PDF
基于非线性语谱图联合判决的语种识别
10
作者 段云 邵玉斌 +1 位作者 龙华 杜庆治 《微电子学与计算机》 2024年第5期99-108,共10页
针对灰度对数语谱图对基频拉伸幅度过大,短时长语音识别率提升受限的问题,提出一种非线性语谱图联合判决的语种识别方法。首先,对语音进行能量归一化,提取对数功率谱,将频率刻度按照人耳听觉感知进行非线性映射得到非线性语谱图。然后,... 针对灰度对数语谱图对基频拉伸幅度过大,短时长语音识别率提升受限的问题,提出一种非线性语谱图联合判决的语种识别方法。首先,对语音进行能量归一化,提取对数功率谱,将频率刻度按照人耳听觉感知进行非线性映射得到非线性语谱图。然后,将非线性语谱图按词关联特性进行等间隔拆分,在ResNet网络后端加入联合判决层;输出语音所属语种类型。实验结果表明,所提方法有效改善灰度对数语谱图的缺点,识别性能均高于语谱图及改进特征。联合判决对切分时长为1.0 s的样本语音取得的识别效果最佳,在广播音频数据集中,识别率达到94.25%;在VoxForge公共语料集中,识别率达到98.94%。 展开更多
关键词 语种识别 语谱图 非线性 联合判决 神经网络
下载PDF
基于二维时频谱图与改进YOLOv5的电能质量扰动识别
11
作者 李欣 吕干云 +4 位作者 龚彧 毕睿华 叶加星 刘晓宏 于相宜 《浙江电力》 2024年第10期35-44,共10页
随着新型电力系统中新能源渗透率逐渐升高,电网结构复杂性增加,PQD(电能质量扰动)呈现多样化和复杂化的趋势。为实现电能质量扰动的精准识别,提出一种基于二维时频谱图与改进YOLOv5的电能质量扰动图像识别的方法。首先,利用S变换将PQD... 随着新型电力系统中新能源渗透率逐渐升高,电网结构复杂性增加,PQD(电能质量扰动)呈现多样化和复杂化的趋势。为实现电能质量扰动的精准识别,提出一种基于二维时频谱图与改进YOLOv5的电能质量扰动图像识别的方法。首先,利用S变换将PQD数据映射成二维时频谱图,通过图像来表征时间、频率和幅值的扰动细节特征;然后,搭建引入ASPP(空洞空间卷积池化金字塔)结构和注意力机制的YO-LOv5训练网络,扩大特征图的感受野以充分提取扰动图像特征,进而以图像识别方法实现PQD分类识别;最后,利用仿真数据进行扰动识别准确率和鲁棒性的验证。结果表明,该方法的识别准确率较高,且图像识别法的引入有助于PQD识别结果的可视化。 展开更多
关键词 电能质量扰动图像识别 时频谱图像 YOLOv5 空洞空间卷积池化金字塔 注意力机制
下载PDF
基于欠定盲源分离和深度学习的生猪状态音频识别
12
作者 潘伟豪 盛卉子 +4 位作者 王春宇 闫顺丕 周小波 辜丽川 焦俊 《华南农业大学学报》 CAS CSCD 北大核心 2024年第5期730-742,共13页
【目的】为解决群养环境下生猪音频难以分离与识别的问题,提出基于欠定盲源分离与E C A-EfficientNetV2的生猪状态音频识别方法。【方法】以仿真群养环境下4类生猪音频信号作为观测信号,将信号稀疏表示后,通过层次聚类估计出信号混合矩... 【目的】为解决群养环境下生猪音频难以分离与识别的问题,提出基于欠定盲源分离与E C A-EfficientNetV2的生猪状态音频识别方法。【方法】以仿真群养环境下4类生猪音频信号作为观测信号,将信号稀疏表示后,通过层次聚类估计出信号混合矩阵,并利用lp范数重构算法求解lp范数最小值以完成生猪音频信号重构。将重构信号转化为声谱图,分为进食声、咆哮声、哼叫声和发情声4类,利用ECA-EfficientNetV2网络模型识别音频,获取生猪状态。【结果】混合矩阵估计的归一化均方误差最低为3.266×10^(−4),分离重构的音频信噪比在3.254~4.267 dB之间。声谱图经ECA-EfficientNetV2识别检测,准确率高达98.35%;与经典卷积神经网络ResNet50和VGG16对比,准确率分别提升2.88和1.81个百分点;与原EfficientNetV2相比,准确率降低0.52个百分点,但模型参数量减少33.56%,浮点运算量(FLOPs)降低1.86 G,推理时间减少9.40 ms。【结论】基于盲源分离及改进EfficientNetV2的方法,轻量且高效地实现了分离与识别群养生猪音频信号。 展开更多
关键词 盲源分离 声谱图 音频识别 稀疏重构 卷积神经网络
下载PDF
基于双线性池化引导特征融合的轴承故障诊断算法
13
作者 陈毅朋 吴飞 周凯东 《航空发动机》 北大核心 2024年第5期145-152,共8页
为了深入优化滚动轴承在变负载驱动环境下特征提取不充分、轴承故障特征表征不足的问题,提出了基于双线性池化引导特征融合的轴承故障诊断算法。对读取到的原始信号数据进行预处理,通过去除直流分量、噪声滤波、抗混叠滤波、时域窗函数... 为了深入优化滚动轴承在变负载驱动环境下特征提取不充分、轴承故障特征表征不足的问题,提出了基于双线性池化引导特征融合的轴承故障诊断算法。对读取到的原始信号数据进行预处理,通过去除直流分量、噪声滤波、抗混叠滤波、时域窗函数等操作,提高信号处理后的振动谱图质量;对预处理后的信号数据进行傅里叶变换,计算出变换后的幅值和频率数据,并绘制对应的振动谱图;利用通道注意力和空间注意力改进Res2Net网络,提取不同关注点下的视觉特征,并基于双线性池化方法进行多特征融合;利用全连接和softmax函数构建分类头,实现轴承故障分类。结果表明:所提出的方法在凯斯西储大学轴承数据集以及德国Paderborn数据集中的精确率分别为98.22%、97.94%,在轴承故障诊断中,所提算法不仅在理论上融合了自动化控制理论与控制工程原理,而且在实践中验证了其在轴承故障诊断中的有效性,为实现轴承故障的早期预警和智能诊断提供了新的技术途径。 展开更多
关键词 滚动轴承 振动谱图 故障诊断 双线性池化 多特征融合
下载PDF
天行长臂猿鸣唱的声谱特征与性别差异
14
作者 郭亭妍 马海港 +8 位作者 韩普 王子荻 祝常悦 楚原梦冉 张利祥 李如雪 戚嘉儒 李家华 范朋飞 《兽类学报》 CAS CSCD 北大核心 2024年第1期14-25,共12页
白眉长臂猿属(Hoolock)物种声音长期被认为不具有性二型,但是识别其声音的性别差异有助于该属物种的种群动态监测与行为学研究。本研究以天行长臂猿(Hoolock tianxing)作为研究对象,标注了11个个体的鸣声数据。我们通过k‑中心点聚类(k‑m... 白眉长臂猿属(Hoolock)物种声音长期被认为不具有性二型,但是识别其声音的性别差异有助于该属物种的种群动态监测与行为学研究。本研究以天行长臂猿(Hoolock tianxing)作为研究对象,标注了11个个体的鸣声数据。我们通过k‑中心点聚类(k‑medoids聚类)识别音节类型,基于音节组成和音句长度划分音句类型,并且识别了音节特征和音句使用上的性别差异。本研究识别出wa、oo、whoop、ow和eek 5种音节类型以及7种音句类型。雌性的wa和ow音节频率变化的幅度与速率比雄性更大;oo音节的各项频率指标比雄性更低;whoop音节频率变化的幅度与速率相比于雄性更小。在音句的使用上,独猿个体鸣叫的音句与合唱时各自性别贡献的部分更为相似,雄性极少唱主要由whoop音节与ow音节组成的音句G,雌性极少唱音句B(wa-whoop)和C(wa-oo-wawhoop)。本研究表明天行长臂猿的声音中存在性二型,该性别差异不仅有助于对天行长臂猿的监测,而且有助于理解不同声音类型及性别差异的功能。 展开更多
关键词 白眉长臂猿 声谱分析 声音通讯 鸣唱 性二型
下载PDF
基于鲁棒纹理特征的环境声音事件检测方法
15
作者 吴婷 刘琼 郭慧茹 《电子器件》 CAS 2024年第2期530-535,共6页
针对各种类别的环境声音事件检测问题,提出了基于鲁棒纹理特征的环境声音事件检测方法。首先,将原始的声音样本转换为类伽马声谱图;然后将类伽马声谱图通过剪切波变换提取图像的纹理特征;又采用中心化二值模式(CBP)算法进行编码;针对特... 针对各种类别的环境声音事件检测问题,提出了基于鲁棒纹理特征的环境声音事件检测方法。首先,将原始的声音样本转换为类伽马声谱图;然后将类伽马声谱图通过剪切波变换提取图像的纹理特征;又采用中心化二值模式(CBP)算法进行编码;针对特征维度过高问题,先利用随机森林算法后结合主成分分析(PCA)算法,提出了RF-PCA降维方法;最后使用支持向量机(SVM)对不同环境的声音进行分类。在公开数据集ESC-10上的仿真实验结果表明,利用所提出的基于鲁棒纹理特征的环境声音事件检测方法所提取的特征对声音分类可达到93.00%的分类效果。 展开更多
关键词 环境声音分类 类伽马声谱图 SHEARLET变换 CBP算法 RF-PCA
下载PDF
基于Mel-GADF与ConvNeXt-T的变压器铁心松动故障诊断方法
16
作者 万可力 马宏忠 +1 位作者 崔佳嘉 王健 《电力自动化设备》 EI CSCD 北大核心 2024年第3期217-224,共8页
为解决传统梅尔(Mel)时频谱图对变压器铁心松动程度识别率较低的问题,提出一种基于梅尔-格拉姆角差场(Mel-GADF)时频谱图与ConvNeXt-T网络相结合的变压器铁心松动故障诊断模型。将变压器声纹信号生成Mel时频谱图,同时将原始声纹数据经... 为解决传统梅尔(Mel)时频谱图对变压器铁心松动程度识别率较低的问题,提出一种基于梅尔-格拉姆角差场(Mel-GADF)时频谱图与ConvNeXt-T网络相结合的变压器铁心松动故障诊断模型。将变压器声纹信号生成Mel时频谱图,同时将原始声纹数据经过格拉姆角场(GAF)变换得到格拉姆角和场(GASF)与GADF这2种时频谱图;生成Mel-GASF与Mel-GADF这2种特征融合的时频谱图来弥补Mel时频谱图的低频缺失问题;将3种时频谱图放入ConvNeXt-T网络进行训练对比,选出效果最佳的诊断模型。以型号为S13-M-200/10的变压器为对象进行空载试验,对不同铁心松动程度下的声纹信号进行分析,分析结果表明,将Mel-GADF作为特征时频谱图结合ConvNeXt-T网络,可将测试集准确率从传统Mel时频谱图的98.273%提升至99.500%,提升了1.227个百分点。 展开更多
关键词 变压器 铁心松动 Mel时频谱图 格拉姆角场 卷积神经网络 迁移学习
下载PDF
基于LPDMR-NET的鸟鸣声识别
17
作者 王娅茹 唐璐 +2 位作者 陈爱斌 彭伟雄 沈平 《计算机工程》 CAS CSCD 北大核心 2024年第10期174-184,共11页
为了高效且快速地识别自然环境中的鸟鸣声,提出一种基于轻量级逐点深度的多感受野注意力残差网络(LPDMR-NET)模型。首先,通过Mel滤波器生成Mel频谱图。接着,采用basicblock和downblock连接生成两层残差网络DBNet,堆叠DBNet作为鸟鸣声识... 为了高效且快速地识别自然环境中的鸟鸣声,提出一种基于轻量级逐点深度的多感受野注意力残差网络(LPDMR-NET)模型。首先,通过Mel滤波器生成Mel频谱图。接着,采用basicblock和downblock连接生成两层残差网络DBNet,堆叠DBNet作为鸟鸣声识别的主干网络,以提高训练速度。然后,利用逐点深度卷积网络(PDNet)提取频谱图特征信息,替代主干网络下采样模块,将两个残差模块的basicblock中的3×3卷积替换为分离分支块(DBB),引入不同的感受野,在复杂多分支结构下显著提高网络的识别性能。最后,在两个残差模块间嵌入轻量级高效置换注意力(SA)模块用于传递两层残差模块间的有效信息,增强频谱图波纹特征,进一步提高网络识别性能。在自建的30类鸟鸣声数据集Birdselfdata上的实验结果表明,该模型的识别准确率为96.82%、F1值为96.73%,在识别效率和准确性方面超越了对比模型。 展开更多
关键词 卷积神经网络 鸟鸣声分类 深度学习 Mel频谱图 残差网络 深度可分离卷积
下载PDF
基于Vision Transformer和迁移学习的家庭领域哭声识别
18
作者 王汝旭 王荣燕 +2 位作者 曾科 杨传德 刘超 《智能计算机与应用》 2024年第6期119-126,共8页
针对SVM等传统机器学习算法准确率低和当前使用CNN处理家庭领域哭声识别在不同婴儿间出现泛化能力差的问题,提出了一种基于Vision Transformer和迁移学习的婴儿哭声音频分类算法。首先,为实现数据集样本的扩增,采用了包括梅尔频谱转换... 针对SVM等传统机器学习算法准确率低和当前使用CNN处理家庭领域哭声识别在不同婴儿间出现泛化能力差的问题,提出了一种基于Vision Transformer和迁移学习的婴儿哭声音频分类算法。首先,为实现数据集样本的扩增,采用了包括梅尔频谱转换和数据增强的数据预处理技术,进而达到了增强模型鲁棒性的目的。而后,在微调后的Vision Transformer模型上进行迁移学习训练,同时,训练过程中利用了LookAhead优化器来不断调整模型参数以避免过拟合,最终实验实现了对婴儿哭声音频的自动分类。实验结果表明,本实验模型相比其他深度学习模型具有更高的精确率和更快的收敛速度,同时还能有效地学习到婴儿哭声中更具区分性的特征。可以在新生儿监护、听力筛查和异常检测等领域中发挥重要作用。 展开更多
关键词 Vision Transformer模型 婴儿哭声 迁移学习 梅尔频谱图 LOOKAHEAD
下载PDF
基于锂电池高压放电检测的装置设计与研究
19
作者 束登峰 汪志成 +2 位作者 王海洋 黄泽海 陈金明 《现代制造技术与装备》 2024年第1期13-16,共4页
提出一种基于高压放电声音识别快速评估电池健康状态的方法,目的在于以尽可能短的时间评估锂电池的健康状态(State of Health,SOH),以便电池的重组和梯次利用。研究主要从电子迁移能力方面建立电池高压放电与健康状态的联系,分析电池在... 提出一种基于高压放电声音识别快速评估电池健康状态的方法,目的在于以尽可能短的时间评估锂电池的健康状态(State of Health,SOH),以便电池的重组和梯次利用。研究主要从电子迁移能力方面建立电池高压放电与健康状态的联系,分析电池在高压静电场中发生放电的声谱图特征,并将其作为电池SOH快速评估的依据。同时,针对方壳型磷酸铁锂电池搭建了一套自动化检测装置,并进行装置的结构和控制系统设计,实现了在5 min内完成单体电池的检测,极大地提高了锂电池的检测效率。 展开更多
关键词 锂电池 梯次利用 高压放电 声谱图 自动化检测
下载PDF
基于分治方法的声纹识别系统模型反演
20
作者 张骏飞 张雄伟 孙蒙 《信息安全研究》 CSCD 北大核心 2024年第2期130-138,共9页
模型反演越来越引起人们对隐私的关注,它可以从模型中重构私有隐私数据,从而引发更加严重的信息安全问题.针对语音信息安全,首次尝试了一个新的模型反演应用:从声纹识别系统中提取说话人语音的语谱图特征.为了减少反演过程中的复杂度及... 模型反演越来越引起人们对隐私的关注,它可以从模型中重构私有隐私数据,从而引发更加严重的信息安全问题.针对语音信息安全,首次尝试了一个新的模型反演应用:从声纹识别系统中提取说话人语音的语谱图特征.为了减少反演过程中的复杂度及误差,采用分治法的思想逐层反演,并通过循环一致性的有效监督,成功重构与说话人身份一致的反演样本;另外,由于语音的特殊性,模型特征层已包含丰富的说话人信息,进一步减弱语义信息相似后,改进的方法显著提高了反演样本的识别准确率,表明反演所得语谱图中已含有有效表示说话人身份的信息.实验结果证明了模型反演在语谱图上的可行性,突出了提取此类语音特征信息的深度网络模型所带来的隐私信息泄露风险. 展开更多
关键词 模型反演 神经网络 声纹识别 语谱图 信息安全
下载PDF
上一页 1 2 35 下一页 到第
使用帮助 返回顶部