期刊文献+
共找到686篇文章
< 1 2 35 >
每页显示 20 50 100
Health Monitoring of Milling Tool Inserts Using CNN Architectures Trained by Vibration Spectrograms 被引量:1
1
作者 Sonali S.Patil Sujit S.Pardeshi Abhishek D.Patange 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第7期177-199,共23页
In-process damage to a cutting tool degrades the surface􀀀nish of the job shaped by machining and causes a signi􀀀cant􀀀nancial loss.This stimulates the need for Tool Condition Monitoring(TCM)t... In-process damage to a cutting tool degrades the surface􀀀nish of the job shaped by machining and causes a signi􀀀cant􀀀nancial loss.This stimulates the need for Tool Condition Monitoring(TCM)to assist detection of failure before it extends to the worse phase.Machine Learning(ML)based TCM has been extensively explored in the last decade.However,most of the research is now directed toward Deep Learning(DL).The“Deep”formulation,hierarchical compositionality,distributed representation and end-to-end learning of Neural Nets need to be explored to create a generalized TCM framework to perform eciently in a high-noise environment of cross-domain machining.With this motivation,the design of dierent CNN(Convolutional Neural Network)architectures such as AlexNet,ResNet-50,LeNet-5,and VGG-16 is presented in this paper.Real-time spindle vibrations corresponding to healthy and various faulty con􀀀gurations of milling cutter were acquired.This data was transformed into the time-frequency domain and further processed by proposed architectures in graphical form,i.e.,spectrogram.The model is trained,tested,and validated considering dierent datasets and showcased promising results. 展开更多
关键词 Milling tool inserts health monitoring vibration spectrograms deep learning convolutional neural network
下载PDF
Continuous frequency and phase spectrograms: a study of their 2D and 3D capabilities and application to musical signal analysis 被引量:1
2
作者 Laurent NAVARRO Guy COURBEBAISSE Jean-Charles PINOLI 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2008年第2期199-206,共8页
A new lighting and enlargement on phase spectrogram (PS) and frequency spectrogram (FS) is presented in this paper. These representations result from the coupling of power spectrogram and short time Fourier transf... A new lighting and enlargement on phase spectrogram (PS) and frequency spectrogram (FS) is presented in this paper. These representations result from the coupling of power spectrogram and short time Fourier transform (STFT). The main contribution is the construction of the 3D phase spectrogram (3DPS) and the 3D frequency spectrogram (3DFS). These new tools allow such specific test signals as small slope linear chirp, phase jump case of musical signal analysis is reported. The main objective is to and small frequency jump to be analyzed. An application detect small frequency and phase variations in order to characterize each type of sound attack without losing the amplitude information given by power spectrogram 展开更多
关键词 Frequency spectrogram (FS) Phase spectrogram (PS) Time-frequency representations Musical signals
下载PDF
Research on data diagnosis method of acoustic array sensor device based on spectrogram 被引量:3
3
作者 Xing Lei Hang Ji +3 位作者 Qiang Xu Ting Ye Shengfu Zhang Chengjun Huang 《Global Energy Interconnection》 EI CAS CSCD 2022年第4期418-433,共16页
Acoustic array sensor device for partial discharge detection is widely used in power equipment inspection with the advantages of non-contact and precise positioning compared with partial discharge detection methods su... Acoustic array sensor device for partial discharge detection is widely used in power equipment inspection with the advantages of non-contact and precise positioning compared with partial discharge detection methods such as ultrasonic method and pulse current method.However,due to the sensitivity of the acoustic array sensor and the influence of the equipment operation site interference,the acoustic array sensor device for partial discharge type diagnosis by phase resolved partial discharge(PRPD)map might occasionally presents incorrect results,thus affecting the power equipment operation and maintenance strategy.The acoustic array sensor detection device for power equipment developed in this paper applies the array design model of equal-area multi-arm spiral with machine learning fast fourier transform clean(FFT-CLEAN)sound source localization identification algorithm to avoid the interference factors in the noise acquisition system using a single microphone and conventional beam forming algorithm,improves the spatial resolution of the acoustic array sensor device,and proposes an acoustic array sensor device based on the acoustic spectrogram.The analysis and diagnosis method of discharge type of acoustic array sensor device can effectively reduce the system misjudgment caused by factors such as the resolution of the acoustic imaging device and the time domain pulse of the digital signal,and reduce the false alarm rate of the acoustic array sensor device.The proposed method is tested by selecting power cables as the object,and its effectiveness is proved by laboratory verification and field verification. 展开更多
关键词 Acoustic array sensor device Acoustic spectrogram Partial discharge Power equipment False alarm rate
下载PDF
User Recognition System Based on Spectrogram Image Conversion Using EMG Signals 被引量:1
4
作者 Jae Myung Kim Gyu Ho Choi +1 位作者 Min-Gu Kim Sung Bum Pan 《Computers, Materials & Continua》 SCIE EI 2022年第7期1213-1227,共15页
Recently,user recognitionmethods to authenticate personal identity has attracted significant attention especially with increased availability of various internet of things(IoT)services through fifth-generation technol... Recently,user recognitionmethods to authenticate personal identity has attracted significant attention especially with increased availability of various internet of things(IoT)services through fifth-generation technology(5G)based mobile devices.The EMG signals generated inside the body with unique individual characteristics are being studied as a part of nextgeneration user recognition methods.However,there is a limitation when applying EMG signals to user recognition systems as the same operation needs to be repeated while maintaining a constant strength of muscle over time.Hence,it is necessary to conduct research on multidimensional feature transformation that includes changes in frequency features over time.In this paper,we propose a user recognition system that applies EMG signals to the short-time fourier transform(STFT),and converts the signals into EMG spectrogram images while adjusting the time-frequency resolution to extract multidimensional features.The proposed system is composed of a data pre-processing and normalization process,spectrogram image conversion process,and final classification process.The experimental results revealed that the proposed EMG spectrogram image-based user recognition system has a 95.4%accuracy performance,which is 13%higher than the EMGsignal-based system.Such a user recognition accuracy improvement was achieved by using multidimensional features,in the time-frequency domain. 展开更多
关键词 EMG user recognition spectrogram CNN
下载PDF
一个面向短波通信的LHOG话音检测方法
5
作者 白洁 田瑞丽 +1 位作者 任一夫 员建厦 《计算机科学》 CSCD 北大核心 2024年第S01期1144-1148,共5页
噪声环境下语音检测准确率偏低是短波通话面临的公开挑战。当前已有方法应用有限,其根源在于难以可靠地在噪音环境下提取准确且高效的语音特征。针对上述问题,提出了一个面向短波通信的低秩方向梯度直方图(Low-rank Histogram of Orient... 噪声环境下语音检测准确率偏低是短波通话面临的公开挑战。当前已有方法应用有限,其根源在于难以可靠地在噪音环境下提取准确且高效的语音特征。针对上述问题,提出了一个面向短波通信的低秩方向梯度直方图(Low-rank Histogram of Oriented Gradient,LHOG)话音检测方法。首先,对目标音频源数据进行预处理,实现噪声环境下语音信息的可视化表征;然后,在HOG特征提取器中嵌入低秩化结构,缓解特征中的冗余信息,并降低噪声干扰,从而获得准确且高效的特征;最后,通过常用的SVM分类模型便可在噪声环境中准确快速地区分话音和噪声。测试结果表明,该方法的准确率达到了95.12%,误报率仅为0.96%,漏报率为13.14%。与现有主流方法的对比实验证明,该方法话音检测准确率高,资源占用少,能够有效提高短波通信侦控效率。 展开更多
关键词 模式识别 语谱图 方向梯度直方图 低秩结构 支持向量机
下载PDF
心音频谱图在二尖瓣反流患者左心室功能监测中的作用
6
作者 张文俐 屈雪蒸 +1 位作者 宋蓓 张瑞岩 《心脑血管病防治》 2024年第1期9-12,20,共5页
目的探求使用可穿戴设备获取心音频谱图,观察不同程度二尖瓣反流(MR)患者心音频谱特征在左心室功能监测中的作用。方法入选2020年6月至2021年5月因心血管疾病入住上海交通大学医学院附属瑞金医院的102例MR患者,根据心脏超声MR反流束面积... 目的探求使用可穿戴设备获取心音频谱图,观察不同程度二尖瓣反流(MR)患者心音频谱特征在左心室功能监测中的作用。方法入选2020年6月至2021年5月因心血管疾病入住上海交通大学医学院附属瑞金医院的102例MR患者,根据心脏超声MR反流束面积/左心房面积比值超过20%将其分为轻度MR组72例和中度及以上MR组30例。基于心音频谱图对心音持续时间、最大声强、最大心音振幅进行分析,并与心脏超声测定的左心室射血分数(LVEF)进行相关性分析。结果心音频谱图第一心音持续时间与收缩期持续时间比值(S11-S12/S11-S21)与LVEF呈线性负相关(r=-0.535,P<0.01),S11-S12/S11-S21用于判定LVEF降低(LVEF<50%)曲线下面积为0.840(95%CI=0.756~0.924,P<0.01),截断值是55.50%,敏感度78.6%,特异度83.3%。结论心音频谱图提示,MR患者心脏收缩期第一心音持续时间占比与LVEF呈负相关性,在二尖瓣病患的心功能居家监测中存在潜在的应用价值。 展开更多
关键词 二尖瓣反流 心音频谱图 收缩期持续时间 左心室射血分数
下载PDF
基于语谱图的管制员疲劳状态检测研究
7
作者 杨昌其 冯筱晴 +1 位作者 张雨萱 蔡子牛 《航空工程进展》 CSCD 2024年第2期49-55,共7页
现阶段利用陆空通话语音对管制员疲劳状态的研究中,大多只考虑了语音在时域或频域的变化,而忽视了疲劳会同时在时域与频域上产生影响。将三种疲劳状态下的陆空通话语音分别转化为可同时反映时域与频域特性的语音频谱图像,利用灰度共生... 现阶段利用陆空通话语音对管制员疲劳状态的研究中,大多只考虑了语音在时域或频域的变化,而忽视了疲劳会同时在时域与频域上产生影响。将三种疲劳状态下的陆空通话语音分别转化为可同时反映时域与频域特性的语音频谱图像,利用灰度共生矩阵提取四维典型的特征参数,对比管制员在不同状态下特征参数的变化情况,构建管制员疲劳检测模型并对输入特征进行检测。结果表明:利用语谱图特征结合传统特征作为输入特征的检测准确率最高,达到95.49%,较单一使用传统特征的检测准确率高出4%;管制员疲劳状态的变化会直观地反映在语谱图上,会对其特征值产生影响,利用这种影响对管制员疲劳状态进行检测,可以得到良好的检测结果。 展开更多
关键词 管制员 疲劳检测 语谱图 灰度共生矩阵 机器学习
下载PDF
双解码卷积循环网络风噪声有源控制
8
作者 吴礼福 葛文昌 +1 位作者 陈晨 王绍博 《南京信息工程大学学报》 CAS 北大核心 2024年第5期678-687,共10页
本文提出一种利用双解码卷积循环网络(Dual-decoder Convolutional Recurrent Network,DCRN)代替FxLMS(Filtered-x Least Mean Square)算法的有源噪声控制方法,考虑到相位信息在有源噪声控制(Active Noise Control,ANC)中的重要性,DCRN... 本文提出一种利用双解码卷积循环网络(Dual-decoder Convolutional Recurrent Network,DCRN)代替FxLMS(Filtered-x Least Mean Square)算法的有源噪声控制方法,考虑到相位信息在有源噪声控制(Active Noise Control,ANC)中的重要性,DCRN网络的输入特征为噪声信号的复数频谱(包括实部谱和虚部谱).网络结构中,采用编码模块从噪声复数频谱中提取特征,利用双解码模块分别估计网络输出的实部谱和虚部谱,采用参数共享机制和组策略以降低训练参数的数量并提高网络的学习能力和泛化能力.特别是针对风噪声,选用新的损失函数以及对训练数据进行正则化处理以提升DCRN的性能.实验结果表明,DCRN方法在仿真环境与有源降噪耳机环境下对一般噪声和风噪声都表现出良好的降噪性能和鲁棒性. 展开更多
关键词 双解码卷积循环网络 有源噪声控制 FXLMS算法 复数频谱
下载PDF
合成语声的声学分析及识别特征算法 被引量:1
9
作者 周峻林 胡晓光 +2 位作者 黄子旭 汪旭 付哲宇 《应用声学》 CSCD 北大核心 2024年第1期131-141,共11页
当前社会新型犯罪中电信诈骗案件频发,急需一种能够自动有效区分语声真伪的方法。为进一步增强目前深度学习领域识别合成语声的能力,为保障语声信息安全提供技术上的支持,针对合成语声声学特性上异于真实语声的特点,分析对比合成语声和... 当前社会新型犯罪中电信诈骗案件频发,急需一种能够自动有效区分语声真伪的方法。为进一步增强目前深度学习领域识别合成语声的能力,为保障语声信息安全提供技术上的支持,针对合成语声声学特性上异于真实语声的特点,分析对比合成语声和真实语声的声学特性,设计了一种声学特征均方根角量化语声声强变化程度,结合基频变化率和语声窄带频谱图声学特征进行融合,量化了声学特性差异,聚焦了合成语声中关键声学信息。在神经网络模型中融合输入声学特征,在FoR数据集的验证集上得到了0.6%的等错误率,在测试集上最好结果达到了10.8%的等错误率。该文成功实现了对合成语声的识别,证实了声学特征的有效性和研究方案的可行性,在一定程度上拓宽了合成语声特征设计的研究思路。 展开更多
关键词 声学特征 声强 基频 语声频谱图 神经网络
下载PDF
基于Mel声谱图与改进SEResNet的鱼类行为识别 被引量:1
10
作者 杨雨欣 于红 +3 位作者 杨宗轶 涂万 张鑫 林远山 《渔业现代化》 CSCD 北大核心 2024年第1期56-63,共8页
养殖环境中饲料投放、水流变化等刺激源导致鱼类声音分辨难,使行为识别准确率不高,为解决上述问题,提出基于Mel声谱图(Mel spectrogram)与改进SEResNet的鱼类行为识别模型TAP-SEResNet。首先针对鱼类行为声音频率波动大、特征差异小,造... 养殖环境中饲料投放、水流变化等刺激源导致鱼类声音分辨难,使行为识别准确率不高,为解决上述问题,提出基于Mel声谱图(Mel spectrogram)与改进SEResNet的鱼类行为识别模型TAP-SEResNet。首先针对鱼类行为声音频率波动大、特征差异小,造成特征提取难的问题,采用高分辨率、特征表示较好的Mel声谱图以捕捉鱼类声音的频谱特征。其次针对鱼类声音特征关键信息易丢失的难题,提出在SEResNet模型中融合时序聚合池化层(Temporal Aggregated Pooling,TAP),提取池化区域的最大值和平均值,保留鱼类行为更多细粒度声音特征,提高识别准确率。为验证所提模型的有效性,分别设计了消融试验和模型性能对比试验,试验结果显示:TAP-SEResNet相比SEResNet在不降低检测速度的条件下准确率提升了3.23%;相比PANNS-CNN14、ECAPA-TDNN及MFCC+ResNet等先进声音识别模型,TAP-SEResNet在准确率上分别提升了5.32%、2.80%和1.64%。所提模型有助于养殖过程中对鱼类行为实现精准监测,对精准养殖具有重要的推动作用。 展开更多
关键词 鱼类行为识别 被动水声信号 Mel声谱图 SEResNet
下载PDF
基于实体GIS设备试验的局部放电光学信号传播特性研究 被引量:1
11
作者 韩旭涛 史天一 +7 位作者 王昊天 周阳 陈欢 张轩瑞 李军浩 李兴旺 姚聪伟 孙帅 《广东电力》 北大核心 2024年第3期82-89,共8页
光测法具有电磁免疫性,特别适用于具有封闭结构的气体绝缘开关设备(gas insulated switchgear, GIS)局部放电检测,但是光信号在传播过程中易因传播距离增加或部件遮挡而快速衰减。为此,基于110 kV实际GIS设备开展局部放电光学信号传播... 光测法具有电磁免疫性,特别适用于具有封闭结构的气体绝缘开关设备(gas insulated switchgear, GIS)局部放电检测,但是光信号在传播过程中易因传播距离增加或部件遮挡而快速衰减。为此,基于110 kV实际GIS设备开展局部放电光学信号传播特性试验,研究传播距离和绝缘子遮挡对导杆尖刺缺陷和悬浮电位缺陷局部放电光信号的影响规律。结果表明,随着传播距离的增加:尖刺缺陷检测到光信号最大幅值和放电数均有所衰减,放电谱图变化不大;悬浮缺陷放电光信号幅值明显衰减,放电数不变,放电谱图特征逐渐失去“矩形”特征。此外,当光学信号透过带有通气孔的绝缘子传播时,光学信号明显衰减,且幅值波动较大。 展开更多
关键词 气体绝缘开关设备 光测法 传播特性 实体设备 放电谱图
下载PDF
基于最小二乘图像坐标修正的中阶梯光谱仪谱图还原算法
12
作者 欧阳羽轩 傅骁 +2 位作者 段发阶 王宽 吴靓昕 《光电工程》 CAS CSCD 北大核心 2024年第7期125-138,共14页
中阶梯光谱仪具有交叉色散特征,二维谱图还原是决定其波长测量准确性的关键环节,但是环境变化、加工装调等引起的光斑坐标变化对谱图还原精度造成严重影响。本文提出了一种基于最小二乘图像坐标修正的中阶梯光谱仪谱图还原算法,首先提... 中阶梯光谱仪具有交叉色散特征,二维谱图还原是决定其波长测量准确性的关键环节,但是环境变化、加工装调等引起的光斑坐标变化对谱图还原精度造成严重影响。本文提出了一种基于最小二乘图像坐标修正的中阶梯光谱仪谱图还原算法,首先提取校准汞灯光源多波长光斑质心坐标,利用理论像点和实际像点坐标构建系数矩阵,通过最小二乘法估计获得二维像面的平移、缩放、旋转系数,再采用多项式拟合减小残差影响,实现不同波长光斑的图像坐标修正,进而实现波长精确解算。实验结果显示,该算法能有效提高中阶梯光谱仪的谱图还原精度,在模拟较大装调误差条件下,修正后坐标与理想坐标偏差小于0.6个像元,证明了该算法具有较高的精度。 展开更多
关键词 光谱学 光谱仪 二维光谱图 质心提取 谱图还原
下载PDF
基于欠定盲源分离和深度学习的生猪状态音频识别
13
作者 潘伟豪 盛卉子 +4 位作者 王春宇 闫顺丕 周小波 辜丽川 焦俊 《华南农业大学学报》 CAS CSCD 北大核心 2024年第5期730-742,共13页
【目的】为解决群养环境下生猪音频难以分离与识别的问题,提出基于欠定盲源分离与E C A-EfficientNetV2的生猪状态音频识别方法。【方法】以仿真群养环境下4类生猪音频信号作为观测信号,将信号稀疏表示后,通过层次聚类估计出信号混合矩... 【目的】为解决群养环境下生猪音频难以分离与识别的问题,提出基于欠定盲源分离与E C A-EfficientNetV2的生猪状态音频识别方法。【方法】以仿真群养环境下4类生猪音频信号作为观测信号,将信号稀疏表示后,通过层次聚类估计出信号混合矩阵,并利用lp范数重构算法求解lp范数最小值以完成生猪音频信号重构。将重构信号转化为声谱图,分为进食声、咆哮声、哼叫声和发情声4类,利用ECA-EfficientNetV2网络模型识别音频,获取生猪状态。【结果】混合矩阵估计的归一化均方误差最低为3.266×10^(−4),分离重构的音频信噪比在3.254~4.267 dB之间。声谱图经ECA-EfficientNetV2识别检测,准确率高达98.35%;与经典卷积神经网络ResNet50和VGG16对比,准确率分别提升2.88和1.81个百分点;与原EfficientNetV2相比,准确率降低0.52个百分点,但模型参数量减少33.56%,浮点运算量(FLOPs)降低1.86 G,推理时间减少9.40 ms。【结论】基于盲源分离及改进EfficientNetV2的方法,轻量且高效地实现了分离与识别群养生猪音频信号。 展开更多
关键词 盲源分离 声谱图 音频识别 稀疏重构 卷积神经网络
下载PDF
基于二维时频谱图与改进YOLOv5的电能质量扰动识别
14
作者 李欣 吕干云 +4 位作者 龚彧 毕睿华 叶加星 刘晓宏 于相宜 《浙江电力》 2024年第10期35-44,共10页
随着新型电力系统中新能源渗透率逐渐升高,电网结构复杂性增加,PQD(电能质量扰动)呈现多样化和复杂化的趋势。为实现电能质量扰动的精准识别,提出一种基于二维时频谱图与改进YOLOv5的电能质量扰动图像识别的方法。首先,利用S变换将PQD... 随着新型电力系统中新能源渗透率逐渐升高,电网结构复杂性增加,PQD(电能质量扰动)呈现多样化和复杂化的趋势。为实现电能质量扰动的精准识别,提出一种基于二维时频谱图与改进YOLOv5的电能质量扰动图像识别的方法。首先,利用S变换将PQD数据映射成二维时频谱图,通过图像来表征时间、频率和幅值的扰动细节特征;然后,搭建引入ASPP(空洞空间卷积池化金字塔)结构和注意力机制的YO-LOv5训练网络,扩大特征图的感受野以充分提取扰动图像特征,进而以图像识别方法实现PQD分类识别;最后,利用仿真数据进行扰动识别准确率和鲁棒性的验证。结果表明,该方法的识别准确率较高,且图像识别法的引入有助于PQD识别结果的可视化。 展开更多
关键词 电能质量扰动图像识别 时频谱图像 YOLOv5 空洞空间卷积池化金字塔 注意力机制
下载PDF
基于非线性语谱图联合判决的语种识别
15
作者 段云 邵玉斌 +1 位作者 龙华 杜庆治 《微电子学与计算机》 2024年第5期99-108,共10页
针对灰度对数语谱图对基频拉伸幅度过大,短时长语音识别率提升受限的问题,提出一种非线性语谱图联合判决的语种识别方法。首先,对语音进行能量归一化,提取对数功率谱,将频率刻度按照人耳听觉感知进行非线性映射得到非线性语谱图。然后,... 针对灰度对数语谱图对基频拉伸幅度过大,短时长语音识别率提升受限的问题,提出一种非线性语谱图联合判决的语种识别方法。首先,对语音进行能量归一化,提取对数功率谱,将频率刻度按照人耳听觉感知进行非线性映射得到非线性语谱图。然后,将非线性语谱图按词关联特性进行等间隔拆分,在ResNet网络后端加入联合判决层;输出语音所属语种类型。实验结果表明,所提方法有效改善灰度对数语谱图的缺点,识别性能均高于语谱图及改进特征。联合判决对切分时长为1.0 s的样本语音取得的识别效果最佳,在广播音频数据集中,识别率达到94.25%;在VoxForge公共语料集中,识别率达到98.94%。 展开更多
关键词 语种识别 语谱图 非线性 联合判决 神经网络
下载PDF
天行长臂猿鸣唱的声谱特征与性别差异
16
作者 郭亭妍 马海港 +8 位作者 韩普 王子荻 祝常悦 楚原梦冉 张利祥 李如雪 戚嘉儒 李家华 范朋飞 《兽类学报》 CAS CSCD 北大核心 2024年第1期14-25,共12页
白眉长臂猿属(Hoolock)物种声音长期被认为不具有性二型,但是识别其声音的性别差异有助于该属物种的种群动态监测与行为学研究。本研究以天行长臂猿(Hoolock tianxing)作为研究对象,标注了11个个体的鸣声数据。我们通过k‑中心点聚类(k‑m... 白眉长臂猿属(Hoolock)物种声音长期被认为不具有性二型,但是识别其声音的性别差异有助于该属物种的种群动态监测与行为学研究。本研究以天行长臂猿(Hoolock tianxing)作为研究对象,标注了11个个体的鸣声数据。我们通过k‑中心点聚类(k‑medoids聚类)识别音节类型,基于音节组成和音句长度划分音句类型,并且识别了音节特征和音句使用上的性别差异。本研究识别出wa、oo、whoop、ow和eek 5种音节类型以及7种音句类型。雌性的wa和ow音节频率变化的幅度与速率比雄性更大;oo音节的各项频率指标比雄性更低;whoop音节频率变化的幅度与速率相比于雄性更小。在音句的使用上,独猿个体鸣叫的音句与合唱时各自性别贡献的部分更为相似,雄性极少唱主要由whoop音节与ow音节组成的音句G,雌性极少唱音句B(wa-whoop)和C(wa-oo-wawhoop)。本研究表明天行长臂猿的声音中存在性二型,该性别差异不仅有助于对天行长臂猿的监测,而且有助于理解不同声音类型及性别差异的功能。 展开更多
关键词 白眉长臂猿 声谱分析 声音通讯 鸣唱 性二型
下载PDF
Joint spectrogram segmentation and ridge-extraction method for separating multimodal guided waves in long bones 被引量:10
17
作者 ZHANG ZhengGang XU KaiLiang +1 位作者 TA DeAn WANG WeiQi 《Science China(Physics,Mechanics & Astronomy)》 SCIE EI CAS 2013年第7期1317-1323,共7页
Ultrasonic guided waves (GWs) can be used to evaluate long bones effectively because of the ability to provide the information of the whole bone. In this study, a joint spectrogram segmentation and ridge-extraction (J... Ultrasonic guided waves (GWs) can be used to evaluate long bones effectively because of the ability to provide the information of the whole bone. In this study, a joint spectrogram segmentation and ridge-extraction (JSSRE) method was proposed to separate multiple modes in long bones. First, the Gabor time-frequency transform was applied to obtain the spectrogram of multimodal signals. Then, a multi-class image segmentation algorithm was used to find the corresponding region of each mode in the spectrogram, including an improved watershed transform and a region growing procedure. Finally, the ridges were extracted and the time domain signals representing individual modes were reconstructed from these ridges in each region. The validations of this method were discussed by simulated multimodal signals with different signal-to-noise ratios (SNR). The correlation coefficients between the original signals without noise and the reconstructed signals were calculated to analyze the results quantitatively. The results showed that the extracted ridges were in good agreement with generated theoretical dispersion curves, and the reconstructed signals were highly related to the original signals, even under the SNR=3 dB situation. 展开更多
关键词 multimodal guided waves long bone spectrogram SEGMENTATION
原文传递
基于Mel-GADF与ConvNeXt-T的变压器铁心松动故障诊断方法
18
作者 万可力 马宏忠 +1 位作者 崔佳嘉 王健 《电力自动化设备》 EI CSCD 北大核心 2024年第3期217-224,共8页
为解决传统梅尔(Mel)时频谱图对变压器铁心松动程度识别率较低的问题,提出一种基于梅尔-格拉姆角差场(Mel-GADF)时频谱图与ConvNeXt-T网络相结合的变压器铁心松动故障诊断模型。将变压器声纹信号生成Mel时频谱图,同时将原始声纹数据经... 为解决传统梅尔(Mel)时频谱图对变压器铁心松动程度识别率较低的问题,提出一种基于梅尔-格拉姆角差场(Mel-GADF)时频谱图与ConvNeXt-T网络相结合的变压器铁心松动故障诊断模型。将变压器声纹信号生成Mel时频谱图,同时将原始声纹数据经过格拉姆角场(GAF)变换得到格拉姆角和场(GASF)与GADF这2种时频谱图;生成Mel-GASF与Mel-GADF这2种特征融合的时频谱图来弥补Mel时频谱图的低频缺失问题;将3种时频谱图放入ConvNeXt-T网络进行训练对比,选出效果最佳的诊断模型。以型号为S13-M-200/10的变压器为对象进行空载试验,对不同铁心松动程度下的声纹信号进行分析,分析结果表明,将Mel-GADF作为特征时频谱图结合ConvNeXt-T网络,可将测试集准确率从传统Mel时频谱图的98.273%提升至99.500%,提升了1.227个百分点。 展开更多
关键词 变压器 铁心松动 Mel时频谱图 格拉姆角场 卷积神经网络 迁移学习
下载PDF
基于LPDMR-NET的鸟鸣声识别
19
作者 王娅茹 唐璐 +2 位作者 陈爱斌 彭伟雄 沈平 《计算机工程》 CAS CSCD 北大核心 2024年第10期174-184,共11页
为了高效且快速地识别自然环境中的鸟鸣声,提出一种基于轻量级逐点深度的多感受野注意力残差网络(LPDMR-NET)模型。首先,通过Mel滤波器生成Mel频谱图。接着,采用basicblock和downblock连接生成两层残差网络DBNet,堆叠DBNet作为鸟鸣声识... 为了高效且快速地识别自然环境中的鸟鸣声,提出一种基于轻量级逐点深度的多感受野注意力残差网络(LPDMR-NET)模型。首先,通过Mel滤波器生成Mel频谱图。接着,采用basicblock和downblock连接生成两层残差网络DBNet,堆叠DBNet作为鸟鸣声识别的主干网络,以提高训练速度。然后,利用逐点深度卷积网络(PDNet)提取频谱图特征信息,替代主干网络下采样模块,将两个残差模块的basicblock中的3×3卷积替换为分离分支块(DBB),引入不同的感受野,在复杂多分支结构下显著提高网络的识别性能。最后,在两个残差模块间嵌入轻量级高效置换注意力(SA)模块用于传递两层残差模块间的有效信息,增强频谱图波纹特征,进一步提高网络识别性能。在自建的30类鸟鸣声数据集Birdselfdata上的实验结果表明,该模型的识别准确率为96.82%、F1值为96.73%,在识别效率和准确性方面超越了对比模型。 展开更多
关键词 卷积神经网络 鸟鸣声分类 深度学习 Mel频谱图 残差网络 深度可分离卷积
下载PDF
基于鲁棒纹理特征的环境声音事件检测方法
20
作者 吴婷 刘琼 郭慧茹 《电子器件》 CAS 2024年第2期530-535,共6页
针对各种类别的环境声音事件检测问题,提出了基于鲁棒纹理特征的环境声音事件检测方法。首先,将原始的声音样本转换为类伽马声谱图;然后将类伽马声谱图通过剪切波变换提取图像的纹理特征;又采用中心化二值模式(CBP)算法进行编码;针对特... 针对各种类别的环境声音事件检测问题,提出了基于鲁棒纹理特征的环境声音事件检测方法。首先,将原始的声音样本转换为类伽马声谱图;然后将类伽马声谱图通过剪切波变换提取图像的纹理特征;又采用中心化二值模式(CBP)算法进行编码;针对特征维度过高问题,先利用随机森林算法后结合主成分分析(PCA)算法,提出了RF-PCA降维方法;最后使用支持向量机(SVM)对不同环境的声音进行分类。在公开数据集ESC-10上的仿真实验结果表明,利用所提出的基于鲁棒纹理特征的环境声音事件检测方法所提取的特征对声音分类可达到93.00%的分类效果。 展开更多
关键词 环境声音分类 类伽马声谱图 SHEARLET变换 CBP算法 RF-PCA
下载PDF
上一页 1 2 35 下一页 到第
使用帮助 返回顶部