-
题名基于长时平均频谱的“文本无关”话者识别
被引量:3
- 1
-
-
作者
王宏
向大威
-
机构
南京航空航天大学电子系
中国科学院东海研究站
-
出处
《声学技术》
CSCD
2002年第1期59-62,共4页
-
文摘
文章以动窗离散傅立叶变换为基础获取说话人的长时平均频谱 (即短时频谱的长时平均 ) ,然后将长时平均频谱经过能量归一化和频率归一化后作为“文本无关”话者识别的语音特征。分析之前 ,语音样本经过频域预加权和时域汉明窗加权处理 ,并利用帧能量门限自动去除了样本中的寂静段。通过在小人群范围内对该方法的大量实验 ,得到很好的话者识别效果。另外 ,作为“文本无关”话者识别的一个重要辅助手段 ,文章还利用短时频谱分析给出了话者语音样本的窄带三维语图和宽带三维语图 ,它们能清晰地给出话者语音的时变频率特征。
-
关键词
说话人识别
文本无关
长时平均频谱
三维语图
时变频率特征
语音识别
信号处理
-
Keywords
speaker identification
text independent
long term average spectrum
3d spectrogram
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名实时频谱测量技术在电力设备局部放电检测中的应用
被引量:6
- 2
-
-
作者
卢启付
-
机构
广东省电力试验研究所
-
出处
《广东电力》
2008年第8期28-31,共4页
-
文摘
传统的局部放电信号频谱研究通常是采用扫频式的频谱分析仪,其缺点是检测不到当前扫描之外的其它频率上的信号成分,可能漏掉间歇性的频谱信息。对于局部放电信号来说,其发生是随机的、间歇的。因此,扫频式的频谱测量会给局部放电检测带来测量误差,降低测量灵敏度。采用实时频谱测量技术对局部放电信号频谱进行了试验研究。研究发现,通过实时模式下频谱测量,可以捕获扫频频谱仪没有捕获的局部放电频谱信息。同时,测量形成的三维频谱图也能说明局放信号频谱信息的动态变化,这为UHF高频窄带法测量提供了试验依据。
-
关键词
局部放电检测
测量误差
实时频谱测量
三维频谱图
-
Keywords
partial discharge (PD) detection
measurement error
real-time spectrum measurement
3d spectrogram
-
分类号
TM835.4
[电气工程—高电压与绝缘技术]
-
-
题名基于三维卷积神经网络的虫音特征识别方法
- 3
-
-
作者
万永菁
王博玮
娄定风
-
机构
华东理工大学信息科学与工程学院
深圳海关
-
出处
《计算机应用》
CSCD
北大核心
2019年第9期2744-2748,共5页
-
基金
国家自然科学基金资助项目(61872143)
国家大学生创新创业训练计划项目(201810251064)~~
-
文摘
进口木材蛀虫检疫是海关的一项重要工作,但其存在着虫声检测算法准确率低、鲁棒性差等问题。针对这些问题,提出了一种基于三维卷积神经网络(3D CNN)的虫音检测方法以实现虫音特征的识别。首先,对原始虫音音频进行交叠分帧预处理,并使用短时傅里叶变换得到虫音音频的语谱图;然后,将语谱图作为3D CNN的输入,使其通过包含三层卷积层的3D CNN以判断音频中是否存在虫音特征。通过设置不同分帧长度下的输入进行网络训练及测试;最后以准确率、F 1分数以及ROC曲线作为评估指标进行性能分析。结果表明,在交叠分帧长度取5 s时,训练及测试效果最佳。此时,3D CNN模型在测试集上的准确率达到96.0%,F 1分数为0.96,且比二维卷积神经网络(2D CNN)模型准确率提高近18%。说明所提算法能准确地从音频信号中提取虫音特征并完成蛀虫识别任务,为海关检验检疫提供有力保障。
-
关键词
三维卷积神经网络
短时傅里叶变换
语谱图
虫音识别
声学信号处理
-
Keywords
Three-Dimensional Convolutional Neural Network(3d CNN)
Short-Time Fourier Transform(STFT)
spectrogram
insect sound detection
acoustic signal processing
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-