-
题名基于频域能量分布分析的自适应元音帧提取算法
被引量:7
- 1
-
-
作者
钱博
李燕萍
唐振民
徐利敏
-
机构
南京理工大学模式识别与智能系统实验室
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2007年第2期279-282,共4页
-
文摘
本文提出了一种基于频域能量分布分析的自适应元音帧提取算法.该方法采用MEL标度映射各频率分量,通过分析低频、高频能量的分布关系判定元音帧并计算出该帧的短时能量、短时平均过零率的值指导时域帧提取的方案.为了适应连续语音检测过程中响度大小的不断变化,文中选择了按概率抽样进行频域分析修正时域阈值的方式.这种方式利用较少抽样帧的变换分析指导时域检测,相对于全面变换分析降低了运算量,达到了实时检测的要求,同时提高了整体检测性能.实验表明,该方法总体运算量低,同时对发声过程中的音量变化有一定的自适应性.实验中,针对单字音元音帧的正确提取率达到了97%以上,平均丢帧率为3.95%;针对连续语音的正确提取率也达到了90%以上.
-
关键词
元音帧提取
频域分析
自适应
NEL标度频谱
-
Keywords
vowel-frame detection
frequency-domain analysis
self-adaptive
MEL-scale features
-
分类号
TN912.34
[电子电信—通信与信息系统]
-