-
题名采用Mel倒谱参数的咳嗽声识别方法
被引量:2
- 1
-
-
作者
尹永
莫鸿强
-
机构
华南理工大学自动化科学与工程学院
-
出处
《信息技术》
2012年第10期85-91,共7页
-
文摘
在诊断一个有慢性咳嗽的病人时,他的咳嗽强度和频率评估能提供很有价值的信息。因此提高咳嗽识别率,对疾病的诊断有着重要意义。从语音识别中被广泛应用的Mel倒谱参数出发,寻找咳嗽和语音在Mel倒谱参数中的区别。基于Mel倒谱参数的原理,将其计算过程中的Mel刻度滤波器对数能量的极值数分布情况提取出来作为咳嗽的识别特征。在病房环境下对录音文件进行实验,得到的咳嗽识别率为90%以上,同时能够将语音等非咳嗽信号有效地剔除,实验结果显示90%以上的语音信号被排除。在录音设备及环境等各项参数不变的条件下,对不同病人样本,可使用同一阈值对咳嗽进行识别。该方法过程简单,数据计算量小,便于快速识别。
-
关键词
Mel倒谱参数(Mel-Frequency
CEPSTRUM
Coefficient
MFCC)
Mel刻度滤波器对数能量
咳嗽识别
-
Keywords
Mel-frequency cepstrum coefficient
mel scale filter logarithmic energy
cough recognition
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名基于DSP5416芯片的语音识别系统
- 2
-
-
作者
王桂珍
赵明建
-
机构
南京工程学院计算机工程学院
-
出处
《电脑知识与技术》
2008年第5期711-712,719,共3页
-
文摘
本文主要论述了一种小词表语音识别系统的硬、软件设计方法。系统以DSP5416为硬件平台,采用非线性美尔刻度倒谱参数(MFCC)特征参数提取算法,动态时间规整(DTW)作为识别算法,实现了语音识别系统的设计。实验结果表明平均语音识别率不低于90%,取得良好的识别效果。
-
关键词
数字信号处理
语音识别
非线性美尔刻度倒谱参数
动态时间规整
-
Keywords
DSP
Speech Recognition
MFCC
DTW
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进的MFCC战场被动声目标识别
被引量:7
- 3
-
-
作者
蒋永生
张雄伟
闵刚
刘光云
陈功
-
机构
解放军理工大学
[
-
出处
《弹箭与制导学报》
CSCD
北大核心
2008年第6期231-234,共4页
-
文摘
从战场声信号与语音信号特征的相似性出发,提出基于MFCC参数的战场声目标识别方法。针对战场环境存在强噪声干扰情况,提出一种改进的MFCC特征参数(DWTMFCC)提取方法,该方法将小波分析和Mel倒谱分析结合,提高了特征参数的鲁棒性。仿真结果表明:在噪声条件下,利用DWTMFCC参数进行声目标识别,平均识别率比MFCC参数高出3.134个百分点,信噪比为5dB时,识别率仍达到93.67%。
-
关键词
被动声目标
目标识别
美尔倒谱参数
离散小波变换
鲁棒性
-
Keywords
passive acoustic target
target identification
MFCC
discrete wavelet transform
robust
-
分类号
TN911
[电子电信—通信与信息系统]
-
-
题名采用主成分分析的特征映射
被引量:8
- 4
-
-
作者
郭武
戴礼荣
王仁华
-
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
-
出处
《自动化学报》
EI
CSCD
北大核心
2008年第8期876-879,共4页
-
基金
国家高技术研究发展计划(863计划)(2006AA010104)
中国科学技术大学青年教师基金资助~~
-
文摘
在与文本无关的说话人识别研究中,特征映射的方法可以有效减少信道的影响.本文首先通过主成分分析的方法在模型域中估计出信道因子所在的空间,然后通过映射的方法在特征参数域中减去信道因子的影响.采用这种方法需要有信道信息标记的数据,但是在特征映射时不需要对信道进行判决.在NIST 2006年SRE lconv4w-lconv4w数据库上,采用本文推荐方法的系统相对基线系统在等错误率上降低了19%.
-
关键词
说话人确认
混合高斯模型
超矢量
梅尔刻度式倒谱参数
-
Keywords
Speaker verification, Gaussian mixture model (GMM), supervector, Mel frequency cepstral coefficients (MFCC)
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于模型距离和支持向量机的说话人确认
被引量:2
- 5
-
-
作者
姚红
梁栋
郭武
-
机构
安徽大学计算智能与信号处理教育部重点实验室
中国科学技术大学电子工程与信息科学系
-
出处
《计算机仿真》
CSCD
北大核心
2009年第3期343-346,共4页
-
文摘
针对采用支持向量机的说话人的确认问题,提出采用背景模型、说话人模型、测试语句模型间距离和夹角作为支持向量机的特征矢量,同时将组特征矢量与广义线性判别式序列核函数的参数相拼接,能够取得相对于基线的混合高斯模型算法更高的识别率。在2004年NIST评测数据库上,采用推荐算法的系统等错误率比基线的混合高斯-背景模型系统低16%。对说话人识别取得一定进展。
-
关键词
马氏距离
广义线性判别式序列核函数
梅尔刻度式倒谱参数
-
Keywords
Mahalanobis distance
GLDS
MFCC
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名低空目标被动声识别关键技术研究
被引量:6
- 6
-
-
作者
雷鸣
乔柯
-
机构
西安工业大学电子信息工程学院
-
出处
《计算机与数字工程》
2017年第4期645-649,共5页
-
文摘
低空目标被动声探测技术在现代战争中发挥着越来越重要的作用。针对低空目标被动声识别的一些关键技术进行了研究。首先从低空目标声信号与语音信号特征的相似性出发,论证了低空目标被动声识别与语音识别可以采用同样的方法。然后对四旋翼飞行器的声音信号进行了时频分析,提出基于MFCC参数的低空目标识别方法。最后论述了低空目标声音识别技术中的关键技术,重点分析了特征提取中的MFCC技术以及使用动态时间规整(DTW)算法进行仿真识别实验,为低空目标声音识别系统的开发奠定了基础。
-
关键词
被动声识别
端点检测
美尔倒谱参数
动态时间规整
-
Keywords
passive voice recognition
endpoint detection
MFCC
dynamic time warping
-
分类号
TN911
[电子电信—通信与信息系统]
-
-
题名孤立词语音识别系统的DSP实现
被引量:1
- 7
-
-
作者
郑德忠
宋婧婧
周朝霞
-
机构
燕山大学测试计量技术及仪器河北省重点实验室
-
出处
《微计算机信息》
2010年第26期118-119,133,共3页
-
基金
国家自然基金(60272027)
-
文摘
传统语音识别系统存在识别率低、接口复杂、功耗大等缺点。针对这一问题,可以采用TI公司生产的TMS320C6201B DSP开发非特定人孤立词语音识别系统。DSP主机接口部分与单片机89C51相连。由单片机控制LCD显示电路和USB与PC的通信。USB2.0总线标准数据传输速率高、接口方便。软件部分采用传统的双门限端点检测算法和DHMM识别算法。实验结果表明,该系统功耗低、体积小,并且具有较高的识别率。
-
关键词
数字信号处理
孤立词识别
离散隐马尔可夫模型
双门限端点检测算法
线性预测分析美尔倒谱参数
-
Keywords
digital signal processing
isolated word recognition
DHMM
double threshold endpoint detection
LPCMCC
-
分类号
TP912.34
[自动化与计算机技术]
-
-
题名文本无关的说话人识别系统抗噪方法研究
- 8
-
-
作者
叶蕾
方鹏
-
机构
南京邮电大学通信与信息工程学院
中国移动通信集团江苏有限公司
-
出处
《计算机与现代化》
2010年第10期16-19,共4页
-
文摘
研究了基于美尔倒谱特征参数及高斯混合模型的文本无关的说话人识别系统,为了提高噪声环境下识别系统的识别率,从两个角度研究改善该系统抗噪性能的方法,即利用语音识别将文本无关的系统转化为文本有关的说话人识别方法和通过选择鲁棒性较强的帧进行说话人识别的方法,分析了以上方法对系统识别性能的改善作用,并通过实验验证上述方法确实可以提高系统在噪声环境下的识别率。
-
关键词
语音识别
说话人识别
文本无关
美尔倒谱参数
高斯混合模型
-
Keywords
speech recognition
speaker recognition
text-independent
Mel cepstral coefficients
Gaussian mixed model(GMM)
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于DSP的嵌入式语音识别系统的研究与实现
被引量:4
- 9
-
-
作者
贾克明
陶洪久
-
机构
武汉理工大学信息工程学院
-
出处
《武汉理工大学学报(信息与管理工程版)》
CAS
2006年第7期156-159,共4页
-
基金
教育部重点实验室开发基金资助项目(TKLJ0208)
-
文摘
设计并实现了一个特定人、孤立词和小词汇量的嵌入式语音识别系统。系统硬件的核心芯片采用普遍使用的16位定点DSP芯片TMS320VC5416,软件上主要采用动态时间规整算法来实现语音识别。给出了系统整体的软硬件框架,并比较和分析了分别将线性预测倒谱参数和美尔频标倒谱参数作为语音特征参数时系统的性能,为语音识别的嵌入式应用提供了参考依据。
-
关键词
嵌入式
语音识别
DSP
线性预测倒谱参数
美尔频标倒谱参数
-
Keywords
embedded
speech recognition
DSP
LPCC
MFCC
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名提高MFCC鲁棒性的方法
被引量:1
- 10
-
-
作者
韩春光
李华
-
机构
宁波大红鹰职业技术学院现代应用技术系
-
出处
《计算机工程与设计》
CSCD
北大核心
2008年第1期160-162,180,共4页
-
基金
浙江省教育厅科研基金项目(20050099)
-
文摘
在噪声环境中,基于笔记本电脑录音的情况下,采用特征参数加窗的方法,以提高系统的噪声鲁棒性。在Matlab环境下,建立了基于高斯混合模型(GMM)的说话人辨认系统,并进行实验。通过对多种窗口的正识率比较,发现对美尔倒谱(MFCC)高阶参数的加窗提升,可以改善系统的鲁棒性。实验结果表明,采用加窗后的系统识别率得到了明显改善。
-
关键词
美尔倒谱参数
说话人辨认
高斯混合模型
加窗提升
噪声鲁棒性
-
Keywords
MFCC
speaker identification
GMM
lifteringwindow
robust
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名改善含噪语音说话人辨认系统性能的方法
- 11
-
-
作者
韩春光
胡剑英
李华
-
机构
宁波大红鹰职业技术学院
-
出处
《宁波大学学报(理工版)》
CAS
2007年第3期297-300,共4页
-
基金
浙江省教育厅科研基金(20050099)
-
文摘
当对含噪语音进行说话人辨认时,系统的识别性能会明显变差,本文提出采用对倒谱参数非线性加权的方法,改善系统的噪声鲁棒性.通过对多种加权窗的正识率比较,发现对LPC倒谱低阶参数加权提升,对美尔倒谱高阶参数的加权提升,均提高了系统的识别性能.
-
关键词
含噪语音
说话人辨认
倒谱参数
非线性加权
-
Keywords
the speech with noise
speaker identification
cepstral coefficient
nonlinear weighting
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名采用高斯概率分布和支持向量机的说话人确认
被引量:2
- 12
-
-
作者
郭武
戴礼荣
王仁华
-
机构
中国科学技术大学电子工程与信息科学系科大讯飞语音实验室
-
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2008年第6期794-798,共5页
-
基金
国家863计划资助项目(No.2006AA010104)
-
文摘
在采用支持向量机的说话人确认中,将语音特征参数相对于通用背景模型各高斯分量的概率分布作为支持向量机输入,在线性核函数的情况下,系统能取得与广义线性判别式序列核函数(GLDS)几乎相同的识别率,同时该高斯概率分布算法能够与混合高斯背景模型、广义线性判别式序列核函数的得分进行融合,进一步提高识别性能.在2006年 NIST SRE 1conv4w-1conv4w 数据库上,融合后的系统相对于基线的混合高斯模型最多有25%的等错误率下降.
-
关键词
广义线性判别式序列(GLDS)
梅尔刻度式倒谱参数(MFCC)
线性预测倒谱参数(LPCC)
-
Keywords
Generalized Linear Discriminant Sequence (GLDS), Mel Frequency Cepstrum Coefficient ( MFCC), Linear Prediction Cepstrum Coefficient (LPCC)
-
分类号
TN912.34
[电子电信—通信与信息系统]
-