-
题名基于倒谱特征的重放语音检测
- 1
-
-
作者
金雨晨
凌霖
许毅
-
机构
江苏科技大学电子信息学院
-
出处
《物联网技术》
2020年第6期86-88,共3页
-
基金
江苏科技大学本科生创新计划专项经费资助。
-
文摘
IoT设备身份认证是物联网领域的重要应用。语音重放欺骗攻击现已成为自动说话人验证(ASV)系统所面临的严重的安全威胁。文中以ASVspoof 2017语音数据集为研究对象进行重放语音检测实验,利用倒谱均值方差归一化(CMVN)改进检测系统性能。实验结果表明,采用CMVN后的线性频率倒谱系数(LFCC)特征在重放语音的检测上性能优于常数Q变换倒谱系数(CQCC)、梅尔倒谱系数(MFCC)和逆梅尔倒谱系数(IMFCC)特征。
-
关键词
物联网
自动说话人验证
倒谱特征
重放语音检测
倒谱均值方差归一化
逆梅尔倒谱系数
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于特征参数归一化的鲁棒语音识别方法综述
被引量:9
- 2
-
-
作者
肖云鹏
叶卫平
-
机构
北京师范大学信息科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2010年第5期106-116,共11页
-
文摘
目前,自动语音识别系统往往会因为环境中复杂因素的影响,造成训练环境和测试环境存在不匹配现象,使得识别系统性能大幅度下降,极大地限制了语音识别技术的应用范围。近年来,很多鲁棒语音识别技术成功地被提出,这些技术的目标都是相同的,主要是提高系统的鲁棒性,进而提高识别率。其中,基于特征的归一化技术简单而有效,常常被作为鲁棒语音识别的首选方法,它主要是通过对特征向量的统计属性、累积密度函数或功率谱的归一化来补偿环境不匹配产生的影响。该文主要对目前主流的归一化方法进行介绍,其中包括倒谱矩归一化方法、直方图均衡化方法以及调频谱归一化方法等。
-
关键词
鲁棒语音识别
倒谱均值归一化
高阶倒谱矩归一化
直方图均衡化
倒谱形状归一化
-
Keywords
robust speech recognition
cepstral mean normalization
high order cepstral moment normalization
histogram equalization
cepstral shape normalization
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于谱减法和特征补偿的农产品价格语音识别
- 3
-
-
作者
许金普
诸叶平
-
机构
中国农业科学院农业信息研究所
青岛农业大学动漫与传媒学院
-
出处
《计算机工程与设计》
北大核心
2015年第9期2528-2531,2566,共5页
-
基金
国家自然科学基金项目(61271364)
农业系统智能控制与虚拟技术团队基金项目(CAAS-ASTIP-2015-AII-03)
-
文摘
为解决农产品价格信息采集任务中传统设备缺少语音接口,且通用的抗噪声算法效果不佳的问题,提出一种农产品价格采集环境下的抗噪声算法。利用谱减算法实现前端的去噪,提高输入信号的信噪比,但同时产生的频谱畸变和残留噪声会造成新的失配,利用倒谱均值方差归一化方法进行补偿,减小或消除这种失配,将基本谱减算法(SS)以及多带谱减算法(MB)分别与倒谱均值方差归一化方法联合。实验结果表明,与单独使用上述各算法相比,联合后的算法能有效提高系统的识别率,特别是在较低信噪比(0dB-10dB)情况下该效果更为明显。
-
关键词
谱减算法
特征补偿
倒谱均值方差归一化
农产品价格
信息采集
-
Keywords
spectral subtraction
feature compensation
cepstral mean and variance normalization
agricultural price
information acquisition
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于说话人语音特征归一化的语音识别研究
- 4
-
-
作者
钱洪伟
贺苏宁
-
出处
《电信技术研究》
2008年第4期27-32,共6页
-
文摘
说话人语音特征归一化是在语音识别的参数提取阶段针对说话人的语音特性的差异或者背景环境的影响进行归一化的一种自适应技术。本文主要通过实验研究两种主要的说话人语音特征归一化技术:声道长度归一化和倒谱均值归一化,并讨论在连续语音识别中的应用方法。实验数据说明,采用这类技术后能够显著地降低词错误率。
-
关键词
语音识别
声道长度归一化
倒谱均值归一化
-
分类号
TN912.34
[电子电信—通信与信息系统]
O413.1
[理学—理论物理]
-
-
题名基于CMN和PMC算法的语音增强失真补偿方法研究
- 5
-
-
作者
苗玉杰
刘雪飞
张晓敏
-
机构
中国环境管理干部学院
秦皇岛职业技术学院
-
出处
《微电子学与计算机》
CSCD
北大核心
2011年第6期160-162,167,共4页
-
基金
河北省科技厅科学技术研究与发展计划项目(2007-009)
-
文摘
语音增强技术在低信噪比情况下,由于语音增强带来的失真使得系统的识别性能严重下降.因此提出一种结合特征空间的倒谱均值归一化算法(CMN)和模型空间的并行模型合并算法(PMC)的语音增强失真补偿技术.实验结果表明,该方法有效提高了低信噪比情况下的语音信号识别率.
-
关键词
语音增强
倒谱均值归一化
并行模型合并
-
Keywords
speech enhancement
Cepstral Mean Normalization(CMN)
Parallel Model Combination(PMC)
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语音增强失真补偿的抗噪声语音识别技术
被引量:3
- 6
-
-
作者
丁沛
曹志刚
-
机构
清华大学电子工程系微波与数字通信国家重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2004年第5期64-69,共6页
-
基金
国家自然科学基金资助项目 (6 0 0 72 0 11)
-
文摘
本文提出了一种基于语音增强失真补偿的抗噪声语音识别算法。在前端 ,语音增强有效地抑制背景噪声 ;语音增强带来的频谱失真和剩余噪声是对语音识别不利的因素 ,其影响将通过识别阶段的并行模型合并或特征提取阶段的倒谱均值归一化得到补偿。实验结果表明 ,此算法能够在非常宽的信噪比范围内显著的提高语音识别系统在噪声环境下的识别精度 ,在低信噪比情况下的效果尤其明显 ,如对 - 5dB的白噪声 ,相对于基线识别器 ,该算法可使误识率下降 6 7 4 %
-
关键词
计算机应用
中文信息处理
语音增强
倒谱均值归一化
并行模型合并
语音识别
-
Keywords
computer application
Chinese information processing
speech enhancement
cepstral mean normalization
parallel model combination
speech recognition
-
分类号
TN912.3
[电子电信—通信与信息系统]
-
-
题名基于快速提升小波变换的语音特征提取方法
被引量:1
- 7
-
-
作者
欧瑞清
徐晨
卢少平
宋广为
-
机构
深圳大学智能计算科学研究所
深圳大学经济学院
深圳大学信息与系统管理系
-
出处
《计算机辅助工程》
2006年第3期102-105,共4页
-
基金
广东省科技计划项目(2005B10101060)
深圳市科技计划项目(200511)
-
文摘
为提高语音识别系统对环境噪声的鲁棒性,在快速提升小波的基础上,结合感知频域上的滤波与倒谱均值归一化技术,提出一种语音特征参数提取方法.仿真实验表明,与传统方法相比,噪声鲁棒性显著提高;在语音信号的信噪比相近情况下,与传统小波方法相比,该方法计算简便、易于编程、计算速度快.
-
关键词
快速提升小波
语音识别
倒谱均值归一化
美尔倒谱
-
Keywords
fast lifting wavelet
speech recognition
cepstrum mean normalization
Mel-cepstrum
-
分类号
TN912.34
[电子电信—通信与信息系统]
TN911.25
[电子电信—通信与信息系统]
-
-
题名基于语音识别的农产品价格信息采集方法
被引量:8
- 8
-
-
作者
许金普
诸叶平
-
机构
中国农业科学院农业信息研究所/农业部农业信息服务技术重点实验室
青岛农业大学动漫与传媒学院
-
出处
《中国农业科学》
CAS
CSCD
北大核心
2015年第3期449-459,共11页
-
基金
国家自然科学基金项目(61271364)
-
文摘
【目的】将语音识别技术应用到农产品价格信息采集中,面向非特定人和限定词汇量的汉语普通话连续语音识别,提出一种适合于农产品价格采集环境的语音识别鲁棒性方法;以隐马尔科夫模型为基础,训练出适合该环境下的声学模型,以缓解因测试环境和训练环境不匹配而导致的识别率降低,进一步提高识别率。【方法】在数据采集和处理阶段,首先根据要识别的限定词汇按照一定的语法规则构建转换文法,利用该文法生成的脚本指导训练集和测试集录音;然后选择不同的农产品价格采集环境和不同的说话人进行语音采集,并进行准确的人工切分,最后构建出语音语料库;在模型训练阶段,选择自左向右无跳转结构的连续混合密度隐马尔科夫模型,对训练集中的数据提取39维的MFCC特征向量,用于模型训练。首先以单音素为建模单元,并分别训练基于隐马尔科夫模型的男声模型、女声模型及男女混合声学模型;然后,考虑到单音素稳定性差和易受协同发音现象影响等因素,以上下文相关的三音素为识别单元建模,重新训练上述模型;针对三音子建模单元带来的模型数量大量增加,进而造成的训练样本不足问题,采用决策树状态聚类方法来改善该问题;决策树的构建过程中,利用语音学知识,根据声母发音方式、发音部位的不同以及韵母构成、韵头的不同,划分出若干声韵母集合实现了二值问题集的设计;在此基础上,用增加混和高斯分量的方法来进一步使得模型描述更加精确;最后,为了解决信道的乘性噪声问题,在采用上述策略的同时利用CMN和CVN方法来缓解测试环境与训练环境不匹配问题,最终训练得到了相应的男声模型和女声模型。在测试阶段,对采用上述各方法后得到的不同模型,分别采用相同的测试集进行试验,得出不同方法下的句子识别率、词识别率以及精准度。【结果】三音子声学模型的识别性能明显优于单音素声学模型,女声模型和男声模型的性能均优于男女混合声学模型,决策树聚类方法对识别率的提高不明显但可以明显减少三音子模型的数量,混合高斯分量的增加对识别率具有一定提高但同时带来计算量的增加,CMN和CVN方法可以明显提高系统的识别性能。通过对不同地点和不同说话人进行测试,最终识别率男性为95.04%,女性为97.62%。【结论】语音识别技术应用到农产品价格信息采集过程中是可行的。本文提出了一种农产品价格采集环境下提高语音识别率的方法,试验证明通过该方法训练出的模型具有较好的识别性能,本研究方法为日后应用系统的开发奠定了基础。
-
关键词
语音识别
农产品价格
信息采集
倒谱均值方差归一化(CMVN)
决策树聚类
-
Keywords
speech recognition
agricultural price
information acquisition
CMVN
decision tree clustering
-
分类号
TN912.34
[电子电信—通信与信息系统]
-