期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一种基于RASTA-PLP分析的话者识别技术 被引量:1
1
作者 汪海 《电声技术》 北大核心 2002年第5期8-9,共2页
研究了一种基于RASTA-PLP特征分析的与文本无关的话者识别方法。话者模型训练采用的是基于矢量量化的方法,实验验证了该方法的有效性。
关键词 话者识别 rasta-plp分析 矢量量化法 文本无关
下载PDF
关于网络语音的自动语言辨识系统研究
2
作者 王洪海 刘刚 郭军 《电脑与信息技术》 2007年第1期3-6,共4页
文章对从网络上采集的英语、德语、日语、法语、西班牙语等5个语种的语音和现有的汉语语音进行了自动语言辨识的研究,利用RASTA-PLP特征参数和贪婪期望最大算法为每个语种建立了高斯混合模型,并用多个说话人的语音进行了开集测试,讨论... 文章对从网络上采集的英语、德语、日语、法语、西班牙语等5个语种的语音和现有的汉语语音进行了自动语言辨识的研究,利用RASTA-PLP特征参数和贪婪期望最大算法为每个语种建立了高斯混合模型,并用多个说话人的语音进行了开集测试,讨论了网络语音和非网络语音对识别结果的影响,以及识别率与训练数据和GMM模型阶数的关系。实验结果表明,经过改进的基于声学特征的方法可以有效地应用到网络语音的自动语言辨识系统中。 展开更多
关键词 网络语音 自动语言辨识 rasta—plp 高斯混合模型 贪婪期望最大算法
下载PDF
听觉谱特征在水下目标回声识别中的应用 被引量:1
3
作者 吴亮 杨会金 《舰船科学技术》 北大核心 2016年第12期143-146,177,共5页
水下目标回声特征提取是主动目标识别的关键内容。本文提出将语音识别领域中较为成熟的RASTAPLP听觉模型应用于水中目标回波的特征提取,并根据信号的特点对RASTA-PLP模型进行修正。对比应用PLP方法进行的水中目标单频回波识别实验,结果... 水下目标回声特征提取是主动目标识别的关键内容。本文提出将语音识别领域中较为成熟的RASTAPLP听觉模型应用于水中目标回波的特征提取,并根据信号的特点对RASTA-PLP模型进行修正。对比应用PLP方法进行的水中目标单频回波识别实验,结果表明:当加入卷积噪声后,修正的RASTA-PLP特征表现出更加良好的鲁棒性能,在同等测试条件下识别率比PLP听觉模型特征高约3%,显示了本方法在实现目标回声自动识别上的重要应用前景。 展开更多
关键词 回波信号 识别 修正的rasta-plp听觉模型 鲁棒性
下载PDF
基于GMM区分性别的汉语方言识别系统
4
作者 王侠 顾明亮 +1 位作者 高原 马勇 《电声技术》 2011年第12期39-41,46,共4页
提出一种基于GMM的区分不同性别的汉语方言识别系统,系统提取语音的RASTA-PLP特征,在方言电话语音库上进行仿真实验,结果表明在GMM模型阶数为32时,系统的识别率可达到98.66%。同时还将RASTA-PLP特征与SDC特征对比,结果表明系统识别率最... 提出一种基于GMM的区分不同性别的汉语方言识别系统,系统提取语音的RASTA-PLP特征,在方言电话语音库上进行仿真实验,结果表明在GMM模型阶数为32时,系统的识别率可达到98.66%。同时还将RASTA-PLP特征与SDC特征对比,结果表明系统识别率最高可提高6.05%,且RASTA-PLP特征在性别分类方面优于SDC。 展开更多
关键词 方言识别 rasta-plp GMM SDC
下载PDF
短时谱特征的汉语重音检测方法研究 被引量:2
5
作者 赵云雪 张珑 郑世杰 《计算机科学与探索》 CSCD 2014年第9期1120-1128,共9页
重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual line... 重音是语言交流中不可或缺的部分,在语言交流中扮演着非常重要的角色。为了验证基于听觉模型的短时谱特征集在汉语重音检测方法中的应用效果,使用MFCC(Mel frequency cepstrum coefficient)和RASTAPLP(relative spectra perceptual linear prediction)算法提取每个语音段的短时谱信息,分别构建了基于MFCC算法的短时谱特征集和基于RASTA-PLP算法的短时谱特征集;选用NaiveBayes分类器对这两类特征集进行建模,把具有最大后验概率的类作为该对象所属的类,这种分类方法充分利用了当前语音段的相关语音特性;基于MFCC的短时谱特征集和基于RASTA-PLP的短时谱特征集在ASCCD(annotated speech corpus of Chinese discourse)上能够分别得到82.1%和80.8%的汉语重音检测正确率。实验结果证明,基于MFCC的短时谱特征和基于RASTA-PLP的短时谱特征能用于汉语重音检测研究。 展开更多
关键词 重音检测 Mel频率倒谱系数(MFCC) 相关谱感知线性预测(rasta-plp) 短时谱特征
下载PDF
基于改进胶囊网络的音调篡改检测算法
6
作者 杜海云 王宏霞 《通信技术》 2022年第8期984-989,共6页
音调篡改技术是语音伪造常用的一种技术手段,可能对说话人验证系统造成威胁。对噪声和压缩场景下的伪造语音检测问题进行了研究,提出了基于改进胶囊网络的音调篡改检测算法。为增强鲁棒性,将相对频谱感知线性预测(RelAtive SpecTrAl-Per... 音调篡改技术是语音伪造常用的一种技术手段,可能对说话人验证系统造成威胁。对噪声和压缩场景下的伪造语音检测问题进行了研究,提出了基于改进胶囊网络的音调篡改检测算法。为增强鲁棒性,将相对频谱感知线性预测(RelAtive SpecTrAl-Perceptual Linear Predictive,RASTAPLP)和梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficients,MFCC)融合为新特征,并输入优化的胶囊网络,对经加噪和压缩处理的音频进行检测。实验结果表明,该算法在已知噪声、未知噪声和压缩场景下的检测准确率均在98%以上,和现有的一些算法相比,具有较高的检测准确率和鲁棒性。 展开更多
关键词 胶囊网络 音调篡改检测 鲁棒性 相对频谱感知线性预测 梅尔倒谱系数
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部