期刊文献+
共找到100篇文章
< 1 2 5 >
每页显示 20 50 100
线性预测编码倒谱系数距离(LPC—CD)在语音信号质量客观测度中的应用 被引量:2
1
作者 黄惠明 师骋 《计算机与网络》 1999年第16期25-26,共2页
文章介绍了一种以计算线性预测编码倒谱系数距离(LPC—CD)作为对受扰语音信号质量评价的客观测度准则。针对不同通信条件,不同干扰样式下的受扰语音信号进行客观测量,并拟合出用客观测量值来预测主观的二次拟合曲线,达到了较高的主客观... 文章介绍了一种以计算线性预测编码倒谱系数距离(LPC—CD)作为对受扰语音信号质量评价的客观测度准则。针对不同通信条件,不同干扰样式下的受扰语音信号进行客观测量,并拟合出用客观测量值来预测主观的二次拟合曲线,达到了较高的主客观一致性。 展开更多
关键词 线性预测编码 谱系距离 语音质量 客观平均
下载PDF
基于线性预测倒谱系数的地震相分析 被引量:12
2
作者 解滔 郑晓东 张? 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2016年第11期4266-4277,共12页
本文借鉴语音识别技术中的线性预测倒谱系数(LPCC系数)特征参数提取方法对地震数据进行分解,这种方法的优点是:可以获得将子波和反射系数信息分离的地震语音特征参数,对地质现象边界具有较好的描述能力,使我们可以从不同维度更细致地观... 本文借鉴语音识别技术中的线性预测倒谱系数(LPCC系数)特征参数提取方法对地震数据进行分解,这种方法的优点是:可以获得将子波和反射系数信息分离的地震语音特征参数,对地质现象边界具有较好的描述能力,使我们可以从不同维度更细致地观察隐藏在地震数据中的地质特征.理论模型分析表明,基于LPCC系数的地震分析具有较高的地震相划分能力.实际地震资料应用表明,LPCC系数对储层特征的描述比常规三瞬属性更为细致,不同阶次LPCC系数在描述储层不同特征时也保持了内在的联系.采用K均值聚类方法对提取的12阶和24阶LPCC系数进行聚类分析,聚类结果与目的层段古地形较为吻合,较好地反映了研究区的断裂、礁滩相带、深水扇和储层的分布特征,说明在地震相分析中采用LPCC系数作为特征参数是可行和有效的. 展开更多
关键词 线性预测谱系 地震相分析 储层预测 K均值聚类 语音识别
全文增补中
最小方差无失真响应感知倒谱系数在说话人识别中的应用 被引量:4
3
作者 梁春燕 张翔 +2 位作者 杨琳 张建平 颜永红 《声学学报》 EI CSCD 北大核心 2012年第6期673-678,共6页
研究最小方差无失真响应感知倒谱系数在说话人识别中的应用。提取最小方差无失真响应感知倒谱系数,对其进行高斯混合模型建模并采用联合因子分析的方法来拟合高斯混合模型中的说话人和信道差异,在美国国家标准技术研究院2008年说话人识... 研究最小方差无失真响应感知倒谱系数在说话人识别中的应用。提取最小方差无失真响应感知倒谱系数,对其进行高斯混合模型建模并采用联合因子分析的方法来拟合高斯混合模型中的说话人和信道差异,在美国国家标准技术研究院2008年说话人识别评测核心测试集上分别对最小方差无失真响应感知倒谱系数和传统的Mel频率倒谱系数进行测试。结果显示,两种不同特征的系统性能相当,采用线性融合方法后,在不同测试集上的等错误率相对下降了7.6%~30.5%,最小检测错误代价相对下降了3.2%~21.2%。实验表明,最小方差无失真响应感知倒谱系数能有效应用于说话人识别中,且与传统的Mel频率倒谱系数存在一定程度的互补性。 展开更多
关键词 MEL频率谱系 最小方差无失真响应 说话人识别 感知 应用 高斯混合模型 标准技术研究院 测试集
下载PDF
使用全局自注意Teager能量倒谱系数检测重放欺骗语音
4
作者 陈铭 陈雪勤 《声学学报》 EI CAS CSCD 北大核心 2024年第5期1122-1130,共9页
提出了一种基于能量的前端特征提取方法,旨在应对自动说话人验证系统中面临的重放攻击威胁。该方法实现了全频段上的可变分辨率,以充分利用重放语音与真实语音在子带能量上的高鉴别非线性信息。首先,通过采用F-ratio方法统计分析了多种... 提出了一种基于能量的前端特征提取方法,旨在应对自动说话人验证系统中面临的重放攻击威胁。该方法实现了全频段上的可变分辨率,以充分利用重放语音与真实语音在子带能量上的高鉴别非线性信息。首先,通过采用F-ratio方法统计分析了多种录音和播放设备。接着,根据统计结果在全频段上设计了一组滤波器,旨在捕获高鉴别能量信息。最后,利用Teager能量算子计算子带滤波信号的能量,提出了全局自注意Teager能量倒谱系数(GSTECC)。为了验证所提方法的有效性,采用高斯混合模型作为分类器,在ASVspoof 2017 V2和ASVspoof 2021 PA数据库上进行了一系列测试实验。实验结果表明,相对于其他先进特征提取方法,所提GSTECC特征在检测重放攻击方面表现出更优异的性能。 展开更多
关键词 说话人验证 重放攻击检测 全局自注意特征 Teager 能量谱系 线性滤波器组
下载PDF
基于线性预测能量谱系数的自然语音和耳语音的分类研究 被引量:1
5
作者 姚真真 胡金瑶 艾斯卡尔·艾木都拉 《现代电子技术》 2023年第2期85-90,共6页
在进行语音识别之前对自然语音和耳语音进行预分类,再分别放入各自的识别系统,可以提高耳语语音识别系统的识别性能。基于此,文中提出一个新的特征线性预测能量谱系数(LPESC),在该特征的提取过程中,对提取到的频谱图进行切分,以便获取... 在进行语音识别之前对自然语音和耳语音进行预分类,再分别放入各自的识别系统,可以提高耳语语音识别系统的识别性能。基于此,文中提出一个新的特征线性预测能量谱系数(LPESC),在该特征的提取过程中,对提取到的频谱图进行切分,以便获取到更多的语音信息,并将其用于耳语音分类。此外,还特别设计4种不同的滤波器组,并将提取到的特征应用于7个分类器上。实验结果表明,密集的均匀三角滤波器组更加适合提取该特征,在7种传统分类器上均有较好的分类效果,其中SVM分类效果最好。最后,对比LPESC与传统特征(39维的LFCC和MFCC)在7种分类器上的分类效果,验证新特征的有效性。实验还发现,女生的耳语音有更好的分类效果。 展开更多
关键词 语音分类 语音识别 耳语音 线性预测能量谱系 特征提取 频谱图切分 结果分析 效果验证
下载PDF
改进变值逻辑与线性预测在心音分类中的应用
6
作者 王彦麟 孙静 +3 位作者 杨宏波 郭涛 潘家华 王威廉 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期432-442,共11页
心音对于评价心脏健康状况具有重要作用.文章介绍了一种新的基于变值逻辑与线性预测倒谱系数融合特征的先心病分类算法,有助于提取心音中的深度病理特征.算法首先对心音进行降噪、包络提取;然后进行变值逻辑运算、标记并转换为可分析的... 心音对于评价心脏健康状况具有重要作用.文章介绍了一种新的基于变值逻辑与线性预测倒谱系数融合特征的先心病分类算法,有助于提取心音中的深度病理特征.算法首先对心音进行降噪、包络提取;然后进行变值逻辑运算、标记并转换为可分析的测度数据,并计算信号的线性预测倒谱系数进行特征融合;最后使用随机森林,XGBOOST和LIGHTGBM机器学习分类器进行先心病二分类.研究所用心音样本共4000例,测试结果对正常和异常心音分类的平均准确率为0.9138.算法无需对心音进行心动周期分割,大大简化了分析流程,可望用于先心病的筛查. 展开更多
关键词 心音 先心病 3比特编码变值逻辑 线性预测谱系 特征融合
下载PDF
面向异构图像压缩感知的阶数自适应多假设重构
7
作者 郑颙铣 刘浩 +1 位作者 燕帅 陈根龙 《计算机科学》 CSCD 北大核心 2024年第10期302-310,共9页
大数据时代到来,使得图像传感应用面临大维度处理与大容量传输的挑战,压缩感知技术及相关算法在一定程度上解决了该问题。然而,现有压缩感知算法存在对异构图像集泛化性不足的问题,需要为此类图像集设计高泛化性的压缩感知重构算法。因... 大数据时代到来,使得图像传感应用面临大维度处理与大容量传输的挑战,压缩感知技术及相关算法在一定程度上解决了该问题。然而,现有压缩感知算法存在对异构图像集泛化性不足的问题,需要为此类图像集设计高泛化性的压缩感知重构算法。因此,基于泛化性较高的多假设预测机制,提出一种阶数自适应多假设重构算法。首先通过窗口自适应线性预测器对各块进行预处理,根据预处理获得的相关性指标,改变多假设搜索窗口的大小,并依据相似度对搜索窗口内的预测块进行排序,结合自适应的搜索窗口挑选不同数量的高相似预测块,生成多假设预测的重构图像。选取自然图像集以及X光胸片和脑磁两个异构图像集进行实验,在不同采样率下对比所提算法与传统的多假设压缩感知重构算法以及两种新近提出的基于多假设预测的算法性能。实验结果表明,所提算法具有良好的性能提升。在自然图像集下,相比两种新近提出的基于多假设预测的重构算法,所提算法保持了一定的恢复质量,且运行时间分别减少了17.5%,28.7%。此外,相比两种新近提出的算法,在胸片图像集下,所提算法分别获得了1.16 dB,1.43 dB的平均PSNR提升,以及36.1%,21.5%的平均运行时间减少;在脑磁图像集下,所提算法分别获得了1.64 dB,1.97 dB的平均PSNR提升,以及平均28.6%,26.1%的运行时间减少。整体而言,所提算法具有较低的时间复杂度、较高的恢复质量,综合性能更佳。 展开更多
关键词 压缩感知重构 多假设预测 线性预测 自适应 异构图像集
下载PDF
基于梅尔倒谱系数的微细铣削颤振监测研究
8
作者 宋吉超 赵国龙 +2 位作者 李亮 年智文 何宁 《工具技术》 北大核心 2023年第12期135-139,共5页
微细铣削过程中的颤振是一种加工不稳定现象,会导致加工表面恶化、刀具快速磨损甚至刀具破损。本文提出了一种基于梅尔倒谱系数—隐马尔可夫模型改进的声音信号机器学习模型,更适用于加工过程的状态识别。开展Ti-6Al-4V钛合金微细铣削... 微细铣削过程中的颤振是一种加工不稳定现象,会导致加工表面恶化、刀具快速磨损甚至刀具破损。本文提出了一种基于梅尔倒谱系数—隐马尔可夫模型改进的声音信号机器学习模型,更适用于加工过程的状态识别。开展Ti-6Al-4V钛合金微细铣削在不同加工状态下的声音信号采集试验,用于训练机器学习模型并获得模式库。通过对铣削过程中的不同声音信号与模式库进行比较,验证了所提出的机器学习模型的准确性。研究表明,基于合理的特征选取和模型参数优化,所提出的机器学习模型对加工状态的识别准确率达到82%。本研究可为改进微细铣削过程中的在线监测技术提供指导。 展开更多
关键词 颤振预测 微细铣削 状态识别 梅尔谱系 隐马尔科夫链
下载PDF
基于神经网络由语音预测视位参数 被引量:2
9
作者 王志明 蔡莲红 《小型微型计算机系统》 CSCD 北大核心 2005年第6期1083-1087,共5页
语音是由多个发音器官共同作用产生的,发音器官动作与语音之间有着内在的必然联系.研究了利用神经网络预测视位参数中的选择语音参数、确定输入语音时域范围、优化神经网络结构等因素.实验结果表明,线性预测参数加短时能量优于其他语音... 语音是由多个发音器官共同作用产生的,发音器官动作与语音之间有着内在的必然联系.研究了利用神经网络预测视位参数中的选择语音参数、确定输入语音时域范围、优化神经网络结构等因素.实验结果表明,线性预测参数加短时能量优于其他语音参数,前向协同发音较后向协同发音影响更大,反馈对前馈神经网络的性能有所改善.考虑到实验采用的是任意连续语流,均方误差约为0.0114的实验结果还是很有吸引力的. 展开更多
关键词 前馈神经网络 视位 线性预测 线谱对系 谱系 反射系 MEL谱系 均方误差
下载PDF
一种基于非均匀谱系数和GMM的语音质量评估方法 被引量:2
10
作者 尹伟 易本顺 吴丹青 《电路与系统学报》 CSCD 北大核心 2010年第4期104-109,90,共7页
本文提出了一种新的基于GMM和非均匀线性预测倒谱系数(NLPC)的客观语音质量评估方法。首先,通过Bark双线性变换(BBT)对线性频谱进行频谱弯折,弯折后的频谱符合人耳听觉感知的非均匀特性。然后通过对非均匀谱的线性预测计算出NLPC。提取... 本文提出了一种新的基于GMM和非均匀线性预测倒谱系数(NLPC)的客观语音质量评估方法。首先,通过Bark双线性变换(BBT)对线性频谱进行频谱弯折,弯折后的频谱符合人耳听觉感知的非均匀特性。然后通过对非均匀谱的线性预测计算出NLPC。提取参考语音的NLPC用来对高斯混合模型进行训练。通过训练对参考语音建立参考模型。由参考模型和失真语音的NLPC向量可以得到它们之间的一致性测度。最后,通过多元自适应回归样条函数建立主观MOS分和一致性测度之间的映射关系,可以得到对MOS分的客观预测模型。通过这一模型进行语音质量的客观评价。实验表明,提出算法的性能要好于ITU-T P.563标准中的算法。 展开更多
关键词 语音质量 客观评价 非均匀线性预测谱系 高斯混合模型 多元自适应回归样条
下载PDF
线性预测分析在连接词语音识别中的研究 被引量:2
11
作者 李永恒 严家明 揭峰 《计算机仿真》 CSCD 北大核心 2010年第11期340-344,共5页
特征参数的提取是关系到语音识别系统性能好坏的关键,而线性预测分析是目前普遍采用的特征参数提取方法。针对在连接词和连续语音识别系统中,传统的线性预测系数已不能满足特征提取的要求,研究采用了三种主要的线性预测推演参数,即线性... 特征参数的提取是关系到语音识别系统性能好坏的关键,而线性预测分析是目前普遍采用的特征参数提取方法。针对在连接词和连续语音识别系统中,传统的线性预测系数已不能满足特征提取的要求,研究采用了三种主要的线性预测推演参数,即线性预测反射系数、线谱对系数和线性预测倒谱系数,及其在连接词语音识别系统中的应用,并进行计算机仿真。仿真结果表明,在输入语音库与信噪比一致的情况下,线性预测倒谱系数的识别率最高。从而证明,在包含语义特征信息和说话人特征方面,线性预测倒谱系数性能要优于线谱对系数和线性预测反射系数。 展开更多
关键词 线性预测反射系 线谱对系 线性预测谱系 语音识别
下载PDF
融合非线性幂函数和谱减法的CFCC特征提取 被引量:11
12
作者 白静 史燕燕 +1 位作者 薛珮芸 郭倩岩 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第1期86-92,共7页
为提高噪声环境下的语音识别准确率,提出一种改进的语音特征提取算法。该算法采用模拟人耳听觉特性的非线性幂函数提取一种新的耳蜗滤波倒谱系数,并在特征提取前端引入谱减法对信号进行增强,将提取到的新的特征及其一阶差分组成一种混... 为提高噪声环境下的语音识别准确率,提出一种改进的语音特征提取算法。该算法采用模拟人耳听觉特性的非线性幂函数提取一种新的耳蜗滤波倒谱系数,并在特征提取前端引入谱减法对信号进行增强,将提取到的新的特征及其一阶差分组成一种混合特征参数;再联合主成分分析对该混合特征进行降维,将最终得到的特征用于一个非特定人、孤立词、小词汇量的语音识别系统。实验结果表明:采用非线性幂函数提取的耳蜗滤波倒谱系数特征与传统的耳蜗滤波倒谱系数特征相比,明显提高了语音识别准确率;混合特征参数相比单一特征能达到更佳的语音识别性能;结合主成分分析后的特征集在信噪比为0dB时的识别正确率可达到88.10%。 展开更多
关键词 语音识别 线性幂函 耳蜗滤波谱系 谱减法
下载PDF
基于自适应GMM阶数与混合特征的说话人识别研究
13
作者 范涛 詹旭 《四川轻化工大学学报(自然科学版)》 CAS 2024年第4期75-83,共9页
针对高斯混合模型(GMM)阶数选取缺陷和说话人特征信息不足的问题,提出了基于自适应GMM阶数和多种语音特征融合的说话人识别算法。首先,通过提取梅尔频率倒谱系数(MFCC)和线性预测梅尔频率倒谱系数(LPMFCC),并根据Fisher准则得到一个17维... 针对高斯混合模型(GMM)阶数选取缺陷和说话人特征信息不足的问题,提出了基于自适应GMM阶数和多种语音特征融合的说话人识别算法。首先,通过提取梅尔频率倒谱系数(MFCC)和线性预测梅尔频率倒谱系数(LPMFCC),并根据Fisher准则得到一个17维的MFCC和LPMFCC参数组合的混合特征参数,以增强说话人的特征信息。然后,根据自适应思想,在K-means聚类算法中计算簇内误差平方和(SSE)。最后,通过肘部法则自适应调整K值,以获得一个最优GMM阶数,使得系统在已有的声纹特征下获得最优的识别效果。结果表明,该算法不仅完善了说话人的特征信息,并且克服了对GMM阶数选取的缺陷。最终结合LPCC和MFCC两种特征算法,融合得到的混合特征LPMFCC+MFCC的识别率相比于LPCC和MFCC提升了26.34%和12.34%。 展开更多
关键词 说话人识别 高斯混合模型 梅尔频率谱系 线性预测梅尔系 FISHER准则 自适应
下载PDF
基于发声机理与人耳感知特性的说话人识别 被引量:3
14
作者 杜晓青 于凤芹 《计算机工程》 CAS CSCD 2013年第11期197-199,204,共4页
Mel频率倒谱系数(MFCC)与线性预测倒谱系数(LPCC)融合算法只能反映语音静态特征,且LPCC对语音低频局部特征描述不足。为此,提出将希尔伯特黄变换(HHT)倒谱系数与相对光谱-感知线性预测倒谱系数(RASTA-PLPCC)融合,得到一种既反映发声机... Mel频率倒谱系数(MFCC)与线性预测倒谱系数(LPCC)融合算法只能反映语音静态特征,且LPCC对语音低频局部特征描述不足。为此,提出将希尔伯特黄变换(HHT)倒谱系数与相对光谱-感知线性预测倒谱系数(RASTA-PLPCC)融合,得到一种既反映发声机理又体现人耳感知特性的说话人识别算法。HHT倒谱系数体现发声机理,能反映语音动态特性,并更好地描述信号低频局部特征,可改进LPCC的不足。PLPCC体现人耳感知特性,识别性能强于MFCC,用3种融合算法对两者进行融合,将融合特征用于高斯混合模型进行说话人识别。仿真实验结果表明,该融合算法较已有的MFCC与LPCC融合算法识别率提高了8.0%。 展开更多
关键词 说话人识别 发声机理 人耳感知特性 希尔伯特黄变换谱系 感知线性预测倒谱系数 RELATIVE Spectra滤波
下载PDF
基于Fisher线性判别分析的语音信号端点检测方法 被引量:20
15
作者 王明合 张二华 +1 位作者 唐振民 许昊 《电子与信息学报》 EI CSCD 北大核心 2015年第6期1343-1349,共7页
传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fis... 传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fisher准则求解具有判别信息的最佳投影方向,使得投影后的特征参数具有最小类内散度和最大类间散度,从而增大清音与背景噪声的可分离性。在不同语音库上的实验结果表明,F-MFCC能够在不同信噪比和背景噪声条件下提高语音端点检测的准确率。 展开更多
关键词 语音处理 语音端点检测 梅尔频率谱系 FISHER线性判别分析
下载PDF
基于MFCC特征提取的故障预测与评价方法 被引量:19
16
作者 常飞 乔欣 +1 位作者 张申 许华栋 《计算机应用研究》 CSCD 北大核心 2015年第6期1716-1719,共4页
针对渐变故障的准确预测问题,提出了一种基于Mel频率倒谱系数(Mel frequency cestrum coefficient,MFCC)特征提取的故障预测方法。首先通过监测对象上安装的声传感器获得机器当前运行的声音信号;然后声音信号经过预处理后,将其进行Mel变... 针对渐变故障的准确预测问题,提出了一种基于Mel频率倒谱系数(Mel frequency cestrum coefficient,MFCC)特征提取的故障预测方法。首先通过监测对象上安装的声传感器获得机器当前运行的声音信号;然后声音信号经过预处理后,将其进行Mel变换,获得其MFCC特征向量;最后经SVM分析器对机器运行时的测试数据和所存机器正常运行样本数据进行聚类分析,给出机器的健康评价。测试了海马M3发动机存在撞击声、轻敲声、轰鸣声时的健康度以及分析了采集的声信号存在噪声时的抗噪性能。实验结果表明,MFCC特征值能够作为机器健康预测的特征向量,且方法在预测的准确性和鲁棒性方面具有优势。 展开更多
关键词 故障预测 MEL频率谱系 聚类分析 支持向量机
下载PDF
话者识别系统中语音特征参数的研究与仿真 被引量:17
17
作者 王金明 张雄伟 《系统仿真学报》 CAS CSCD 2003年第9期1276-1278,共3页
在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用... 在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用对识别系统性能的影响。通过仿真和实验,证明混合参数识别方法能使话者识别系统的正确识别率有明显的提高。 展开更多
关键词 说话者识别 动态特征 线性预测谱系 美尔谱系 仿真
下载PDF
融合LPC与MFCC的特征参数 被引量:8
18
作者 张学锋 王芳 夏萍 《计算机工程》 CAS CSCD 北大核心 2011年第4期216-217,229,共3页
在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一... 在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一阶差分、MFCC及其一阶差分和基于小波包分析的特征参数(WPDC)及其一阶差分作为识别参数进行对比实验。结果表明,以LPMFCC作为特征参数的系统具有较高的识别率。 展开更多
关键词 线性预测 美尔谱系 说话人识别
下载PDF
韵律特征在概率线性判别分析说话人确认中的应用 被引量:6
19
作者 梁春燕 杨琳 +1 位作者 周若华 颜永红 《声学学报》 EI CSCD 北大核心 2015年第1期28-33,共6页
研究韵律特征在说话人确认中的应用。将整个韵律轨迹以固定段长和段移进行片段划分,并对其进行勒让德多项式拟合从而获取连续性的韵律特征,将特征映射到总变化因子空间,并用概率线性判别分析来补偿说话人和场景的差异。在美国国家标准... 研究韵律特征在说话人确认中的应用。将整个韵律轨迹以固定段长和段移进行片段划分,并对其进行勒让德多项式拟合从而获取连续性的韵律特征,将特征映射到总变化因子空间,并用概率线性判别分析来补偿说话人和场景的差异。在美国国家标准技术研究院2010年说话人识别评测扩展核心测试集5的基础上加入噪声构造测试集,并分别对韵律特征和传统Mel频率倒谱系数进行测试。结果显示,随着信噪比的逐渐减小,Mel频率倒谱系数性能出现大幅度下降,而韵律特征性能相对比较稳定,两种特征融合后能使系统性能得到进一步提升,等错率和最小检测错误代价相对于Mel频率倒谱系数单系统最多能分别下降9%和11%。实验表明,韵律特征应用于说话人识别中具有较强的噪声鲁棒性,且与传统的Mel频率倒谱系数存在较强的互补性。 展开更多
关键词 线性判别分析 说话人确认 韵律特征 MEL频率谱系 应用 概率 标准技术研究院 说话人识别
下载PDF
猪咳嗽声特征参数提取与识别的研究 被引量:5
20
作者 张振华 田建艳 +1 位作者 王芳 张成 《黑龙江畜牧兽医》 CAS 北大核心 2017年第12期18-22,共5页
为了实现对养猪场猪患咳嗽症状疾病的诊断,试验在猪咳嗽声学特性的基础上,对猪干咳声和湿咳声的梅尔倒谱系数和线性预测倒谱系数两种特征参数进行对比,提出了基于梅尔倒谱系数及其一阶差分为特征参数的隐马尔科夫模型对猪两种咳嗽声的... 为了实现对养猪场猪患咳嗽症状疾病的诊断,试验在猪咳嗽声学特性的基础上,对猪干咳声和湿咳声的梅尔倒谱系数和线性预测倒谱系数两种特征参数进行对比,提出了基于梅尔倒谱系数及其一阶差分为特征参数的隐马尔科夫模型对猪两种咳嗽声的识别方案。结果表明:在提取24维梅尔倒谱系数及其一阶差分,4个高斯混合分量描述观测向量输出分布时,建立的隐马尔科夫模型对猪两种咳嗽声的识别率最高。此方案可以有效完成养殖场猪咳嗽声的识别,有助于养猪场自动化监控。 展开更多
关键词 隐马尔科夫模型 梅尔谱系 线性预测谱系 一阶差分 高斯混合分量 猪咳嗽声
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部