期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于高斯混合模型的情感LPC系数的研究
1
作者 陈明义 许玲玲 陈宁 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第9期3701-3706,共6页
针对当前缺乏语音情感特征的发声模型研究的具体现状,通过探索情感特征与线性预测编码(LPC)系数之间的映射关系,提出建立LPC系数情感模型的新方法。该方法在中科院情感语音库的基础上分别建立高兴、愤怒、悲伤及中性4种情感数据库;通过... 针对当前缺乏语音情感特征的发声模型研究的具体现状,通过探索情感特征与线性预测编码(LPC)系数之间的映射关系,提出建立LPC系数情感模型的新方法。该方法在中科院情感语音库的基础上分别建立高兴、愤怒、悲伤及中性4种情感数据库;通过采用不同情感语音的LPC特征矢量,结合动态时间规整技术(DTW)、期望最大化算法(EM)和最小均方误差准则(MMSE)对高斯混合模型进行训练和参数估计,最终获得高兴、愤怒、悲伤这3种情感对中性语音的LPC系数映射规则函数,完成对情感LPC系数的建模。研究结果表明:建立的情感模型有效表征了不同情感对LPC系数的影响;该方法为情感语音合成、识别等研究提供了新思路。 展开更多
关键词 情感语音建模 lpc系数 高斯混合模型 EM算法
下载PDF
真空感应电炉配制镁-LPC合金微观组织分析
2
作者 赵平 雷运涛 《材料开发与应用》 CAS 2003年第6期24-26,共3页
用真空感应电炉配制了镁 镧镨铈混合稀土(LPC)合金,用扫描电镜、透射电镜以及X射线面扫描等手段分析了该合金的微观组织。结果表明,添加的镧镨铈混合稀土只有少量固溶在镁基体中,绝大部分形成了稀土化合物,沿晶界呈网状分布。
关键词 镁合金 镧镨铈混合稀土 微观组织
下载PDF
基于LPCC和能量熵的端点检测 被引量:6
3
作者 朱晓晶 侯旭初 +1 位作者 崔慧娟 唐昆 《电讯技术》 北大核心 2010年第6期41-45,共5页
为提高语音端点检测系统在低信噪比下检测的准确性,提出了一种基于倒谱特征和谱熵的端点检测算法。首先,根据分析得到待测语音帧的倒谱特征量,然后计算该特征量分别在通过训练得到的语音和噪声的高斯混合模型下的似然概率,通过两者概率... 为提高语音端点检测系统在低信噪比下检测的准确性,提出了一种基于倒谱特征和谱熵的端点检测算法。首先,根据分析得到待测语音帧的倒谱特征量,然后计算该特征量分别在通过训练得到的语音和噪声的高斯混合模型下的似然概率,通过两者概率的比较作出有声无声初判决;联合能量熵端点检测结果得到最终判决,最后通过Hangover机制最大限度的保护了语音。实验结果表明,此方法改善了能量熵端点检测法在babble噪声下的劣势,且在不同噪声环境下均优于G.729 Annex B的性能。 展开更多
关键词 语音信号处理 话音端点检测 谱熵 线性预测系数 倒谱系数 高斯混合模型
下载PDF
基于GMM模型和LPC-MFCC联合特征的声道谱转换研究 被引量:8
4
作者 曾歆 张雄伟 +2 位作者 孙蒙 苗晓孔 姚琨 《声学技术》 CSCD 北大核心 2020年第4期451-455,共5页
声道谱转换是语音转换中的关键技术。目前,大多数语音转换方法对声道谱的转换都是先提取语音中的某一种声道特征参数,然后对其进行训练转换,进而合成转换语音。由于不同的声道特征参数表征着不同的物理和声学意义,因此这些方法通常忽略... 声道谱转换是语音转换中的关键技术。目前,大多数语音转换方法对声道谱的转换都是先提取语音中的某一种声道特征参数,然后对其进行训练转换,进而合成转换语音。由于不同的声道特征参数表征着不同的物理和声学意义,因此这些方法通常忽略了不同声道特征参数之间可能存在的互补性。针对这一问题,研究了不同声道特征参数之间进行联合建模的方法,引入了一种由线性预测系数(LinearPredictionCoefficient,LPC)和梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient, MFCC)联合构成的LPC-MFCC特征参数,提出了一种基于高斯混合模型(Gaussian Mixture Model, GMM)和LPC-MFCC联合特征参数的语音转换方法。为验证文中方法的有效性,仿真实验选取了基于GMM和LPC的语音转换方法进行对比,对多组实验数据进行主观和客观测试,结果表明,文中提出的语音转换方法可以获得相似度更高的转换语音。 展开更多
关键词 语音转换 声道谱转换 高斯混合模型 联合建模 线性预测系数-梅尔频率倒谱系数
下载PDF
基于GMM模型的自适应说话人识别研究 被引量:2
5
作者 陈觉之 张贵荣 周宇欢 《计算机与现代化》 2013年第7期91-93,共3页
为了提高说话人识别的性能,提出一种基于GMM模型自适应说话人识别方法。该方法能自动根据不同的说话人选取不同时长的语音进行识别,从提取语音特征和计算识别概率两方面减少识别时间,在不降低识别率的前提下,比传统识别方法识别速度有... 为了提高说话人识别的性能,提出一种基于GMM模型自适应说话人识别方法。该方法能自动根据不同的说话人选取不同时长的语音进行识别,从提取语音特征和计算识别概率两方面减少识别时间,在不降低识别率的前提下,比传统识别方法识别速度有大幅度提高。实验仿真表明,在保持正确识别率97%以上的情况下,总识别速度可提高4倍左右。该方法特别适合基于GMM的大集合说话人识别。 展开更多
关键词 说话人识别 高斯混合模型 线性预测系数 自适应
下载PDF
基于CCA和PCA的说话人特征降维研究 被引量:1
6
作者 陈觉之 张贵荣 周宇欢 《计算机与现代化》 2013年第6期16-19,共4页
为提高说话人识别的性能,提出将CCA与PCA联合用于说话人特征降维的方法:先用CCA融合基于声道模型的LPC特征和基于听觉模型的MFCC特征,提升这两类不同特征的相关性;然后用PCA进一步去除冗余特征,降低有效特征的维数。实验显示,这两种降... 为提高说话人识别的性能,提出将CCA与PCA联合用于说话人特征降维的方法:先用CCA融合基于声道模型的LPC特征和基于听觉模型的MFCC特征,提升这两类不同特征的相关性;然后用PCA进一步去除冗余特征,降低有效特征的维数。实验显示,这两种降维方法联合的降维效果与单一的CCA降维、PCA降维或手动降维的效果比有明显提高。 展开更多
关键词 说话人识别 典型相关分析 主成分分析 高斯混合模型 特征降维 线性预测系数 美尔频率倒谱系数
下载PDF
镁-镧镨铈混合稀土合金微观组织分析
7
作者 付道贵 赵平 《四川工业学院学报》 2004年第3期92-94,共3页
 本文作者用扫描电镜、透射电镜以及X射线面扫描等手段分析了镁 镧镨铈混合稀土合金的微观组织。结果表明,添加的镧镨铈混合稀土,只有少量固熔在镁基体中,绝大部分形成了稀土化合物,沿晶界呈网状分布。
关键词 镁合金 镧镨铈混合稀土 微观组织
下载PDF
利用一种新的谱扩展技术提高窄带语音质量
8
作者 陈善荣 胡剑凌 徐盛 《电声技术》 北大核心 2004年第3期35-38,共4页
提出了一种谱扩展算法,先对窄带语音进行线性预测编码(LPC)分析和多带激励(MBE)分析,得到窄带语音的线性谱频率(LSF)参数和清/浊音(U/V)判决信息;利用高斯混合模型(GMM)由窄带语音的LSF参数扩展得到高带语音的包络谱信息;对于激励信号,... 提出了一种谱扩展算法,先对窄带语音进行线性预测编码(LPC)分析和多带激励(MBE)分析,得到窄带语音的线性谱频率(LSF)参数和清/浊音(U/V)判决信息;利用高斯混合模型(GMM)由窄带语音的LSF参数扩展得到高带语音的包络谱信息;对于激励信号,由窄带语音的U/V判决信息通过码本匹配得到高带的U/V判决,然后根据U/V判决信息由正弦模型合成出高带激励信号,并进而由LPC方法生成高带语音。最终的宽带语音由原始窄带语音和扩展得到的高带语音经子带合成得到。实验结果表明该算法扩展得到的宽带语音能有效提高语音信号的清晰度和可懂度。 展开更多
关键词 谱扩展技术 窄带语音质量 高斯混合模型 线性预测编码 多带激励
下载PDF
Comparison of Khasi Speech Representations with Different Spectral Features and Hidden Markov States
9
作者 Bronson Syiem Sushanta Kabir Dutta +1 位作者 Juwesh Binong Lairenlakpam Joyprakash Singh 《Journal of Electronic Science and Technology》 CAS CSCD 2021年第2期155-162,共8页
In this paper,we present a comparison of Khasi speech representations with four different spectral features and novel extension towards the development of Khasi speech corpora.These four features include linear predic... In this paper,we present a comparison of Khasi speech representations with four different spectral features and novel extension towards the development of Khasi speech corpora.These four features include linear predictive coding(LPC),linear prediction cepstrum coefficient(LPCC),perceptual linear prediction(PLP),and Mel frequency cepstral coefficient(MFCC).The 10-hour speech data were used for training and 3-hour data for testing.For each spectral feature,different hidden Markov model(HMM)based recognizers with variations in HMM states and different Gaussian mixture models(GMMs)were built.The performance was evaluated by using the word error rate(WER).The experimental results show that MFCC provides a better representation for Khasi speech compared with the other three spectral features. 展开更多
关键词 Acoustic model(AM) Gaussian mixture model(GMM) hidden Markov model(HMM) language model(LM) linear predictive coding(lpc) linear prediction cepstral coefficient(lpcC) Mel frequency cepstral coefficient(MFCC) perceptual linear prediction(PLP)
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部