期刊文献+
共找到118篇文章
< 1 2 6 >
每页显示 20 50 100
Mapping methods for output-based objective speech quality assessment using data mining 被引量:2
1
作者 王晶 赵胜辉 +1 位作者 谢湘 匡镜明 《Journal of Central South University》 SCIE EI CAS 2014年第5期1919-1926,共8页
Objective speech quality is difficult to be measured without the input reference speech.Mapping methods using data mining are investigated and designed to improve the output-based speech quality assessment algorithm.T... Objective speech quality is difficult to be measured without the input reference speech.Mapping methods using data mining are investigated and designed to improve the output-based speech quality assessment algorithm.The degraded speech is firstly separated into three classes(unvoiced,voiced and silence),and then the consistency measurement between the degraded speech signal and the pre-trained reference model for each class is calculated and mapped to an objective speech quality score using data mining.Fuzzy Gaussian mixture model(GMM)is used to generate the artificial reference model trained on perceptual linear predictive(PLP)features.The mean opinion score(MOS)mapping methods including multivariate non-linear regression(MNLR),fuzzy neural network(FNN)and support vector regression(SVR)are designed and compared with the standard ITU-T P.563 method.Experimental results show that the assessment methods with data mining perform better than ITU-T P.563.Moreover,FNN and SVR are more efficient than MNLR,and FNN performs best with 14.50% increase in the correlation coefficient and 32.76% decrease in the root-mean-square MOS error. 展开更多
关键词 语音质量 数据挖掘 映射方法 质量评估 模糊神经网络 多元非线性回归 一致性测量 ITU-T
下载PDF
Non-Intrusive Objective Speech Quality Measurement Based on Fuzzy GMM and SVR for Narrowband Speech
2
作者 王晶 张莹 +1 位作者 赵胜辉 匡镜明 《Journal of Beijing Institute of Technology》 EI CAS 2010年第1期76-81,共6页
Based on fuzzy Gaussian mixture model (FGMM) and support vector regression (SVR),an improved version of non-intrusive objective measurement for assessing quality of output speech without inputting clean speech is ... Based on fuzzy Gaussian mixture model (FGMM) and support vector regression (SVR),an improved version of non-intrusive objective measurement for assessing quality of output speech without inputting clean speech is proposed for narrowband speech.Its perceptual linear predictive (PLP) features extracted from clean speech and clustered by FGMM are used as an artificial reference model.Input speech is separated into three classes,for each a consistency parameter between each feature pair from test speech signals and its counterpart in the pre-trained FGMM reference model is calculated and mapped to an objective speech quality score using SVR method.The correlation degree between subjective mean opinion score (MOS) and objective MOS is analyzed.Experimental results show that the proposed method offers an effective technique and can give better performances than the ITU-T P.563 method under most of the test conditions for narrowband speech. 展开更多
关键词 non-intrusive measurement objective speech quality fuzzy Gaussian mixture model (FGMM) support vector regression (SVR)
下载PDF
噪声特性对言语可懂度评价的影响
3
作者 宋嘉炜 祝培生 +1 位作者 刘曦东 刘浩成 《噪声与振动控制》 CSCD 北大核心 2024年第1期234-241,共8页
言语可懂度是语言声房间和厅堂音质评价的重要指标,噪声特性是影响言语可懂度评价结果的重要因素之一。基于国内外相关文献就噪声特性对言语可懂度评价的影响进行系统研究,结果表明,噪声特性对言语可懂度的评价结果有显著影响(:1)噪声... 言语可懂度是语言声房间和厅堂音质评价的重要指标,噪声特性是影响言语可懂度评价结果的重要因素之一。基于国内外相关文献就噪声特性对言语可懂度评价的影响进行系统研究,结果表明,噪声特性对言语可懂度的评价结果有显著影响(:1)噪声在时域上的波动起伏有利于言语理解,但会导致个体间差异增大并降低评价结果的稳定性;噪声频率范围和频谱分布与语言声越接近,在低频区的噪声量越大,对言语可懂度的影响越大;言语噪声能够导致额外的信息掩蔽,影响程度与言语噪声的数量、噪声和目标语之间的相似程度以及听者的个体因素等有关。(2)将当前基于稳态噪声的言语可懂度客观评价方法用于其他噪声时,可能造成对言语可懂度的低估或高估。非稳态噪声情况下的可懂度客观评价仍存在一些不确定的地方。结合当前的研究现状,进一步提出该领域的下一步研究方向。相关内容可为噪声环境中的言语可懂度主、客观评价提供参考。 展开更多
关键词 声学 综述 噪声特性 言语可懂度 主观评价 客观评价
下载PDF
基于梯度归一化的端到端语音合成自适应损失权衡
4
作者 陈宽 陈涛 +2 位作者 尤玮珂 周琳娜 杨忠良 《网络空间安全科学学报》 2024年第1期72-82,共11页
语音合成技术是指给定文本经过模型处理生成目标说话人语音的过程,该技术在现实社会中已经得到广泛应用。在众多的语音合成模型中,VITS(The Variational Inference for Text-to-Speech)模型将多任务损失函数进行有效组合,相比以往的模型... 语音合成技术是指给定文本经过模型处理生成目标说话人语音的过程,该技术在现实社会中已经得到广泛应用。在众多的语音合成模型中,VITS(The Variational Inference for Text-to-Speech)模型将多任务损失函数进行有效组合,相比以往的模型,能够生成质量更高、听感更自然的语音。然而,现有模型依赖多个损失函数,暂时缺乏对其有效权衡的研究。因此,在现有模型损失函数的基础上,引入了梯度归一化自适应损失平衡优化方法,它根据模型不同损失函数的量级与不同子任务的训练速度来平衡各损失函数之间的权重,以验证该方法在语音合成任务中的适用性。在公开的中文语音合成数据集上评估了该方法合成语音的准确度与自然度,结果表明,采用此损失函数的模型在性能上得到了提升,证明了方法的有效性。 展开更多
关键词 文本转语音 端到端语音合成 多任务学习 多目标优化 梯度归一化
下载PDF
Single-Channel Speech Enhancement Using Critical-Band Rate Scale Based Improved Multi-Band Spectral Subtraction 被引量:1
5
作者 Navneet Upadhyay Abhijit Karmakar 《Journal of Signal and Information Processing》 2013年第3期314-326,共13页
This paper addresses the problem of single-channel speech enhancement in the adverse environment. The critical-band rate scale based on improved multi-band spectral subtraction is investigated in this study for enhanc... This paper addresses the problem of single-channel speech enhancement in the adverse environment. The critical-band rate scale based on improved multi-band spectral subtraction is investigated in this study for enhancement of single-channel speech. In this work, the whole speech spectrum is divided into different non-uniformly spaced frequency bands in accordance with the critical-band rate scale of the psycho-acoustic model and the spectral over-subtraction is carried-out separately in each band. In addition, for the estimation of the noise from each band, the adaptive noise estimation approach is used and does not require explicit speech silence detection. The noise is estimated and updated by adaptively smoothing the noisy signal power in each band. The smoothing parameter is controlled by a-posteriori signal-to-noise ratio (SNR). For the performance analysis of the proposed algorithm, the objective measures, such as, SNR, segmental SNR, and perceptual evaluations of the speech quality are conducted for the variety of noises at different levels of SNRs. The speech spectrogram and objective evaluations of the proposed algorithm are compared with other standard speech enhancement algorithms and proved that the musical structure of the remnant noise and background noise is better suppressed by the proposed algorithm. 展开更多
关键词 SINGLE-CHANNEL speech Enhancement Critical-Band RATE SCALE Spectral Over-Subtraction Adaptive Noise Estimation objective Measure speech Spectrograms
下载PDF
基于伽玛通滤波器的双谱特征语音可懂度算法
6
作者 陈晓梅 王晓玮 +2 位作者 钟波 杨佳燕 商莹莹 《计算机工程与设计》 北大核心 2023年第5期1288-1296,共9页
针对现有的语音可懂度评价方法不能真实贴近人耳对语音的感知过程,提出一种基于人耳听觉特性的双谱特征预测语音可懂度评价(Gammatone-bspectral speech intelligibility metric, GBSIM)算法。充分利用双谱可以检测语音信号中的非线性... 针对现有的语音可懂度评价方法不能真实贴近人耳对语音的感知过程,提出一种基于人耳听觉特性的双谱特征预测语音可懂度评价(Gammatone-bspectral speech intelligibility metric, GBSIM)算法。充分利用双谱可以检测语音信号中的非线性相位耦合,抑制非高斯信号中的高斯噪声的特性,采用可以模拟人工耳蜗模型的Gammatone滤波器组,通过滤波处理将输入的语音信号分为32个听觉子频带,用三阶统计量对每个子频带的语音信号进行双谱估计并提取单一特征值来计算语音的可懂度。实例验证结果表明,该方法对信号失真变化敏感,其评价结果与主观评价具有很高的相关度,相对于传统的语音可懂度评价算法具有更好的评价效果。 展开更多
关键词 语音可懂度 客观评价算法 非线性失真 听觉特性 Gammatone滤波器组 高阶统计量 双谱
下载PDF
基于轻量级卷积门控循环神经网络的语声增强方法 被引量:1
7
作者 王玫 李江和 +1 位作者 宋浠瑜 刘小娟 《应用声学》 CSCD 北大核心 2023年第3期652-658,共7页
针对在基于深度学习语声增强方法中因采用因果式的网络输入导致语声增强性能下降的问题,提出了一种基于轻量级卷积门控循环神经网络的语声增强方法。门控循环神经网络能够建模语声信号的时间相关性,但是其全连接结构忽略了语声信号的时... 针对在基于深度学习语声增强方法中因采用因果式的网络输入导致语声增强性能下降的问题,提出了一种基于轻量级卷积门控循环神经网络的语声增强方法。门控循环神经网络能够建模语声信号的时间相关性,但是其全连接结构忽略了语声信号的时频结构特征,并且参数数量庞大,不利于网络的训练。对此,该文采用卷积核替代门控循环神经网络中的全连接结构,在对语声信号时间相关性建模的同时保留了语声信号的时频结构特征,同时降低了网络的参数数量。为充分利用先前帧的特征信息,该网络单元当前时刻的输入融合了上一时刻的输入与输出。针对网络训练过程中容易产生过拟合的问题,该文采用了线性门控机制来控制信息的传输,这缓解了网络训练过程中的过拟合问题,提高了网络的语声增强性能。实验结果表明,该文所提出的网络结构在增强后的语声感知质量、语声短时客观可懂度、分段信噪比等指标上均优于传统的网络结构。 展开更多
关键词 卷积门控循环神经网络 固定时延 因果式语声增强 语声质量 语声可懂度
下载PDF
基于人工智能技术的多信息融合可穿戴式导盲系统设计 被引量:1
8
作者 杨礼 崔永利 +3 位作者 霍毅 关兆泓 张雅辉 皮雨晴 《科技创新与应用》 2023年第18期19-22,共4页
人获取外界信息主要通过视觉。失去视觉后,盲人在日常生活中存在诸多困难与危险。随着计算机软硬件技术的迅速发展,导盲设备层出不穷,使盲人群体的生活状况有所改善,切实享受到科技进步带来的便利。现有的导盲设备为盲人的生活提供一些... 人获取外界信息主要通过视觉。失去视觉后,盲人在日常生活中存在诸多困难与危险。随着计算机软硬件技术的迅速发展,导盲设备层出不穷,使盲人群体的生活状况有所改善,切实享受到科技进步带来的便利。现有的导盲设备为盲人的生活提供一些帮助,但存在着价格高、体验差、功能单一等问题。基于以上原因,该文提出一种更人性化、大众化、智能化的基于人工智能技术的多信息融合可穿戴式导盲系统。系统选用带有Raspbian操作系统的树莓派4B开发板作为主控制器,协控制器选用STM32开发板,以OpenCV和C++作为系统的开发工具。系统中的物体识别部分采用OpenCV提供的图像处理接口实现,安全避障部分采用激光测距模块获取障碍物距离,语音识别部分采用语音识别模块对系统进行语音控制,可拨打紧急电话并发送带GPS定位的求救短信。项目采用多线程开发技术开发系统软件,使得系统的性能更加优越。 展开更多
关键词 可穿戴式导盲系统 多信息融合 物体识别 语音识别 树莓派
下载PDF
语音系统客观音质评价研究 被引量:27
9
作者 黄惠明 王瑛 +1 位作者 赵思伟 张知易 《电子学报》 EI CAS CSCD 北大核心 2000年第4期112-114,共3页
本文采用以谱距离为基础的LPC CD、Bark SD和Mel CD三种客观失真测度 ,对若干种语音编码设备及它们的级联系统进行了客观音质评价实验研究 .结果表明 ,这三种测度单独应用都具有较好主、客观相关性 ,它们的组合 ,给出更好的相关结果 .因... 本文采用以谱距离为基础的LPC CD、Bark SD和Mel CD三种客观失真测度 ,对若干种语音编码设备及它们的级联系统进行了客观音质评价实验研究 .结果表明 ,这三种测度单独应用都具有较好主、客观相关性 ,它们的组合 ,给出更好的相关结果 .因此 ,可以推断 ,这些测度作为语音系统的音质评价是有一定有效性和实用性的 . 展开更多
关键词 语音系统 客观音质评价 语音编码
下载PDF
民事裁判援引宪法的条件任意主义批判——以援引言论自由条款的案件为例 被引量:19
10
作者 李海平 石晶 《政治与法律》 CSSCI 北大核心 2020年第8期136-148,共13页
我国民事裁判援引宪法的实践呈现出鲜明的条件任意主义特征,主要表现为:法院对当事人的宪法权利主张视而不见、对援引宪法的条件避而不谈,以及对援引宪法的功能差异混沌不分。民事裁判援引宪法条件任意主义造成弱化宪法权威、背离法的... 我国民事裁判援引宪法的实践呈现出鲜明的条件任意主义特征,主要表现为:法院对当事人的宪法权利主张视而不见、对援引宪法的条件避而不谈,以及对援引宪法的功能差异混沌不分。民事裁判援引宪法条件任意主义造成弱化宪法权威、背离法的安定性、威胁私法自治和权利保护不足的后果。民事裁判援引宪法的条件任意主义具有规范和理论层面的深层根源,规范根源在于宪法关于调整领域规定的普遍性和司法解释中缺乏援引宪法条件的规定;理论根源在于宪法母法观和宪法客观价值秩序理论。回归宪法的公法属性,限定宪法客观价值辐射具有国家公共性和社会公共性的法律领域范围,明确援引宪法的国家公权力条件、社会公权力条件和公共利益条件的具体条件类型,是走出援引宪法条件任意主义误区的有效路径。在《最高人民法院关于人民法院民事裁判文书制作规范》的援引宪法规范部分,应增加援引条件规范,将案件涉及公权力或者公共利益确定为援引宪法的条件内容。 展开更多
关键词 民事裁判 宪法援引 言论自由 客观价值秩序
下载PDF
一种采用余弦镶边临界带滤波器组的弯折谱失真测度 被引量:6
11
作者 付强 易克初 +1 位作者 田斌 田红心 《西安电子科技大学学报》 EI CAS CSCD 北大核心 1999年第6期823-827,共5页
建立在语音非线性感知特性基础上的谱失真测度,如Mel谱和Bark 谱失真测度等,在语音处理的实际应用中取得了较好的效果.文中提出的余弦镶边临界带滤波谱失真测度也属于这一类,并且综合了二者的优点,所做改进及其特色主要有3... 建立在语音非线性感知特性基础上的谱失真测度,如Mel谱和Bark 谱失真测度等,在语音处理的实际应用中取得了较好的效果.文中提出的余弦镶边临界带滤波谱失真测度也属于这一类,并且综合了二者的优点,所做改进及其特色主要有3 点:一是采用临界带集成原理分配分析滤波器组的中心频率及带宽,使之更加符合耳蜗分析的机理;二是设计了一种新的余弦镶边滤波器代替Mel谱中的三角滤波器,使之对于共振峰的频移不敏感,增强了客观测度在噪声环境中提取共振峰参数的能力;三是具有与Mel谱失真测度相当的计算复杂度。 展开更多
关键词 谱失真测度 语音客观测度 语音识别
下载PDF
语言清晰度客观评价方法——对IEC 60268-16(4.0版,2011.6)规范的解读 被引量:9
12
作者 祝培生 莫方朔 +1 位作者 路晓东 胡沈健 《电声技术》 2012年第5期40-45,共6页
语言清晰度(或可懂度)是音质评价的重要指标。但语言清晰度客观评价定义复杂,修正系数众多,测量结果也容易产生误差,因此一直没有得到有效推广。结合最新发布的IEC 60268-16(4.0版,2011.6)规范,介绍其推荐的语言清晰度客观评价方法即语... 语言清晰度(或可懂度)是音质评价的重要指标。但语言清晰度客观评价定义复杂,修正系数众多,测量结果也容易产生误差,因此一直没有得到有效推广。结合最新发布的IEC 60268-16(4.0版,2011.6)规范,介绍其推荐的语言清晰度客观评价方法即语言传输指数STI以及其他几种常见的客观评价方法,并对他们的适用条件加以说明。 展开更多
关键词 语言清晰度 客观评价方法 语言传输指数
下载PDF
基于人耳听觉模型的语音质量客观评价方法 被引量:19
13
作者 李云鸿 胡修林 张蕴玉 《华中理工大学学报》 CSCD 北大核心 2000年第5期63-65,共3页
将人耳听觉模型应用于语音质量客观评价 ,用听觉模型对语音作处理得到近似的短时语音频谱 ,在此基础上得到谱距离作为语音质量的评判标准 .实验结果表明这种方法与主观评价结果的相关度达到 0 .
关键词 语音质量 听觉模型 客观处理
下载PDF
普通话声母的客观评测 被引量:3
14
作者 汤霖 黄建中 尹俊勋 《计算机应用》 CSCD 北大核心 2010年第4期1135-1140,共6页
通过罗列分析声母读音错误的主要表现形式,提出了利用语音知识引导的两层两级声母客观评测算法。根据普通话声母的特点,总结出98种普通话声韵组合作为声母的评测基元。实验结果表明,所提出的算法比单独用隐马尔可夫模型(HMM)算法评测的... 通过罗列分析声母读音错误的主要表现形式,提出了利用语音知识引导的两层两级声母客观评测算法。根据普通话声母的特点,总结出98种普通话声韵组合作为声母的评测基元。实验结果表明,所提出的算法比单独用隐马尔可夫模型(HMM)算法评测的主客观符合率高2.56%,比单独用BP神经网络算法评测的主客观符合率高3.65%,比只用单层算法评测的主客观符合率高1.42%,证明该算法不但能减少计算量,还能提高评测的精度。 展开更多
关键词 语音客观评测 声母 语音信号处理 普通话水平测试 计算机辅助语言学习
下载PDF
语音质量客观评价方法研究及实现 被引量:4
15
作者 方凡泉 李心广 +1 位作者 王桂珍 林江豪 《广州大学学报(自然科学版)》 CAS 2011年第1期65-69,共5页
语音质量的客观评价在语言自主学习中具有重大的意义.文章首先介绍了语音质量客观评价过程中语音信号的预处理单元;其次,介绍了不同的语音特征提取算法,比较选择了更符合人耳听觉模型的MFCC特征,并给出特征提取过程及结果;最后,比较当... 语音质量的客观评价在语言自主学习中具有重大的意义.文章首先介绍了语音质量客观评价过程中语音信号的预处理单元;其次,介绍了不同的语音特征提取算法,比较选择了更符合人耳听觉模型的MFCC特征,并给出特征提取过程及结果;最后,比较当前评价模型(DTW和HMM)的优缺点,并提出了采用HMM模型进行评价的方法,设计系统验证了该方法下评价的客观性. 展开更多
关键词 语音质量 客观评价 HMM模型 语音特征
下载PDF
基于改进MFCC语音特征参数的语音质量评估的研究 被引量:5
16
作者 陈明义 孙冬梅 何孝月 《电路与系统学报》 CSCD 北大核心 2009年第3期111-116,共6页
本文讨论了基于MFCC(Mel-Frequency Cepstral Coefficients)听觉感知模型的语音质量客观评估方法(EPESQ:Efficient Psychoacoustics Evaluation of Speech Quality)在网络语音质量客观评估中的应用,深入分析了EPESQ算法的基本原理,并对... 本文讨论了基于MFCC(Mel-Frequency Cepstral Coefficients)听觉感知模型的语音质量客观评估方法(EPESQ:Efficient Psychoacoustics Evaluation of Speech Quality)在网络语音质量客观评估中的应用,深入分析了EPESQ算法的基本原理,并对算法的MFCC语音特征参数进行了改进和性能分析。实验证明该算法在确保评测准确性的前提下,大大降低了算法的复杂度,具有较强的适应性,可靠性,实用性,完全可以应用于通信网络语音质量评估。 展开更多
关键词 MFCC 感知模型 EPESQ 语音质量 客观评估
下载PDF
基于输出的语音质量客观评价方法研究 被引量:1
17
作者 陈国 胡修林 +1 位作者 杨灵 朱耀庭 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第5期86-88,共3页
在分析语谱图基础上提出了一种基于输出的语音质量客观评价方法———度量语谱图密度分布特征MDCSD (MeasuringDistributionCharacteristicsofSpectrogramDensity)方法 .该方法通过计算功率谱二维联合概率分布特征来描述不同质量语音信... 在分析语谱图基础上提出了一种基于输出的语音质量客观评价方法———度量语谱图密度分布特征MDCSD (MeasuringDistributionCharacteristicsofSpectrogramDensity)方法 .该方法通过计算功率谱二维联合概率分布特征来描述不同质量语音信号的语谱图特征 ,并以此来对语音质量进行客观评价 .实验结果表明该方法是一种性能良好的基于输出的客观评价方法 ,其评价结果与主观评价的相关度达到了 0 .8左右 . 展开更多
关键词 语谱图 语音质量 客观评价 质量语谱图密度分布特征法 特征参量
下载PDF
基于MARS的语音清晰度客观评价 被引量:3
18
作者 沈刘平 杨吉斌 +2 位作者 曹铁勇 张雄伟 孙新建 《数据采集与处理》 CSCD 北大核心 2008年第1期100-103,共4页
提出了基于多元自适应回归样条法(Multivariate adaptive regression spline,MARS)的语音清晰度客观评价方法。该方法提取语音信号的Mel倒谱系数作为评估语音清晰度的候选特征参数。在Mel倒谱系数的失真距离基础上,利用MARS方法选出对... 提出了基于多元自适应回归样条法(Multivariate adaptive regression spline,MARS)的语音清晰度客观评价方法。该方法提取语音信号的Mel倒谱系数作为评估语音清晰度的候选特征参数。在Mel倒谱系数的失真距离基础上,利用MARS方法选出对语音清晰度影响较大的特征参数,并结合主观DRT分建立最佳客观预测模型,实现特征参数失真距离到客观DR∧T分的映射。仿真结果表明,分别采用训练集合样本和测试集合样本进行测试时,使用该方法评价的客观DR∧T分与主观DRT分的相关度,分别达到0.958和0.9102。 展开更多
关键词 语音清晰度 客观评价 多元自适应回归样条法(MARS) MEL倒谱系数
下载PDF
新闻语言客观性问题的言语行为分析 被引量:21
19
作者 胡范铸 《华东师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2007年第2期45-51,共7页
任何一个言语行为都是一个用符号表达说话者的知识,并让听话者接受的过程。言语行为要实现自己的意图都要遵循一定的规则,这些规则有构成性的也有策略性的,“内容客观”是新闻言语行为最重要的构成性规则。而新闻言语行为的客观性并不... 任何一个言语行为都是一个用符号表达说话者的知识,并让听话者接受的过程。言语行为要实现自己的意图都要遵循一定的规则,这些规则有构成性的也有策略性的,“内容客观”是新闻言语行为最重要的构成性规则。而新闻言语行为的客观性并不仅仅是不编造假新闻的问题,其中包括知识传达、符号可能、接受心理三方面,“知识传达”意味着是否“说的是客观的,不说不客观的,客观的重要事实就一定要说”;“符号可能”意味着世界的动态性、无限性、完整性与语言相对的静态性、有限性、抽象性的矛盾;“接受心理”意味着在听话者的认知心理中存在着权威即客观、亲近即客观、常规即客观、重复即客观、一致即客观、细节即客观、数据即客观、画面即客观、说法既客观、直引即客观、干脆即客观、及时即客观的问题。 展开更多
关键词 新闻 言语行为 客观性 知识 符号 心理
下载PDF
基于模糊多类支持向量机的语音质量客观评价 被引量:3
20
作者 张军 张德运 傅鹏 《西安交通大学学报》 EI CAS CSCD 北大核心 2006年第2期199-202,共4页
提出了采用模糊有向图支持向量机(FDGSVM)对基于输出的多语言语音样本进行语音质量评价的一种新方法.将多个可进行两类分类的模糊支持向量机组织成具有惟一根节点的有向图结构,得到多类分类器FDGSVM;提取待测语音信号的Mel倒谱系数并将... 提出了采用模糊有向图支持向量机(FDGSVM)对基于输出的多语言语音样本进行语音质量评价的一种新方法.将多个可进行两类分类的模糊支持向量机组织成具有惟一根节点的有向图结构,得到多类分类器FDGSVM;提取待测语音信号的Mel倒谱系数并将其作为特征向量,再通过FDGSVM将特征向量映射到非线性划分的主观平均意见评分(MOS)区间,映射值即为输出的语音质量的客观评价结果.实验结果表明,所提算法获得的评测结果与主观MOS评价之间的相关度,在闭集测试时可达0.91,在开集测试时可达0.88. 展开更多
关键词 模糊有向图 支持向量机 MEL倒谱系数 语音质量 客观评价
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部