期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
文本无关发音质量评估系统中声学模型的若干研究和改进
1
作者 蒋同海 齐耀辉 +1 位作者 葛凤培 颜永红 《网络新媒体技术》 2012年第2期47-53,共7页
在无关的发音质量评估系统中,需要先识别出待测语音的说话内容,才能进行准确评估。真实的评测数据往往有很多不利的因素影响识别正确率,包括噪声、方言口音、信道噪声、说话随意性等。针对这些不利因素,本文对声学模型进行了深入的研究... 在无关的发音质量评估系统中,需要先识别出待测语音的说话内容,才能进行准确评估。真实的评测数据往往有很多不利的因素影响识别正确率,包括噪声、方言口音、信道噪声、说话随意性等。针对这些不利因素,本文对声学模型进行了深入的研究,包括:在训练数据中加入背景噪声,增强了模型的抗噪声能力;采用基于说话人的倒谱均值方差规整(SCMVN),降低信道及说话人个体特性的影响;用和待测语音相同地域的朗读数据做最大后验概率(MAP)自适应,使模型带有当地方言口音的发音特点;用自然口语数据做MAP自适应,使模型较好地描述自然口语中比较随意的发音现象。实验结果表明,使用这些措施之后,使待测语音的识别正确率相对提高了44.1%,从而使机器评分和专家评分的相关系数相对提高了6.3%。 展开更多
关键词 文本无关发音质量评估 声学模型 MAP 基于说话人的倒谱均值方差规整
下载PDF
汉语三维发音动作合成和动态模拟 被引量:1
2
作者 郑红娜 朱云 +1 位作者 王岚 陈辉 《集成技术》 2013年第1期23-28,共6页
本文以帮助聋儿言语康复为出发点,从聋儿音频发音数据中获得了聋儿易错发音文本以及聋儿易混淆发音文本对。设计了一个数据驱动的3D说话人头发音系统,该系统以EMA AG500设备采集的发音动作为驱动数据,逼真模拟了汉语的发音,从而可使聋... 本文以帮助聋儿言语康复为出发点,从聋儿音频发音数据中获得了聋儿易错发音文本以及聋儿易混淆发音文本对。设计了一个数据驱动的3D说话人头发音系统,该系统以EMA AG500设备采集的发音动作为驱动数据,逼真模拟了汉语的发音,从而可使聋儿观察到说话人嘴唇及舌头的运动情况,辅助聋儿发音训练,纠正易错发音。最后对系统的性能进行了人工评测,结果表明:3D说话人头发音系统可以有效地模拟说话人发音时口腔内外器官的发音动作。此外,本文还用基于音素的CM协同发音模型合成的方法,合成了聋儿易错发音文本的发音动动作,并用RMS度量了合成发音动作与真实发音动作的误差,得到了均值为1.25mm的RMS误差值。 展开更多
关键词 聋儿易错发音文本 3D说话人头 CM协同发音模型 电磁发音动作采集仪(EMA) DIRICHLET Free-Form Deformation (DFFD)算法
下载PDF
智能化语音语料库的设计研究
3
作者 杨政 马延周 《软件》 2023年第2期150-152,共3页
在经济全球化发展趋势下,世界各国对语言的研究越发深入,语言研究方法也越来越多,比如说定性研究、定量研究、两者相结合的研究方法等。现如今建设应用大型语料库作为国内外语言学研究的核心内容,不仅能为自然语言处理领域发展提供基础... 在经济全球化发展趋势下,世界各国对语言的研究越发深入,语言研究方法也越来越多,比如说定性研究、定量研究、两者相结合的研究方法等。现如今建设应用大型语料库作为国内外语言学研究的核心内容,不仅能为自然语言处理领域发展提供基础依据,还可以充分展现人工智能、信息提取、人机对话等技术优势。因此本文研究在了解智能化语音语料库设计原则的基础上,根据语音语料库的核心需求和属性扩张,深层探索智能化语音语料库的设计步骤,以电力行业的语音语料库设计构建情况为例,根据实证分析明确智能化语音语料库的设计应用价值。 展开更多
关键词 智能化 语音语料库 发音文本 语音录制 数据库
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部