期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
文本无关发音质量评估系统中声学模型的若干研究和改进
1
作者
蒋同海
齐耀辉
+1 位作者
葛凤培
颜永红
《网络新媒体技术》
2012年第2期47-53,共7页
在无关的发音质量评估系统中,需要先识别出待测语音的说话内容,才能进行准确评估。真实的评测数据往往有很多不利的因素影响识别正确率,包括噪声、方言口音、信道噪声、说话随意性等。针对这些不利因素,本文对声学模型进行了深入的研究...
在无关的发音质量评估系统中,需要先识别出待测语音的说话内容,才能进行准确评估。真实的评测数据往往有很多不利的因素影响识别正确率,包括噪声、方言口音、信道噪声、说话随意性等。针对这些不利因素,本文对声学模型进行了深入的研究,包括:在训练数据中加入背景噪声,增强了模型的抗噪声能力;采用基于说话人的倒谱均值方差规整(SCMVN),降低信道及说话人个体特性的影响;用和待测语音相同地域的朗读数据做最大后验概率(MAP)自适应,使模型带有当地方言口音的发音特点;用自然口语数据做MAP自适应,使模型较好地描述自然口语中比较随意的发音现象。实验结果表明,使用这些措施之后,使待测语音的识别正确率相对提高了44.1%,从而使机器评分和专家评分的相关系数相对提高了6.3%。
展开更多
关键词
文本
无关
发音
质量评估
声学模型
MAP
基于说话人的倒谱均值方差规整
下载PDF
职称材料
汉语三维发音动作合成和动态模拟
被引量:
1
2
作者
郑红娜
朱云
+1 位作者
王岚
陈辉
《集成技术》
2013年第1期23-28,共6页
本文以帮助聋儿言语康复为出发点,从聋儿音频发音数据中获得了聋儿易错发音文本以及聋儿易混淆发音文本对。设计了一个数据驱动的3D说话人头发音系统,该系统以EMA AG500设备采集的发音动作为驱动数据,逼真模拟了汉语的发音,从而可使聋...
本文以帮助聋儿言语康复为出发点,从聋儿音频发音数据中获得了聋儿易错发音文本以及聋儿易混淆发音文本对。设计了一个数据驱动的3D说话人头发音系统,该系统以EMA AG500设备采集的发音动作为驱动数据,逼真模拟了汉语的发音,从而可使聋儿观察到说话人嘴唇及舌头的运动情况,辅助聋儿发音训练,纠正易错发音。最后对系统的性能进行了人工评测,结果表明:3D说话人头发音系统可以有效地模拟说话人发音时口腔内外器官的发音动作。此外,本文还用基于音素的CM协同发音模型合成的方法,合成了聋儿易错发音文本的发音动动作,并用RMS度量了合成发音动作与真实发音动作的误差,得到了均值为1.25mm的RMS误差值。
展开更多
关键词
聋儿易错
发音文本
3D说话人头
CM协同
发音
模型
电磁
发音
动作采集仪(EMA)
DIRICHLET
Free-Form
Deformation
(DFFD)算法
下载PDF
职称材料
智能化语音语料库的设计研究
3
作者
杨政
马延周
《软件》
2023年第2期150-152,共3页
在经济全球化发展趋势下,世界各国对语言的研究越发深入,语言研究方法也越来越多,比如说定性研究、定量研究、两者相结合的研究方法等。现如今建设应用大型语料库作为国内外语言学研究的核心内容,不仅能为自然语言处理领域发展提供基础...
在经济全球化发展趋势下,世界各国对语言的研究越发深入,语言研究方法也越来越多,比如说定性研究、定量研究、两者相结合的研究方法等。现如今建设应用大型语料库作为国内外语言学研究的核心内容,不仅能为自然语言处理领域发展提供基础依据,还可以充分展现人工智能、信息提取、人机对话等技术优势。因此本文研究在了解智能化语音语料库设计原则的基础上,根据语音语料库的核心需求和属性扩张,深层探索智能化语音语料库的设计步骤,以电力行业的语音语料库设计构建情况为例,根据实证分析明确智能化语音语料库的设计应用价值。
展开更多
关键词
智能化
语音语料库
发音文本
语音录制
数据库
下载PDF
职称材料
题名
文本无关发音质量评估系统中声学模型的若干研究和改进
1
作者
蒋同海
齐耀辉
葛凤培
颜永红
机构
中国科学院新疆理化技术研究所
中国科学院语言声学与内容理解重点实验室
北京理工大学信息与电子学院
河北师范大学物理科学与信息工程学院
出处
《网络新媒体技术》
2012年第2期47-53,共7页
基金
国家自然科学基金(No.10925419
90920302
+3 种基金
10874203
60875014
61072124
11074275)经费资助
文摘
在无关的发音质量评估系统中,需要先识别出待测语音的说话内容,才能进行准确评估。真实的评测数据往往有很多不利的因素影响识别正确率,包括噪声、方言口音、信道噪声、说话随意性等。针对这些不利因素,本文对声学模型进行了深入的研究,包括:在训练数据中加入背景噪声,增强了模型的抗噪声能力;采用基于说话人的倒谱均值方差规整(SCMVN),降低信道及说话人个体特性的影响;用和待测语音相同地域的朗读数据做最大后验概率(MAP)自适应,使模型带有当地方言口音的发音特点;用自然口语数据做MAP自适应,使模型较好地描述自然口语中比较随意的发音现象。实验结果表明,使用这些措施之后,使待测语音的识别正确率相对提高了44.1%,从而使机器评分和专家评分的相关系数相对提高了6.3%。
关键词
文本
无关
发音
质量评估
声学模型
MAP
基于说话人的倒谱均值方差规整
Keywords
text-independent pronunciation quality assessment
acoustic model
MAP
speaker-based cepstral mean and variance normalization
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
汉语三维发音动作合成和动态模拟
被引量:
1
2
作者
郑红娜
朱云
王岚
陈辉
机构
中国科学院深圳先进技术研究院集成所环绕智能实验室
太原理工大学信息工程学院
中国科学院软件研究所
出处
《集成技术》
2013年第1期23-28,共6页
基金
国家自然科学基金项目(NSFC61135003
NSFC90920002)
中国科学院知识创新工程项目(KJCXZ-YW-617)
文摘
本文以帮助聋儿言语康复为出发点,从聋儿音频发音数据中获得了聋儿易错发音文本以及聋儿易混淆发音文本对。设计了一个数据驱动的3D说话人头发音系统,该系统以EMA AG500设备采集的发音动作为驱动数据,逼真模拟了汉语的发音,从而可使聋儿观察到说话人嘴唇及舌头的运动情况,辅助聋儿发音训练,纠正易错发音。最后对系统的性能进行了人工评测,结果表明:3D说话人头发音系统可以有效地模拟说话人发音时口腔内外器官的发音动作。此外,本文还用基于音素的CM协同发音模型合成的方法,合成了聋儿易错发音文本的发音动动作,并用RMS度量了合成发音动作与真实发音动作的误差,得到了均值为1.25mm的RMS误差值。
关键词
聋儿易错
发音文本
3D说话人头
CM协同
发音
模型
电磁
发音
动作采集仪(EMA)
DIRICHLET
Free-Form
Deformation
(DFFD)算法
Keywords
hearing loss children’s fallible pronunciation texts
3D talking head
CM co-articulation model
electromagnetic articulography (EMA)
Dirichlet Free-Form Deformation (DFFD) algorithm
分类号
TN912.3 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
智能化语音语料库的设计研究
3
作者
杨政
马延周
机构
战略支援部队信息工程大学
出处
《软件》
2023年第2期150-152,共3页
文摘
在经济全球化发展趋势下,世界各国对语言的研究越发深入,语言研究方法也越来越多,比如说定性研究、定量研究、两者相结合的研究方法等。现如今建设应用大型语料库作为国内外语言学研究的核心内容,不仅能为自然语言处理领域发展提供基础依据,还可以充分展现人工智能、信息提取、人机对话等技术优势。因此本文研究在了解智能化语音语料库设计原则的基础上,根据语音语料库的核心需求和属性扩张,深层探索智能化语音语料库的设计步骤,以电力行业的语音语料库设计构建情况为例,根据实证分析明确智能化语音语料库的设计应用价值。
关键词
智能化
语音语料库
发音文本
语音录制
数据库
Keywords
intelligent
phonetic corpus
pronunciation text
voice recording
database
分类号
TP319 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
文本无关发音质量评估系统中声学模型的若干研究和改进
蒋同海
齐耀辉
葛凤培
颜永红
《网络新媒体技术》
2012
0
下载PDF
职称材料
2
汉语三维发音动作合成和动态模拟
郑红娜
朱云
王岚
陈辉
《集成技术》
2013
1
下载PDF
职称材料
3
智能化语音语料库的设计研究
杨政
马延周
《软件》
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部