期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
面向自定义语音唤醒的关键词相关的单通道语音增强 被引量:2
1
作者 刘作桢 吴愁 +1 位作者 黎塔 赵庆卫 《声学学报》 EI CAS CSCD 北大核心 2023年第2期415-424,共10页
提出一种面向自定义语音唤醒的单通道语音增强方法。该方法预先将关键词音素信息存入文本编码矩阵,并在常规语音增强模型基础上添加一个基于注意力机制的音素偏置模块。该模块利用语音增强模型中间特征从文本编码矩阵中获取当前帧的音... 提出一种面向自定义语音唤醒的单通道语音增强方法。该方法预先将关键词音素信息存入文本编码矩阵,并在常规语音增强模型基础上添加一个基于注意力机制的音素偏置模块。该模块利用语音增强模型中间特征从文本编码矩阵中获取当前帧的音素信息,并将其融入语音增强模型的后续计算中,从而提升语音增强模型对关键词相关音素的增强效果。在不同噪声环境下的实验结果表明,该方法可以更有效地抑制关键词部分噪声。同时所提出方法对比常规语音增强方法与其他文本相关语音增强方法,在自定义语音唤醒性能上可以分别获得14.3%和7.6%的相对提升。 展开更多
关键词 语音增强 语音唤醒 关键词相关 深度学习
下载PDF
汉语连续语音识别中上下文相关的识别单元(三音子)的研究 被引量:4
2
作者 赵庆卫 王作英 陆大 《电子学报》 EI CAS CSCD 北大核心 1999年第6期79-82,117,共5页
本文详细研究了汉语语音识别中如何有效地建立上下文相关的识别单元,以解决连续语音之间的协同发音问题.本文首先利用信息论原理,研究了传统的聚类算法的距离测度,分别是模型分布的散度和模型合并或分裂前后熵的变化值.然后本文提... 本文详细研究了汉语语音识别中如何有效地建立上下文相关的识别单元,以解决连续语音之间的协同发音问题.本文首先利用信息论原理,研究了传统的聚类算法的距离测度,分别是模型分布的散度和模型合并或分裂前后熵的变化值.然后本文提出了基于决策树的聚类方法,它的主要优点是充分利用了语音学知识,聚类后得到的模型可推广性好,尤其适用于集外语料中出现大量的未在训练语料中出现的三音子单元的情况.接着介绍了模型聚类和训练的实验步骤最后,非特定人大词汇量连续语音识别的实验表明,基于决策树的聚类方法所得到的识别单元,当识别集外语料时使系统的误识率降低了7.95%,而基于合并的聚类方法所得到的识别单元只降低了2.63%. 展开更多
关键词 连续语音识别 上下文相关 决策树 聚类算法
下载PDF
段长信息在连续语音识别中的应用研究 被引量:5
3
作者 赵庆卫 肖熙 王作英 《声学学报》 EI CSCD 北大核心 2000年第2期175-181,共7页
基于段长分布的隐含马尔可夫模型(DDBHMM)有效地解决了经典HMM的缺陷.本文以DDBHMM模型为基础,详细研究了如何在连续语音识别中有效地利用段长信息。文中首先介绍了段长分布的统计方法,然后按照不同的说话速度对数... 基于段长分布的隐含马尔可夫模型(DDBHMM)有效地解决了经典HMM的缺陷.本文以DDBHMM模型为基础,详细研究了如何在连续语音识别中有效地利用段长信息。文中首先介绍了段长分布的统计方法,然后按照不同的说话速度对数据文件进行了分类,据此进行的识别实验表明,段长信息对于速度慢的文件效果最好,速度中等的次之,速度快的效果较小.作者认为,段长信息最大的作用在于能够得到更加精确的音节和状态分割点,并因而提高识别效果.同时,通过段长信息的有效利用,还能够提高识别系统对于说话速度的稳健性、作者又进行了细化研究,提出了利用分类段长和规整化的段长的研究方法,发现两者均可使识别效果有进一步的提高.为了研究如何利用段长之间的相关性,文中还提出了段长的Bigram的方法,并对之作了分析.最后,本文研究了采用后处理方法利用段长信息的效果,进一步说明了只有基于DDBHMM,在识别过程中同步利用段长信息,才能得到卓有成效的性能提高。 展开更多
关键词 段长信息 连续语音识别 DDBHMM模型
下载PDF
基于共振峰模式的汉语普通话中韵母发音水平客观测试方法的研究 被引量:16
4
作者 董滨 赵庆卫 颜永红 《声学学报》 EI CSCD 北大核心 2007年第2期122-128,共7页
提出了一种以元音的共振峰模式为特征基于支持向量机算法的分类评估方法,用以对汉语普通话中的韵母发音水平进行客观测试。此算法为每个韵母分别训练全分类模型、子分类模型和评估模型,在两级分类的基础上对发音水平进行测试打分。实验... 提出了一种以元音的共振峰模式为特征基于支持向量机算法的分类评估方法,用以对汉语普通话中的韵母发音水平进行客观测试。此算法为每个韵母分别训练全分类模型、子分类模型和评估模型,在两级分类的基础上对发音水平进行测试打分。实验结果表明,全分类模型可以达到90%以上的分类正确率,客观测试与专家主观评估的相似度达到82%,在性能上超过了传统的以倒谱系数为特征的隐含马尔科夫模型方法。 展开更多
关键词 客观测试方法 汉语普通话 共振峰 发音 韵母 支持向量机算法 分类模型
下载PDF
一种用于方言口音语音识别的字典自适应技术 被引量:5
5
作者 潘复平 赵庆卫 颜永红 《计算机工程与应用》 CSCD 北大核心 2005年第23期4-6,9,共4页
基于标准普通话的语音识别系统在识别带有方言口音的普通话时,识别率会下降很多。针对这一问题,论文介绍了一种“字典自适应技术”。文中首先提出了一种自动标注算法,然后以此为基础,通过分析语音数据,统计出带有方言口音普通话的发音规... 基于标准普通话的语音识别系统在识别带有方言口音的普通话时,识别率会下降很多。针对这一问题,论文介绍了一种“字典自适应技术”。文中首先提出了一种自动标注算法,然后以此为基础,通过分析语音数据,统计出带有方言口音普通话的发音规律,然后把这个规律编码到标准普通话字典里,构造出体现这种方言发音特征的新字典,最后把新字典整合于搜索框架,用于识别带有该方言口音的普通话,使识别率得到显著提高。 展开更多
关键词 字典自适应 方言识别 自动标注 音节 搜索路径
下载PDF
基于鼻韵尾分离的汉语声韵母识别模型 被引量:3
6
作者 邵健 赵庆卫 颜永红 《声学学报》 EI CSCD 北大核心 2010年第5期587-592,共6页
研究汉语自然口语识别中的建模单元选择问题。在HMM三状态模型中,声韵母单元与音素单元作为两种最流行的建模单元各有优劣。一方面从自然口语音变严重的问题出发,倾向采用粗粒度的声韵母单元以概括各种音变;另一方面从三状态结构可能无... 研究汉语自然口语识别中的建模单元选择问题。在HMM三状态模型中,声韵母单元与音素单元作为两种最流行的建模单元各有优劣。一方面从自然口语音变严重的问题出发,倾向采用粗粒度的声韵母单元以概括各种音变;另一方面从三状态结构可能无法有效描述复杂单元的问题出发,又倾向采用细粒度的音素单元。本文在实验语音学理论研究成果与声韵母时长分析实验结果的基础上,主张对扩展声韵母单元进行有选择的拆分,提出了基于鼻韵尾分离的声韵母拆分方法。实验结果表明本文的方法与扩展声韵母单元、音素单元相比,识别性能有了明显改善,其字错误率分别降低2.23%和9.45%。 展开更多
关键词 识别模型 韵母 分离 语声 分析实验 理论研究成果 自然口语
下载PDF
基于语音识别与特征的无监督语音模式提取 被引量:4
7
作者 张震 赵庆卫 颜永红 《计算机工程》 CAS CSCD 2014年第5期262-265,共4页
在语音识别与特征系统中,通过无监督的方法搜索未知语音流中出现的语言模式。利用语音识别系统的多候选结果,通过分段动态时间弯曲算法进行语言模式的搜索,采用有效的聚类算法以及置信度估计算法,提高系统性能,同时建立仅基于特征匹配... 在语音识别与特征系统中,通过无监督的方法搜索未知语音流中出现的语言模式。利用语音识别系统的多候选结果,通过分段动态时间弯曲算法进行语言模式的搜索,采用有效的聚类算法以及置信度估计算法,提高系统性能,同时建立仅基于特征匹配的相似音频片段检测系统,不使用任何知识源,仅从语音中获取重复的语音模式,在广播电视新闻与自然口语对话2个测试集上对比2个系统的性能。实验结果表明,基于识别的系统具有较好的检测效果,而基于特征的系统具备多语种的推广性。 展开更多
关键词 语音识别 语音模式发现 分段动态时间弯曲算法 图聚类算法 音素回环后验概率计算
下载PDF
一种特殊滑牙块打捞矛的研制与应用 被引量:3
8
作者 赵崇镇 秦世群 +3 位作者 胡长城 谢俊远 高涛 赵庆卫 《石油机械》 北大核心 2001年第4期40-41,0,共2页
针对复杂打捞中偏磨油管打捞时易变形、胀破或撕裂的难题 ,研制出特殊滑牙块打捞矛 ,打捞矛由上接头、矛杆、滑牙块、锁块、销钉、外筒等组成。打捞时在引鞋和导锥的作用下滑牙块能够顺利进入鱼腔并依靠自重下滑 ,沿导轨外伸直至其齿面... 针对复杂打捞中偏磨油管打捞时易变形、胀破或撕裂的难题 ,研制出特殊滑牙块打捞矛 ,打捞矛由上接头、矛杆、滑牙块、锁块、销钉、外筒等组成。打捞时在引鞋和导锥的作用下滑牙块能够顺利进入鱼腔并依靠自重下滑 ,沿导轨外伸直至其齿面与鱼腔内壁接触 ;随后上提钻柱 ,矛杆上的导轨斜面迫使滑牙块咬紧被打捞油管内壁 ,当油管严重偏磨使一对滑牙块卡在磨穿位置时 ,另一对能有效卡在未磨损部位 ,同时外筒限制了油管外胀变形。在双河油田 6- 40 8、T6- 1 35等 5口油井大修和复杂打捞的应用表明 ,这种滑牙块打捞矛能够有效打捞常规工具无法打捞的严重偏磨非接箍油管 ,操作方便 ,成功率高。 展开更多
关键词 油井 塔物打捞 打捞矛 滑牙块 油管偏磨 应用
下载PDF
广播新闻语音的关键词检测系统 被引量:1
9
作者 张鹏远 邵健 +1 位作者 赵庆卫 颜永红 《通信学报》 EI CSCD 北大核心 2007年第12期131-135,共5页
提出了一种两阶段的关键词检测策略,关键词表可即时配置、即时使用。与以往不同的是,解码是在整个声学空间上进行的,而不仅仅是关键词所构成的声学空间。首先,利用维特比解码得到最优候选的音素序列。然后,通过关键词列表,可以产生候选... 提出了一种两阶段的关键词检测策略,关键词表可即时配置、即时使用。与以往不同的是,解码是在整个声学空间上进行的,而不仅仅是关键词所构成的声学空间。首先,利用维特比解码得到最优候选的音素序列。然后,通过关键词列表,可以产生候选的关键词。最后,采用了基于声学模型的置信度与基于网格的置信度相结合的方法来降低虚警。实验证明,新的框架下关键词检测的性能得到了显著的提高。 展开更多
关键词 关键词检测 音节识别器 置信度计算
下载PDF
腭裂康复手术客观评价的研究--应用塞音检测的方法
10
作者 胡琦 赵庆卫 +1 位作者 马莲 颜永红 《声学学报》 EI CSCD 北大核心 2014年第6期757-763,共7页
针对腭裂患者易出现塞音弱化或消失的现象,提出了一种基于塞音段爆破能量检测的腭裂康复手术客观评价方法。该方法采用类听觉的滤波器组作为处理前端,并对处理后得到的信号在其各子带内分别计算塞音除阻过程中的能量变化率。对腭裂组和... 针对腭裂患者易出现塞音弱化或消失的现象,提出了一种基于塞音段爆破能量检测的腭裂康复手术客观评价方法。该方法采用类听觉的滤波器组作为处理前端,并对处理后得到的信号在其各子带内分别计算塞音除阻过程中的能量变化率。对腭裂组和术后对照组的平均子带能量变化率进行了比对,结果表明腭裂组在高频段(子带中心频率从209.8 Hz至8000 Hz)具有较小的除阻能量变化率。对不送气清塞音/d/、/b/进行了实验,Logistic回归表明提出的方法与主观判听一致性在音节/di/和/bu/上分别达到88.9%和90.27%。 展开更多
关键词 子带 滤波器组 客观评价方法 不送气 腭裂患者 腭裂语音 音段 清塞 腭咽闭合不全 共振峰频率
下载PDF
使用无监督网络MLLR自适应改进算法的语音识别
11
作者 潘复平 赵庆卫 颜永红 《数据采集与处理》 CSCD 北大核心 2007年第1期8-13,共6页
介绍了一种基于词网的最大似然线性回归(Lattice-MLLR)无监督自适应算法,并进行了改进。Lattice-MLLR是根据解码得到的词网估计MLLR变换参数,词网的潜在误识率远小于识别结果,因此可以使参数估计更为准确。Lattice-MLLR的一个很大缺点... 介绍了一种基于词网的最大似然线性回归(Lattice-MLLR)无监督自适应算法,并进行了改进。Lattice-MLLR是根据解码得到的词网估计MLLR变换参数,词网的潜在误识率远小于识别结果,因此可以使参数估计更为准确。Lattice-MLLR的一个很大缺点是计算量极大,较难实用,对此本文提出了两个改进技术:(1)利用后验概率压缩词网;(2)利用单词的时间信息限制状态统计量的计算范围。实验测定Lattice-MLLR的误识率比传统MLLR相对下降了3.5%,改进技术使Lattice-MLLR计算量下降幅度超过了87.9%。 展开更多
关键词 语音识别 无监督自适应 最大似然线性回归 词网 后验概率
下载PDF
用于电话语音识别系统的置信度估计方法的研究
12
作者 董滨 赵庆卫 颜永红 《声学技术》 CSCD 北大核心 2006年第5期473-477,共5页
提出了一种用于电话语音识别系统的置信度快速估计算法,此算法是在语音识别器帧同步束搜索的过程中基于状态图的同步估计算法,使用同识别器解码相同的声学模型进行置信度估计,此算法取得了比传统的两遍解码估计置信度算法更好的性能,而... 提出了一种用于电话语音识别系统的置信度快速估计算法,此算法是在语音识别器帧同步束搜索的过程中基于状态图的同步估计算法,使用同识别器解码相同的声学模型进行置信度估计,此算法取得了比传统的两遍解码估计置信度算法更好的性能,而且计算复杂度较低,运行速度快,解决了计算置信度时使用模型的区分度与计算速度之间的矛盾。 展开更多
关键词 置信度 电话语音识别 状态图
下载PDF
用于语音识别置信度的发音特征各维度分析和子集优化 被引量:2
13
作者 孙艳庆 张晴晴 +2 位作者 周瑜 赵庆卫 颜永红 《声学学报》 EI CSCD 北大核心 2011年第3期339-348,共10页
提出了基于发音特征单个维度的置信度算法,并基于此对发音特征的各个维度展开分析。分析不仅验证了融合的必要性,同时也展示了发音特征各维度之间以及和隐马尔可夫模型之间的大量冗余。为了去除冗余,提出了用子集选择的方法进行优化。... 提出了基于发音特征单个维度的置信度算法,并基于此对发音特征的各个维度展开分析。分析不仅验证了融合的必要性,同时也展示了发音特征各维度之间以及和隐马尔可夫模型之间的大量冗余。为了去除冗余,提出了用子集选择的方法进行优化。对比所有都用的情况,基于发音特征紧凑子集的语音识别置信度估计,在等错率上取得了12.7%的相对下降。把经过优化后的基于发音特征的语音识别置信度估计和基于隐马尔可夫模型的语音识别置信度进行融合,在保持集内识别率不损失的前提下,显著提高了语法外输入测试的拒识性能:在相同参数下,在开发集和测试集上分别取得了34%和35.3%的显著改善。 展开更多
关键词 置信度估计 语音识别 特征 发音 维度 优化 子集 隐马尔可夫模型
下载PDF
语音理解中的容错技术的研究 被引量:5
14
作者 张建平 王作英 +1 位作者 赵庆卫 陆大紟 《电子学报》 EI CAS CSCD 北大核心 2000年第3期84-86,56,共4页
本文研究了大词汇量非特定人汉语连续语音识别和理解系统中的容错技术 .首先 ,声学识别器产生N个最优 (N best)音节候选及其相应的声学层的概念 ,再由N个最优音节候选构成一个音节网格 (syllablelattice) .一个容错语言分析器被用来搜... 本文研究了大词汇量非特定人汉语连续语音识别和理解系统中的容错技术 .首先 ,声学识别器产生N个最优 (N best)音节候选及其相应的声学层的概念 ,再由N个最优音节候选构成一个音节网格 (syllablelattice) .一个容错语言分析器被用来搜索该音节网格并发现最优的汉字串 .由于考虑了额外的可能候选音节 ,该最优汉字串的某些字的音节可能不在原来的音节网格中 .这样 ,声学层的一些错误被纠正 ,语言分析器的稳健性 (robustness)得以提高 .实验表明容错分析器能将字的理解正确率从 91 83%提高到 94 1 5 % .与传统的无容错技术的基于三元文法模型的分析器相比 ,错误率下降了 2 8 4% . 展开更多
关键词 容错技术 语音理解 语言模型 语音识别
下载PDF
腭裂语音中齿龈塞音的声门代偿现象声学分析与判定 被引量:1
15
作者 肖彦 冯勇强 +3 位作者 赵庆卫 马莲 钱靖 颜永红 《声学学报》 EI CSCD 北大核心 2015年第2期285-293,共9页
对齿龈塞音在腭裂语音中的声门塞音代偿现象进行了声学分析,计算频谱分布的多阶统计量—谱矩,并将代偿塞音和正常塞音进行对比。结果显示声门塞音爆破段的第一阶谱矩即频谱质心的频率位置比正常塞音低,因为声门塞音的阻塞部位在声门,导... 对齿龈塞音在腭裂语音中的声门塞音代偿现象进行了声学分析,计算频谱分布的多阶统计量—谱矩,并将代偿塞音和正常塞音进行对比。结果显示声门塞音爆破段的第一阶谱矩即频谱质心的频率位置比正常塞音低,因为声门塞音的阻塞部位在声门,导致声道腔体偏长从而共振频率偏低。还观察到声门塞音的第二阶谱矩即标准偏差偏高,说明其谱能量分布比正常塞音更加分散。声门塞音的第三阶谱矩即偏度大多为正值,反映了声门塞音功率谱的非对称性且大头朝向低频区而长尾朝向高频区。采用逻辑回归模型进行样本分类,通过交叉验证选出最优的四阶谱矩作为模型自变量,分类正确率为89.7%。结合塞音爆破时刻自动检测,实现了音节/di/的声门塞音客观判定。 展开更多
关键词 腭裂语音 声学分析 分类正确率 能量分布 逻辑回归 偏度 模型选择 功率谱 非对称 代偿性发音
下载PDF
基于Java Speech API规范的语音识别引擎的实现 被引量:2
16
作者 倪素萍 董滨 +1 位作者 赵庆卫 颜永红 《微计算机应用》 2005年第2期168-172,共5页
本文介绍了Java Speech API(JSAPI)规范的语音识别引擎的系统框架,描述了采用已有的C/C++识别引擎实现JSAPI语音识别引擎的思路和实现策略,提出并分析了以事件处理和状态处理为核心来实现JSAPI规范的具体方法,完成了基于JSAPI规范的语... 本文介绍了Java Speech API(JSAPI)规范的语音识别引擎的系统框架,描述了采用已有的C/C++识别引擎实现JSAPI语音识别引擎的思路和实现策略,提出并分析了以事件处理和状态处理为核心来实现JSAPI规范的具体方法,完成了基于JSAPI规范的语音识别软件系统的实现。 展开更多
关键词 语音识别引擎 事件处理 JAVA SPEECH API规范
下载PDF
一种基于滑动窗口的语音端点检测算法 被引量:4
17
作者 余洪涌 赵庆卫 颜永红 《微计算机应用》 2006年第6期641-645,共5页
提出了一种基于滑动窗口的综合语音端点检测方法。从提高系统鲁棒性角度出发,利用各种综合的算法思想方法提高端点检测的准确性,鲁棒性和提高语音识别系统的总体识别率。利用频域能量、回声消除、DTMF滤除、利用信噪比确定多种阈值用于... 提出了一种基于滑动窗口的综合语音端点检测方法。从提高系统鲁棒性角度出发,利用各种综合的算法思想方法提高端点检测的准确性,鲁棒性和提高语音识别系统的总体识别率。利用频域能量、回声消除、DTMF滤除、利用信噪比确定多种阈值用于判定、利用语音波形特点进行粗调和精调等。试验表明该方法在语音端点检测的错误率和端点误差方面都显著减少了,系统鲁棒性得到明显提高。 展开更多
关键词 语音识别 语音端点检测 滑动窗口 回声消除
下载PDF
嵌入式语音识别中一种高效的图搜索算法
18
作者 黎塔 蔡尚 +2 位作者 赵庆卫 潘接林 颜永红 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第S1期215-218,共4页
为了满足超大词表语法的识别任务在嵌入式语音识别系统上的应用,提出了一种高效的双层图搜索算法.该算法通过分离声学层和词法层来构建2层图搜索空间,其中声学层记录声学模型相关信息,词法层记录词表语法信息.利用这样简洁的搜索空间可... 为了满足超大词表语法的识别任务在嵌入式语音识别系统上的应用,提出了一种高效的双层图搜索算法.该算法通过分离声学层和词法层来构建2层图搜索空间,其中声学层记录声学模型相关信息,词法层记录词表语法信息.利用这样简洁的搜索空间可以使语音识别的解码过程更加紧凑有效.在对比实验中,传统的基于前缀合并的状态树搜索算法的大词表嵌入式单词拼读系统作为基线系统.实验结果表明,与基线系统相比,所提出的双层图搜索算法在系统解码速度相对提高10%的情况下,系统的动态内存占用仅为基线的8%.通过使用所提出的双层图搜索算法,大大提高了大词表嵌入式单词拼读系统的效率,使其更适用于大多数嵌入式平台. 展开更多
关键词 嵌入式语音识别 双层图搜索 单词拼读系统
下载PDF
语音导航系统中的一种模糊检索算法 被引量:1
19
作者 孙艳庆 赵庆卫 颜永红 《微计算机应用》 2009年第12期38-45,共8页
基于车载的语音导航系统,尤其是针对大地名库中地名识别的任务需求。用LVCSR取代了较流行的基于语法的语音识别系统,以增强系统灵活性和处理能力。用一套模糊检索算法作为系统的后处理,提高地名识别的整句正确率。在普通的数万量级的地... 基于车载的语音导航系统,尤其是针对大地名库中地名识别的任务需求。用LVCSR取代了较流行的基于语法的语音识别系统,以增强系统灵活性和处理能力。用一套模糊检索算法作为系统的后处理,提高地名识别的整句正确率。在普通的数万量级的地名数据库中可以达到90%的地名识别正确率;即使增加到百万数量级,识别率也能保持在70%以上。目前支持中英文系统。 展开更多
关键词 语音地名导航 LVCSR 模糊检索
下载PDF
编码器-解码器模型合成汉英语码转换文本
20
作者 黄哲莹 刘作桢 +1 位作者 徐及 赵庆卫 《信号处理》 CSCD 北大核心 2022年第10期2074-2081,共8页
为了解决汉英语码转换文本数据稀缺的问题,本文提出了基于编码器-解码器模型合成语码转换文本的方法,从有限的语码转换文本与大量单语种平行语料中学习语码转换语言学规则与语种内部的语言学规则,来合成语码转换文本。但是该模型合成的... 为了解决汉英语码转换文本数据稀缺的问题,本文提出了基于编码器-解码器模型合成语码转换文本的方法,从有限的语码转换文本与大量单语种平行语料中学习语码转换语言学规则与语种内部的语言学规则,来合成语码转换文本。但是该模型合成的语码转换文本自然度低,因此本文又提出基于带复制机制的编码器-解码器模型合成语码转换文本的方法,在编码器-解码器的基础上,增加了一个门控,用来决定从编码器的预测结果还是从编码器的输入源文本中产生下一个词。最终,该方法使语言模型在SEAME测试集上的困惑度降低了绝对13.96。由此可得出结论,本文提出的方法可大规模地合成自然度高的语码转换文本,缓解语码转换文本数据的稀缺性。 展开更多
关键词 语码转换 编码器-解码器 合成文本 语言模型 语音识别
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部