期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
面向域外说话人适应场景的多层级解耦个性化语音合成
1
作者 高盛祥 杨元樟 +3 位作者 王琳钦 莫尚斌 余正涛 董凌 《广西师范大学学报(自然科学版)》 CAS 北大核心 2024年第4期11-21,共11页
个性化语音合成任务旨在合成特定说话人音色的语音。传统方法在合成域外说话人语音时,与真实语音存在明显音色差异,解耦说话人特征仍较为困难。本文提出面向训练时未出现的域外说话人适应场景下的多层级解耦个性化语音合成方法,通过不... 个性化语音合成任务旨在合成特定说话人音色的语音。传统方法在合成域外说话人语音时,与真实语音存在明显音色差异,解耦说话人特征仍较为困难。本文提出面向训练时未出现的域外说话人适应场景下的多层级解耦个性化语音合成方法,通过不同粒度特征融合,有效提升零资源条件下域外说话人语音合成性能。本文方法采用快速傅里叶卷积提取说话人全局特征,以提高模型对域外说话人的泛化能力,实现句子粒度的说话人解耦;借助语音识别模型解耦音素粒度说话人特征,并通过注意力机制捕捉音素级音色特征,实现音素粒度的说话人解耦。实验结果表明:在公开数据集AISHELL3上,本文方法对域外说话人在客观评价指标说话人特征向量余弦相似度上达到0.697,相比基线模型提高6.25%,有效提升对域外说话人音色特征建模能力。 展开更多
关键词 语音合成 零资源 说话人表征 域外说话人 特征解耦
下载PDF
基于BiLSTM的低资源老挝语文本正则化任务
2
作者 王剑 姜林 +3 位作者 王琳钦 余正涛 张松 高盛祥 《计算机工程与科学》 CSCD 北大核心 2023年第7期1292-1299,共8页
文本正则化TN是语音合成文本前端分析任务中必不可少的工作,老挝语的文本正则化是将老挝语文本中不可读的词NSW转化为可以口头表达的词SFW。目前文本正则化任务尚未在老挝语中开展,主要面临训练数据难获取、部分不可读词存在歧义的问题... 文本正则化TN是语音合成文本前端分析任务中必不可少的工作,老挝语的文本正则化是将老挝语文本中不可读的词NSW转化为可以口头表达的词SFW。目前文本正则化任务尚未在老挝语中开展,主要面临训练数据难获取、部分不可读词存在歧义的问题。针对以上问题,构建了老挝语文本正则化任务的语料,并将老挝语文本正则化任务当作序列标注任务,使用神经网络结合上下文语境预测存在歧义的不可读的老挝语文本,增加自注意力机制加深序列字符间的关系,探究了不同策略引入预训练语言模型的效果,融合各自注意力机制的BiLSTM模型在测试集上达到67.59%的准确率。 展开更多
关键词 老挝语 文本正则化 神经网络 自注意力机制
下载PDF
纤维编织复合材料几何结构的生成
3
作者 王琳钦 伯彭波 谭军波 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2022年第9期1451-1459,共9页
为了对编织机的运动进行验证以及对复合编织材料的性能进行预测,提出编织机运动仿真和纱线编织结构几何模型的生成方法.面向传统的五月柱编织机的运动仿真,提出一种紧密的纱线编织结构的几何建模方法.该方法借助编织基本单元的空间状态... 为了对编织机的运动进行验证以及对复合编织材料的性能进行预测,提出编织机运动仿真和纱线编织结构几何模型的生成方法.面向传统的五月柱编织机的运动仿真,提出一种紧密的纱线编织结构的几何建模方法.该方法借助编织基本单元的空间状态和平面展开状态的几何对应关系得到芯模表面的编织方向场,基于该方向场得到纱线的轨迹;为了改善五月柱编织机携纱率低的问题,面向双层六边形编织机的运动仿真提出具有正确的内外关系的纱线编织结构生成方法,其中交替执行割角操作和删点操作,产生纱线拉紧的效果,同时借助虚拟纱线实现纱线和芯模的碰撞检测.基于纱线的驻留比、孔隙率和平均交织比等评估策略,对多种形状芯模的编织仿真实验结果表明,所提方法是有效和鲁棒的. 展开更多
关键词 纤维编织复合材料 编织机运动仿真 六边形编织 环形编织 编织结构建模
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部