-
题名基于深度学习的蒙古语AI合成主播
被引量:1
- 1
-
-
作者
宝音都古楞
飞龙
王炜华
张晖
董林坤
-
机构
内蒙古大学计算机学院
蒙古文智能信息处理技术国家地方联合工程研究中心
内蒙古自治区蒙古文信息处理技术重点实验室
-
出处
《中央民族大学学报(自然科学版)》
2023年第2期31-40,共10页
-
基金
内蒙古自治区科技计划项目(2021GG0158)。
-
文摘
目前,汉文AI合成主播已被运用于新闻内容生产和传播,为传统新闻媒体行业开辟了新的发展路径,但蒙古语AI合成主播技术的研究仍处于起步阶段。为了研发蒙古语AI合成主播系统,本文采用深度学习技术提出了基于嘴型分类的蒙古语AI合成主播模型。首先采用ObamaNet模型构建了蒙古语AI合成主播基线系统,因为基线系统的时间开销大,提出了基于嘴型分类的蒙古语AI合成主播模型,此方法使用9种嘴型标签代表所有的嘴型状态,将得到的语音特征同步到不同的嘴型,根据得到的嘴型选择候选帧,得到AI主播合成视频。文章构建了蒙古语AI合成主播视频语料库,并以此为基础进行了实验比较。结果表明,文中提出的模型可以生成自然度较好的蒙古语AI合成主播视频。
-
关键词
AI合成主播
蒙古语
多模态学习
嘴型同步
人脸重构
-
Keywords
AI composite anchor
mongolian
multimodal learning
lip sync
face reconstruction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-