-
题名基于视频三音子的汉语双模态语料库的建立
被引量:6
- 1
-
-
作者
赵晖
林成龙
唐朝京
-
机构
国防科技大学电子科学与工程学院
-
出处
《中文信息学报》
CSCD
北大核心
2009年第5期98-103,共6页
-
基金
"十一五"武器装备预研项目(51329060101)
-
文摘
为实现可视语音合成和双模态语音识别,需要建立符合条件的双模态语料库。该文提出了一种汉语双模态语料库的建立方法。根据视频中唇部发音特征,对已有的三音子模型聚类,形成视频三音子。在视频三音子的基础上,利用评估函数对原始语料中的句子打分,并实现语料的自动选取。与其他双模态语料库相比,该文所建立的语料库在覆盖率、覆盖效率和高频词分布律有了较大改进,能够更加真实反映汉语中的双模态语言现象。
-
关键词
计算机应用
中文信息处理
可视语音合成
双模态语料
视频三音子
评估函数
-
Keywords
computer application
Chinese information processing
visual speech synthesis
bimodal speech recognition
himodal corpus
visual triphone
evaluation function
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于视频三音子的双模态语料自动选取算法
被引量:2
- 2
-
-
作者
赵晖
林成龙
唐朝京
-
机构
国防科技大学电子科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第17期1-3,共3页
-
基金
国家部委预研基金资助项目
-
文摘
为实现可视语音合成,建立符合条件的双模态语料库,提出双模态语料自动选取算法。根据视频中唇部发音特征,对已有的三音子模型归类,形成视频三音子,在其基础上从原始语料中自动选取语料,利用评估函数对原始语料中的句子打分。与其他双模态语料库相比,该语料库在覆盖率等指标上有较大改进,为实现具有真实感的可视语音合成奠定基础。
-
关键词
可视语音合成
双模态语料
视频三音子
评估函数
-
Keywords
visual speech synthesis
bimodal corpus
visual triphone
evaluation function
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-