期刊文献+

面向藏语声纹识别的语料库建设 被引量:8

Corpus construction for Tibetan voiceprint recognition
下载PDF
导出
摘要 藏语声纹识别技术的研究刚刚起步,建设一个用于藏语声纹识别的语料库迫在眉睫。结合藏语特点,设计、建立了一个面向藏语声纹识别的语料库。语料库包含文本相关、文本无关两部分,文本语料来自新闻报刊、文学类、教育类、科技类、佛学类、历史类和传统文化五明类等文献资料,录音者由来自多个不同藏语方言地区的50人组成,产生了语音语料9 500条,为藏语的声纹识别研究奠定了一定的基础。 Research on Tibetan voiceprint recognition technology has just started, and it is an urgent and necessary task to establish a corpus. We design and build a corpus based on the characteristics of Ti betan language, which consists of two parts.- text dependent part and text independent part. Texts of the corpus are collected from a variety of materials , including newspaper, literature, education, science and technology, Buddhism, and history and traditional culture. As for the recording part, we invite 50 speakers ftom different regions of Tibet. The corpus contains 9500 speech files and it lays a certain foun dation for Tibetan voiceprint recognition.
作者 周雁 西绕多吉 ZHOU Yan;Shereb Dorje(Research Center of Tibetan Information Technology,Tibet University,Lhasa 850000,China)
出处 《计算机工程与科学》 CSCD 北大核心 2018年第11期2080-2084,共5页 Computer Engineering & Science
基金 西藏自治区自然科学基金(2015ZR-14-5) 国家自然科学基金(61165010)
关键词 藏语 声纹识别 语料库 Tibetan voiceprint recognition corpus
  • 相关文献

参考文献4

二级参考文献31

共引文献33

同被引文献91

引证文献8

二级引证文献19

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部