-
题名基于决策树的藏语拉萨话三音子模型
被引量:4
- 1
-
-
作者
李冠宇
于洪志
李永宏
马宁
-
机构
西北民族大学中国民族语言文字教育部重点实验室
-
出处
《计算机工程与科学》
CSCD
北大核心
2013年第9期146-150,共5页
-
基金
国家自然科学基金资助项目(61262054)
西北民族大学中央高校基本科研业务费专项资金项目(zyz2011100)
-
文摘
对藏语拉萨话中单音子及三音子分布情况进行了统计,分析了在藏语大词表连续词表连续语音识别中建立上下文相关声学模型的必要性。选择音素为建模单元,根据藏语特点,建立以音节为单位的发音字典。讨论了利用决策树建立三音子模型的几个关键问题和基本算法,结合国际音标分类和经验知识,确定了38个藏语拉萨话音子类别集及相应的决策树问题集。建立了共20个发音人8 170句的训练语料,在HTK平台上建立和训练得到了基于决策树的藏语拉萨话三音子模型,并分析了不同隐马尔可夫模型状态数及高斯混合度下的识别结果,确定了一套藏语大词表连续语音识别的完整方案。
-
关键词
藏语
拉萨话
大词表连续语音识别
隐马尔可夫模型
三音子模型
-
Keywords
Tibetan
Lhasa dialect ~ LVCSR ~ HMM ~ triphone model
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名一种语料缺乏条件下的藏语音素自动切分方法
被引量:2
- 2
-
-
作者
李冠宇
于洪志
吴志强
-
机构
西北民族大学中国民族语言文字教育部重点实验室
-
出处
《计算机工程与科学》
CSCD
北大核心
2014年第10期2009-2013,共5页
-
基金
国家自然科学基金资助项目(61262054)
-
文摘
藏语语音合成及语音学研究中,经常需要切分音素。人工切分费时费力,但是由于藏语语料缺乏,训练的藏语声学模型不够精确和鲁棒,自动切分的音素边界不够准确。以藏语拉萨方言为研究对象,在确定拉萨方言音素集、建立拉萨方言发音词典的基础上,通过计算音素模型间的距离,确定了拉萨方言和英语的共同音素,融合拉萨方言和英语GMM-HMM模型,并自动判断语音中的静音和短时停顿,构造语音对应的词网络,查询发音词典,将词网络扩展为模型(音素)网络,使用Viterbi算法将每一帧特征参数对应到模型的每一个状态上,进而对音素进行切分。实验表明,切分效果要优于单纯的藏语模型方法。
-
关键词
藏语
拉萨方言
自动音素切分
维特比算法
隐马尔可夫模型
-
Keywords
Tibetan
Lhasa dialect
automatic phoneme segmentation
Viterbi
HMM
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名临夏州中心地区方言与普通话的比较研究
被引量:1
- 3
-
-
作者
高璐
李应兴
于洪志
-
机构
西北民族大学中国民族语言文字教育部重点实验室
-
出处
《西北民族大学学报(哲学社会科学版)》
北大核心
2008年第5期121-125,共5页
-
基金
研究生创新基金项目(YCX07039)
-
文摘
研究临夏方言中心地区与汉语普通话在声母、韵母、声调方面的差别,对临夏当地人的发音进行录音,通过语音分析软件praat对录音进行语谱分析。由软件分析得到宽带、窄带语谱图,音高曲线图等,从而对声韵母以及声调进行分析研究。
-
关键词
临夏方言
声母
韵母
声调
比较研究
-
Keywords
Linxia dialect
initial consonant
vowel
tone
comparative study
-
分类号
H172.2
[语言文字—汉语]
-
-
题名基于Web页面的藏文在线输入技术
被引量:1
- 4
-
-
作者
于洪志
何向真
-
机构
西北民族大学中国民族语言文字教育部重点实验室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第18期260-262,265,共4页
-
基金
国家"863"计划基金资助项目(2003AA115530)
国家社会科学基金资助项目(02BYY038)
教育部科研基金资助重点项目(105172)
-
文摘
Web页面藏文在线输入技术,能够在浏览器中脱离本机输入法而进行藏文输入,实现藏文网络在线文字交互,为网络系统提供了跨平台的藏文输入解决方案。阐述了基于Web页面藏文在线输入技术的工作原理及基本设计思想,介绍藏文在线输入法的组成、内码外码设计原则和输入法流程,对藏文输入法进行系统分析,给出实现模型,论述浏览器内嵌藏文字体信息技术,达到在线、即时的藏文输入。采用内嵌法和外挂法,实现藏文在线输入技术与主流网页编辑器的整合。
-
关键词
WEB页面
藏文
在线输入
字体嵌入
-
Keywords
Web page
Tibetan
online input
font embedded
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-