-
题名基于语音配列的汉语方言自动辨识
被引量:19
- 1
-
-
作者
顾明亮
沈兆勇
-
机构
徐州师范大学物理系
徐州师范大学语言研究所
-
出处
《中文信息学报》
CSCD
北大核心
2006年第5期77-82,共6页
-
基金
江苏省"十五"社科基金资助项目(K3-013)
江苏省高校自然科学基金资助项目(99KJB510002)
-
文摘
本文首先讨论了汉语方言辨识的依据及特征选取的基本原则,并由此导出了区间差分倒谱特征。然后利用GMM符号发生器和N元语言模型及ANN建立了一个方言辨识系统,该系统与传统的语种识别系统相比,具有以下特点:第一,系统不需要标注好的语音库,从而降低了汉语方言语音库建设的劳动强度和要求;第二,GMM符号化器计算量远远低于音素辨识器,从而提高了方言辨识速度,便于今后实时处理。第三,具有更高的辨识效果和更好的容错性。汉语普通话和三种方言辨识实验结果表明,系统平均辨识率可以达到83.8%。
-
关键词
计算机应用
中文信息处理
gmm符号化器
N元语言模型
汉语方言辨识
-
Keywords
computer application
Chinese information processing
gmm tokenizer
n-gram language modeling
Chinese dialects identification
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名一种新的汉语方言辨识特征
- 2
-
-
作者
顾明亮
-
机构
徐州师范大学物理与电子工程学院
-
出处
《广西科学》
CAS
2007年第4期423-425,共3页
-
基金
江苏省"十五"社科基金项目(K3-013)
江苏省高校自然科学基金项目(99KJB510002)资助
-
文摘
将声学特征与韵律特征相结合,提出一种新的混合区间特征,并将该特征和常见的美尔倒谱系数(MFCC)特征与线性预测倒谱系数(LPCC)特征进行对比,通过符号化语言辨识方法对北方方言、吴方言、粤方言和闽方言进行辨识,以验证混合区间特征的有效性。结果表明,混合区间特征比MFCC特征和LPCC特征具有更好的方言辨识效果,对4种汉语方言15s语音片段的方言辨识率可以达到92%。4种方言中,混合区间特征对闽方言和粤方言的识别率最高,分别达到了96%和95%。
-
关键词
语音辨识
汉语方言
韵律特征
声学特征
gmm符号化器
-
Keywords
identification,Chinese dialects, prosodic features, acoustic feature,gmm tokenizer
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-