衡阳方言孤立词识别研究

Isolated Word Recognition of Hengyang Dialect

下载PDF

导出

摘要目前,汉语识别已经取得了一定的研究成果.但由于中国的地域性差异,十里不同音,使得汉语识别系统在进行方言识别时识别率低、性能差.针对语音识别系统在对方言进行识别时的缺陷,构建了基于HTK的衡阳方言孤立词识别系统.该系统使用HTK3.4.1工具箱,以音素为基本识别单元,提取39维梅尔频率倒谱系数(MFCC)语音特征参数,构建隐马尔可夫模型(HMM),采用Viterbi算法进行模型训练和匹配,实现了衡阳方言孤立词语音识别.通过对比实验,比较了在不同因素模型下和不同高斯混合数下系统的性能.实验结果表明,将39维MFCC和5个高斯混合数与HMM模型结合实验时,系统的性能得到很大的改善. At present, Chinese speech recognition has made some achievements. However, due to regional differences in China, different place has different dialect, the Chinese recognition system has low recognition rate and poor performance in the dialect recognition. In order to solve the shortcomings of speech recognition system in dialect recognition, an isolated word recognition system of Hengyang dialect based on HTK is proposed. This method constructs the Hidden Markov Models （HMM）, using phoneme as the basic recognition unit and using the HTK3.4.1 toolbox to extract the speech feature parameters of 39-dimensional Mel frequency cepstral coefficients （MFCC）. Viterbi algorithm is used to train and match the model to achieve the isolated word speech recognition system of Hengyang dialect. The system＇s performances are compared under the different phoneme models and different Gaussian mixture numbers. The experimental results show that the system performance can be greatly improved by combining the 39-dimensional MFCC with 5 Gauss mixed numbers and HMM model.

作者李荣华赵征鹏

机构地区云南大学信息学院

出处《计算机系统应用》 2017年第5期247-252,共6页 Computer Systems & Applications

关键词 HTK 隐马尔可夫模型衡阳方言梅尔频率倒谱系数 VITERBI算法 Hidden Markov Model Toolkit（HTK） Hidden Markov ModeI（HMM） Hengyang dialect Mel FrequencyCepstral Coefficients （MFCC） Viterbi algorithm

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献6

1李余芳,苏洁,胡文君,潘文林.基于HTK的普米语孤立词的语音识别[J].云南民族大学学报（自然科学版）,2015,24(5):426-430. 被引量：11
2孙一鸣,刘葳.基于HTK的日语连续语音识别系统的建立与研究[J].计算机光盘软件与应用,2013,16(16):192-193. 被引量：1
3孙爱中,刘冰,张琬珍,栾前进.基于DSP的语音识别系统研究与实现[J].现代电子技术,2013,36(9):76-78. 被引量：4
4曾妮,费洪晓,姜振飞.基于HTK的特定词语音识别系统[J].计算机系统应用,2011,20(3):157-160. 被引量：3
5王爱芸.语音识别技术在智能家居中的应用[J].软件,2015,36(7):104-107. 被引量：20
6魏巍,张海涛.一种基于HTK的数字语音识别系统[J].计算机系统应用,2011,20(9):17-21. 被引量：6

二级参考文献23

1陆绍尊.普米语概况[J].民族语文,1980(4):58-73. 被引量：5
2孙宁,孙劲光,孙宇.基于神经网络的语音识别技术研究[J].计算机与数字工程,2006,34(3):58-61. 被引量：9
3石现峰,张学智,张峰.基于HTK的语音识别系统设计[J].计算机技术与发展,2006,16(10):37-38. 被引量：23
4王欣,罗代升,王正勇.基于改进谱减算法的语音增强研究[J].成都信息工程学院学报,2007,22(2):201-204. 被引量：12
5Young S, Evermann G, Gales M.The HTK Book. Cambridge UniversityEngineering Department. Version 3.1, 2001.40- 120.
6牛景涛.基于DSP实现的数字信号处理技术研究[D].西安:西北工业大学,2006.
7张雄伟.现代语音处理技术及应用[M]北京:机械工业出版社,2003.
8赵力.语音信号处理[M]北京:机械工业出版社,2003.
9I.Katunobu,Y.Mikio,T.Kazuya,M.Tatsuo,K.Tetsunori,S.Kiyohiro,and I.Shuichi. JNAS:Japanese speechcorpus for largevocabulary continuousspeechre cognitionre search[J].Journal of the Acoustical Society of Japan(E),1999,(03):119-206.
10宗成庆.统计自然语言处理[M].2版.北京:清华大学出版社,2007.

共引文献37

1徐正雄,雷姣惠,李思琳,肖文博.基于时间序列的小样本流行病例分级[J].办公自动化,2021,26(5):50-52.
2张令通.基于HTK的白族语音识别方法[J].大理学院学报（综合版）,2013,12(10):27-32. 被引量：6
3拉龙东智,欧珠.藏语语音拨号系统研究[J].西藏科技,2014(12):74-77.
4朱俊,聂龙生,徐云,罗准辰.航天三维可视化系统中语音控制技术的研究与应用[J].现代电子技术,2015,38(8):151-153. 被引量：3
5施艳艳,于文英,杨凌霄,刘幸娜,周飞.空调的非特定语音辨识与控制[J].河南师范大学学报（自然科学版）,2015,43(2):51-55. 被引量：2
6李余芳,苏洁,胡文君,潘文林.基于HTK的普米语孤立词的语音识别[J].云南民族大学学报（自然科学版）,2015,24(5):426-430. 被引量：11
7赵尔平,王聪华,党红恩,雒伟群.藏语孤立词语音识别技术研究[J].西北师范大学学报（自然科学版）,2015,51(5):50-54. 被引量：6
8郭琳,苏洁,李余芳,刘敬凤,胡文君,潘文林.一种人机交互语音切分系统[J].云南民族大学学报（自然科学版）,2016,25(1):87-91. 被引量：4
9黄成龙.2015年羌语支语言研究前沿[J].阿坝师范学院学报,2016,33(1):5-9. 被引量：2
10陈洁.背景音乐自动分离系统设计与实现[J].现代电子技术,2017,40(5):134-138. 被引量：2

1沈泉波,韩慧莲.基于HMM的语音识别系统的Matlab仿真[J].电声技术,2012,36(10):56-57. 被引量：3
2李冠宇.隐马尔可夫模型及其在语音识别中的应用[J].科技风,2011(23):89-90.
3程隆信.3／4卷积码Viterbi译码器的实现及其特性[J].电信技术研究,1992(3):1-7.
4张资宸,黄雅,方丹菲,朱熠琛,陈佳泉.基于android系统开发的老人手机方言识别的性能设计[J].生物技术世界,2013,10(6):154-154.
5谢锦辉,黄载禄,万发贯.构造HMM观察值概密函数的一种方法[J].华中理工大学学报,1992,20(1):47-51.
6徐士林,樊懋.基于音节的HMM汉语语音识别[J].模式识别与人工智能,1991,4(2):46-52. 被引量：2
7周晓迈,王育民.Viterbi算法、RS码编译码算法及其应用[J].电信科学,1991,7(5):51-56. 被引量：1
8程庆祥.音素法语音电路简介[J].家用电器科技,1990(1):23-25.
9李光霁,程延.为有线电视运行和维修建造一个工具箱[J].有线电视技术,2000,7(1):83-86.
10李苇营,易克初,胡征.神经网络与HMM构成的混合网络在语音识别中应用的研究[J].电子学报,1994,22(10):73-80. 被引量：8

计算机系统应用

2017年第5期

浏览历史

内容加载中请稍等...

衡阳方言孤立词识别研究

参考文献6

二级参考文献23

共引文献37

相关作者

相关机构

相关主题

浏览历史