一种用于方言口音语音识别的字典自适应技术被引量：5

Pronunciation Dictionary Adaptation Based Accent Modeling for Large Vocabulary Continuous Speech Recognition

下载PDF

导出

摘要基于标准普通话的语音识别系统在识别带有方言口音的普通话时,识别率会下降很多。针对这一问题,论文介绍了一种“字典自适应技术”。文中首先提出了一种自动标注算法,然后以此为基础,通过分析语音数据,统计出带有方言口音普通话的发音规律,然后把这个规律编码到标准普通话字典里,构造出体现这种方言发音特征的新字典,最后把新字典整合于搜索框架,用于识别带有该方言口音的普通话,使识别率得到显著提高。 It is well known that speaker variability caused by accent is an important factor in speech recognition，Aiming at this problem,a technique of modeling accent-specific pronunciation variations through pronunciation diction aryadaptation is presented.The paper firstly introduces a method of retranscribing at the phone level some accent specific data.The preferred transcription for each word is then compared to its dictionary entry and a list of phone replacement rules is generated.Using these rules to expand the canonical pronunciation dictionary,makes it be able to reflect the accent-specific pronunciation variations.At last,the new dictionary is integrated into the recognition framework to have its performance improved。

作者潘复平赵庆卫颜永红

机构地区中国科学院声学所中科信利语音实验室

出处《计算机工程与应用》 CSCD 北大核心 2005年第23期4-6,9,共4页 Computer Engineering and Applications

基金国家973重点基础研究发展计划中科院百人计划资助

关键词字典自适应方言识别自动标注音节搜索路径 pronunciation dictionary adaptation, accent recognition, auto-transcription, phone, search path

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1J J Humphriesy,P C Woodland,D Pearcez. Using Accent-Specific Pronunciation Modeling for Robust Speech Recognition[C].In:Proe ICSLP-96,2324-2327.
2C J Leggetter,P C Woodland.Maximum Likelihood Linear Regression for Speaker Adaptation of Continuous Density Hidden Markov Models[J].Computer Speech and Language, 1995 ;9(2) : 171-185.
3Huang C,Chang E,Chen T.Aeeent Issues in Large Vocabulary Continuous Speeeh Recognitior[M].Microsoft Research China Technical Report,MSR- TR-2001-69,2001.
4W Byrne,M Finke,S Khudanpur et al.Pronunciation Modelling Using A Hand-Labelled Corpus for Conversational Speech Recognition[C]. In:Proc of ICASSP 1998, Seattle, USA, 1998:313-316.
5X Wu,Y Yan.Speaker Adaptation Using Constrained Transformation[J].IEEE Trans on Speech and Audio Processing,2004;12(2).

同被引文献49

1谢波,陈岭,陈根才,陈纯.普通话语音情感识别的特征选择技术[J].浙江大学学报（工学版）,2007,41(11):1816-1822. 被引量：13
2林世毅,苏广川,陈东,韩晓广.基于小波变换和数学形态学的边缘检测法[J].仪器仪表学报,2004,25(z1):685-687. 被引量：24
3贾珈,蔡莲红,李明,张帅.汉语普通话与沈阳方言转换的研究[J].清华大学学报（自然科学版）,2009(S1):1309-1315. 被引量：7
4杨晖,张继武.数学形态学在图像边缘检测中的应用研究[J].辽宁大学学报（自然科学版）,2005,32(1):50-53. 被引量：47
5付永庆,王咏胜.一种基于数学形态学的灰度图像边缘检测算法[J].哈尔滨工程大学学报,2005,26(5):685-687. 被引量：55
6顾明亮,沈兆勇.基于语音配列的汉语方言自动辨识[J].中文信息学报,2006,20(5):77-82. 被引量：19
7刘静萍,姜占财,德熙嘉措.语音信号的预处理技术探讨[J].甘肃联合大学学报（自然科学版）,2006,20(5):61-64. 被引量：5
8沈兆勇,顾明亮,杨亦鸣.基于GMM符号化和置信判别的汉语方言自动辨识研究[J].计算机科学,2006,33(11):210-211. 被引量：3
9顾明亮,马勇.基于高斯混合模型的汉语方言辨识系统[J].计算机工程与应用,2007,43(3):204-206. 被引量：9
10许慧燕,钱盛友.湖南方言声频特性的计算机分析[J].电声技术,2007,31(4):56-58. 被引量：2

引证文献5

1李兵虎,黄浩.新疆非母语汉语语音识别中的字典自适应技术[J].计算机工程与应用,2011,47(21):141-144.
2杨雅婷,马博,王磊,吐尔洪.吾司曼,李晓.维吾尔语语音识别中发音变异现象[J].清华大学学报（自然科学版）,2011,51(9):1230-1233. 被引量：5
3胡扬,年晓红.一种汉语方言编码与转换机制的研究[J].计算机应用研究,2013,30(1):206-210.
4舒彬.基于小波变换的边缘检测算法研究[J].自动化与仪器仪表,2016(8):163-164. 被引量：2
5余本国,郇晋侠,刘晓峰,高伟涛.语音识别系统在山西方言中的实现与应用[J].计算机与数字工程,2021,49(10):2168-2173. 被引量：1

二级引证文献8

1哈妮克孜.伊拉洪,那斯尔江.吐尔逊,阿迪力.买买提.维吾尔族汉语发音与标准音的声学区别[J].计算机工程,2013,39(5):280-283. 被引量：1
2艾斯卡尔·肉孜,殷实,张之勇,王东,艾斯卡尔·艾木都拉,郑方.THUYG-20：免费的维吾尔语语音数据库[J].清华大学学报（自然科学版）,2017,57(2):182-187. 被引量：13
3亚尔肯.阿吉,许辉,木合塔尔.霍加,闫广鹏,努尔麦麦提.尤鲁瓦斯.腭裂术后腭咽闭合不全患儿维吾尔语辅音/z/与汉语辅音/z/的声学参数比较[J].中国医学创新,2017,14(7):1-4.
4徐健,热依曼.吐尔逊,吾守尔.斯拉木.在线多语种语音语料库平台的研究与实现[J].信息通信,2018,31(4):150-153. 被引量：3
5支珊,赵文珍,赵文辉,段振云,孙禾.基于齿轮局部图像的齿距机器视觉测量方法[J].仪器仪表学报,2018,39(2):225-231. 被引量：26
6董海青,林宝军,刘迎春.一种有效抑制运动目标周围“空洞”的算法[J].电子设计工程,2018,26(18):25-29. 被引量：3
7孙杰,吾守尔.斯拉木,热依曼.吐尔逊.基于CMN网络的低资源柯尔克孜语识别研究[J].现代电子技术,2018,41(24):132-136. 被引量：3
8王志,张琪.基于Python的方言翻译系统设计[J].无线互联科技,2023,20(12):9-12.

1景亚鹏,郑骏,胡文心.基于深层神经网络(DNN)的汉语方言种属语音识别[J].华东师范大学学报（自然科学版）,2014(1):60-67. 被引量：6
2刘焯杰,林武佳,刘丽婷,萧雯琳,陈盛东,刘凯洁.基于移动终端的智能机器人的设计与实现[J].科技经济导刊,2015(16):43-44.
3王岐学,钱盛友,赵新民.基于差分特征和高斯混合模型的湖南方言识别[J].计算机工程与应用,2009,45(35):129-131. 被引量：4
4康佳伦,唐向宏,张东,屠雅丽.特征分类学习的结构稀疏传播图像修复方法[J].计算机辅助设计与图形学学报,2015,27(5):864-872. 被引量：8
5石佳影,黄威.基于深度神经网络的四川方言识别[J].现代计算机,2016,22(9):3-6. 被引量：4
6汤斌,王吉华,庞双双.改进的三维模型语义自动标注算法[J].山东师范大学学报（自然科学版）,2015,30(4):50-54.
7王烨,屈丹,李弼程,刘崧.基于子空间映射和得分规整的GSV-SVM方言识别[J].计算机工程与设计,2013,34(1):278-282. 被引量：1
8胡涛,吴涛,李焱.一种基于场景识别的快速语义标注方法[J].华中科技大学学报（自然科学版）,2013,41(S1):103-107. 被引量：1
9何艳,于凤芹.基于PCA和LDA的方言辨识[J].计算机系统应用,2012,21(5):169-171.
10杨阳,张文生.基于深度学习的图像自动标注算法[J].数据采集与处理,2015,30(1):88-98. 被引量：26

计算机工程与应用

2005年第23期

浏览历史

内容加载中请稍等...

一种用于方言口音语音识别的字典自适应技术被引量：5

参考文献5

同被引文献49

引证文献5

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

一种用于方言口音语音识别的字典自适应技术 被引量：5

参考文献5

同被引文献49

引证文献5

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

一种用于方言口音语音识别的字典自适应技术被引量：5