基于语音知识的音节切分被引量：4

Syllable Segmentation Based on Chinese Speech Knowledge

下载PDF

导出

摘要在充分利用普通话水平测试试卷的文本信息、同一人的声母时长在常规语速下基本稳定、同一人的声母之间以及韵母之间的相对时长基本保持比例关系等先验知识的基础上,使用经小波变换后再重构的3个语音信号分量的累计能量特征为参数,提出了利用话者语音统计信息的两级音节切分算法,使音节切分精度达98.3%以上。 Many kinds of knowledge have been applied in this paper to separate the syllables,such as the prior information from the standard text of speech in Mandarin proficiency test,from the duration of initial in Mandarin speech which is stable in the normal speed speech,from the proportions of initials＇ durations in related to the finals＇ durations in one＇s speech and so on.A two-level syllable segmentation algorithm is proposed by using accumulating energies of the three wavelets which are re-constructured from wavelet transform.The experimental results demonstrat that the accuracy of syllable separation reaches to 98.3% at least.

作者汤霖黄建中尹俊勋

机构地区江门职业技术学院电子与信息技术系华南理工大学电子与信息学院

出处《中文信息学报》 CSCD 北大核心 2010年第4期91-95,共5页 Journal of Chinese Information Processing

基金江门市科技三项资金资助

关键词计算机应用中文信息处理音节切分语音信号处理普通话水平测试 computer application Chinese information processing syllable segmentation speech signal processing Mandarin proficiency test

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献21

1张红,黄泰翼,李治.基于半波差分谱的语音信号音节切分[J].声学学报,2000,25(4):323-328. 被引量：2
2王帆,郑方,吴文虎.基于多尺度分形维数的汉语语音声韵切分[J].清华大学学报（自然科学版）,2002,42(1):68-71. 被引量：14
3王卓,苏牧,李鹏,徐波.噪音环境下基于高阶谱的端点检测算法[J].中文信息学报,2004,18(5):70-77. 被引量：3
4张继勇,sp.cs.tsinghua.edu.cn,郑方,sp.cs.tsinghua.edu.cn,杜术,sp.cs.tsinghua.edu.cn,宋战江,sp.cs.tsinghua.edu.cn,徐明星,sp.cs.tsinghua.edu.cn.连续汉语语音识别中基于归并的音节切分自动机[J].软件学报,1999,10(11):1212-1215. 被引量：10
5张文军,谢剑英,李聪.基于贝叶斯方法的鲁棒语音切分[J].数据采集与处理,2002,17(3):260-264. 被引量：2
6齐峰岩,鲍长春.一种基于支持向量机的含噪语音的清/浊/静音分类的新方法[J].电子学报,2006,34(4):605-611. 被引量：12
7Wilpon J. G. ; Juang B. H. ; Rabiner L. R. An inves tigation on the use of acoustic sub-word units for auto matic speech recognition [C]//Proc. of IEEE Inter nat. Conf. on Acoustic, Speech, and Signal Process ing. 1987:821-824.
8Van Hernert J. P. Automatic segmentation of speech[J]. IEEE Trans. Signal Process, 1991, 39(4): 1008- 1012.
9Greenberg S. Speaking in short hand: asyllable-centric perspective for under standing pronunciation variation [J]. Speech Communication, 1999, 29(2) :159-176.
10Prasad V. K. ; Nagarajan T. ; Murthy H. A. Automatic segmentation of continuous speech using mini mum phase group delay functions[J].Speech Corn munication, 2004, 42(3-4) :429.

二级参考文献66

1刘宇红,刘桥,任强.基于改进的模糊ART的语音信号端点检测与切分[J].系统工程与电子技术,2004,26(8):1151-1154. 被引量：6
2张红.基于听觉感知机理的语音特征研究.博士学位论文[M].西南交通大学电气工程学院,1998..
3郑方吴文虎等.CDCPM及其在语音识别中的应用[J].软件学报,1996,7(10):69-75.
4郑方王承发等.一个语文转换文本编辑器的实现.第5届全国人机语音通讯学术会议（NCMMSC'98）会议论文集[M].哈尔滨:哈尔滨工业大学出版社,1998.280-285.
5Carpenter, GA Grossberg, S Rosen. DB Fuzzy ART: Fast Stable Learnin and Categoriation of Analog Patterns by an Adaptive Resonance System[J]. Neural Networks, 1991, 4: 759-771.
6Carpenter, GA grossberg, S Rosen. DB Fuzzy ART: an Adaptive Resonance Algorithm for Rapid, Stable Classi-Fication of Analog Patterns [A]. In Proc. Int. Joint conf. Neural Networks[C].1991. 411 - 420.
7Normandin Y. High-Performance Connected Digit Recongnition Using Maximum Mutual Information Estimation [ J ]. IEEE Trans.Speech and Audio Processing, 1994, 2(2): 299-311.
8Davis S B, Mermelstein P. Comparison of Parametric Representations for Monosyllabic Word Recognition in Continuously Spoken Sentences[J]. IEEE Trans. on ASSP, 1980, 28(4): 357 - 366.
9[1]R. Bakis et al., Transcription of broadcast news shows with the IBM large vocabulary speech recognition system, proceedings of the Speech Recognition Workshop, 1997,67-72,1997
10[2]F. Kubala et al. The 1996 BBN Byblos Hub-4 transcription system, Proceedings of the Speech Recognition Workshop, 1997,90-93

共引文献134

1吴治国,刘玉宇,王作英.基于段长分布的HMM的资源受限语音识别系统[J].计算机应用,2003,23(z2):316-318.
2何致远,胡起秀,徐光祜.说话人识别中语音切分算法的研究[J].计算机科学,2002,29(z1):140-143.
3范金武.汉语辅音实验研究述评[J].文教资料,2007(34):203-205.
4冉启斌,石锋.普通话单音节中爆发音的VOT分析[J].南开语言学刊,2007(2):21-31. 被引量：16
5徐劳立.鱼洗振动频率的分析和测量[J].物理实验,2004,24(6):42-43. 被引量：4
6袁艳玲,马玉平,王得胜.弯曲振动圆盘振动参数设计方法[J].机械工程师,2004(10):46-48. 被引量：7
7田昊,张道行.人工耳蜗的言语编码方案与汉语声母语谱特点[J].中国听力语言康复科学杂志,2005,34(1):25-27. 被引量：4
8王家胜,董文中,曾晟,何祖威.超声波在煤粉中的衰减特性的仿真[J].锅炉技术,2005,36(1):49-52. 被引量：6
9崔杰,侯春会,柏锐,李亮,冯杰.声波测井换能器检测方法与原理分析[J].石油仪器,2004,18(6):48-49. 被引量：2
10徐文红,钟高琦,黄见勋,郑谋生.静电除尘器极板振动特性分析[J].热力发电,2005,34(1):29-31.

同被引文献31

1栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
2邝航宇,张军,韦岗.一种基于检测元音的孤立词端点检测算法[J].电声技术,2005,29(3):40-43. 被引量：5
3姚志强,吴礼福,戴蓓蒨,周曦.用于文本无关的话者识别的超音段信息提取[J].数据采集与处理,2005,20(4):376-380. 被引量：1
4林帆,徐明星.一种改进的基于时域参数的语音切分算法[J].计算机科学,2006,33(4):164-167. 被引量：3
5夏耀峰,胡起秀.提高话者识别鲁棒性的信道空间映射方法[J].清华大学学报（自然科学版）,2006,46(7):1329-1332. 被引量：1
6邓菁,郑方,刘建,吴文虎.Mel子带谱质心和高斯混合相关性在鲁棒话者识别中的应用[J].声学学报,2006,31(5):471-475. 被引量：3
7姚志强,周曦,戴蓓蒨.文本无关说话人识别中一种改进的模型PCA变换方法[J].电子与信息学报,2007,29(2):469-472. 被引量：3
8闫润强,祖漪清,朱贻盛.递归趋势分析在汉语语音声韵母切分中的应用研究[J].信号处理,2007,23(4):521-525. 被引量：5
9Fan X, Hansen J H L. Speaker identification within whispered speech audio streams [ J ]. IEEE Trans. audio, speech, and language processing,2011,19 (5) : 1408 - 1421.
10Reynolds D A, Quatieri T F, Dunn R B. Speaker verification using adapted Gaussian mixture models [ J ]. Digital Signal Processing, 2000(10) : 19 -41.

引证文献4

1张永锋,杨影,肖莹莹.基于主成分分析的汉语连续语音切分算法[J].应用声学,2011,30(5):366-369. 被引量：3
2李皓,唐朝京.采用损失函数和声学特征切分声韵母的方法[J].声学学报,2012,37(3):339-345. 被引量：3
3汤霖,尹俊勋.超音段信息对文本无关话者识别的影响[J].湖南科技大学学报（自然科学版）,2013,28(2):81-85.
4卓嘎,边巴旺堆,姜军.双门限算法在藏语语音音节分割中的应用分析[J].科学技术与工程,2015,35(14):196-199. 被引量：3

二级引证文献9

1张永锋,田勇,张阳.利用语音的频谱空间特征进行汉语抗噪语音识别的方法[J].声学技术,2015,34(1):51-53.
2陈立江,王柯柯.汉语连续语流的重音自动标注研究[J].电声技术,2017,41(11):88-94. 被引量：1
3王熙月,黄毅鹏,钱佳慧,何凌,黄华,尹恒.基于声学特征的腭裂语音声韵母切分[J].计算机工程与应用,2018,54(8):123-130. 被引量：3
4曹冠彬,张二华,王凯龙.连续汉语语音切分技术研究[J].计算机与数字工程,2019,47(7):1667-1671. 被引量：3
5朱铮宇,邱华愉,杨春玲,王泳.基于特定韵母发音事件分析的语音唇动一致性判决方法[J].华南理工大学学报（自然科学版）,2020,48(1):139-146. 被引量：4
6杨健,李振鹏,苏鹏.语音分割与端点检测研究综述[J].计算机应用,2020,40(1):1-7. 被引量：8
7王宇琛,张二华.汉语连续语音切分技术研究[J].计算机与数字工程,2020,48(8):1864-1869.
8朱铮宇,廖丽平,杨春玲,王泳,蔡君,邱华愉.基于韵母发音事件匹配与位置时延分析的音唇一致性判决方法[J].电子学报,2021,49(1):140-148. 被引量：1
9冯夫健,吴磊,谭棉,蔡姗,张学文,王林.苗语语音音节自适应切分算法[J].科学技术与工程,2024,24(14):5863-5871.

1恒超.拼音输入法从入门到精通——紫光华宇拼音v6全程图解教程(续)[J].电脑爱好者（普及版）,2008,0(3):34-37.
2伊力亚尔.基于2-gram语言模型的哈萨克文语料库校对研究[J].伊犁师范学院学报（自然科学版）,2010,4(3):50-53. 被引量：1
3陈军.微软拼音输入法2003技巧图解[J].电脑爱好者,2006,0(21):59-59.
4刘政怡,樊庆林,吴建国,李炜.基于输入法的通用存储结构[J].计算机工程与设计,2008,29(17):4554-4558.
5刘政怡,吴建国,刘慧婷.音节切分歧义方法研究[J].计算机技术与发展,2008,18(8):35-38. 被引量：1
6王永生,柴佩琪,曾令平.英语语音合成中基于约束树的音节切分算法[J].微型电脑应用,2005,21(11):15-20.
7赵世瑜,线岩团,郭剑毅,余正涛,洪玄贵,王红斌.基于条件随机场的泰语音节切分方法[J].计算机科学,2016,43(3):54-56. 被引量：2
8张扬,赵晓群,王缔罡.基于音节时间长度高斯拟合的汉语音节切分方法[J].计算机应用,2016,36(5):1410-1414. 被引量：5
9张扬,赵晓群,王缔罡.基于时频二维能量特征的汉语音节切分方法[J].计算机应用,2016,36(11):3222-3228. 被引量：5
10张帅,贾珈,杨大利,徐明星,蔡莲红.方言转换系统中的音节切分算法研究[J].计算机技术与发展,2009,19(7):41-43. 被引量：1

中文信息学报

2010年第4期

浏览历史

内容加载中请稍等...

基于语音知识的音节切分被引量：4

参考文献21

二级参考文献66

共引文献134

同被引文献31

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于语音知识的音节切分 被引量：4

参考文献21

二级参考文献66

共引文献134

同被引文献31

引证文献4

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

基于语音知识的音节切分被引量：4