基于SPWD时频脊特征提取的汉语声调识别被引量：3

CHINESE TONE RECOGNITION BASED ON SPWD TIME-FREQUENCY RIDGE FEATURE EXTRACTION

下载PDF

导出

摘要针对语音信号的非平稳性,采用SPWD(smoothed pseudo Wigner-Ville distribution)将韵母语音信号在时频面清晰地表现出来。不同声调语音的时频脊的变化特征不同。利用阈值和细化处理将SPWD时频矩阵转变成二值矩阵图像,利用Hough变换提取脊线;而第三声时频脊是曲线,将Hough变换求取的线段用最小二乘法多项式进行拟合;在脊线段上等间距选取若干个点,将点集和其一阶差分作为时频脊特征,利用高斯混合模型进行识别分类。仿真实验结果表明,该方法很好地对声调进行了识别,平均识别率为86.48%,第二声识别率提高的幅度最大,提高了5.18%;在不同的信噪比下,识别率最大可提高5.62%。 For the non-stability of speech signals, we use SPWD to clearly manifest the vowel speech signals on time-frequency plane. The variation features of time-frequency ridges differ from different speech tones. We use threshold and refined processing to convert SPWD time-frequency matrix to a binary matrix image, and use Hough transform to extract ridge lines. But the time-frequency ridge of the third tone is curve, the line segment obtained by Hough transform is fitted with the method of least squares polynomial; We select some points equidistantly on time-frequency ridge line, and use the point set and its first difference as the feature of the time-frequency ridge, then use Gaussian mixture model （GMM） to conduct recognition and classification. Simulation experimental results show that this method is very good to the tone recognition and its average recognition rate is 86.48%. The improvement extent of the second tone＇ s recognition rate is the highest, as high as5.18%. And in different SNR, the maximum improvement of recognition rate reaches 5.62%.

作者徐郑丹于凤芹

机构地区江南大学物联网工程学院

出处《计算机应用与软件》 CSCD 北大核心 2014年第3期142-145,共4页 Computer Applications and Software

基金国家自然科学基金项目(61075008)

关键词声调识别平滑伪Wigner—Ville分布时频脊 HOUGH变换最小二乘法多项式拟合 Tone recognition Smoothing pseudo Wigner-Ville distribution Time-frequency ridge Hough transform Polynomial fitting with Least squares method

分类号 TN912.3 [电子电信—通信与信息系统] TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1Wang S P,Tang Z M ,Zhao Y N. Tone recognition of continuous manda- rin speech based on BinmT-Class SVMs [ C ]//2009 1st International Conference on Information Science and Engineering ( IC1SE), Decem- ber 26 - 28,2009, Nanjing, China: 710 - 713.
2曾毓敏,吴镇扬.基于倒谱修正模型的语音基音检测算法[J].南京理工大学学报,2007,31(4):503-508. 被引量：3
3樊桂花,唐斌.基于小波变换的语音基音周期鲁棒性检测[J].信号处理,2004,20(4):365-368. 被引量：8
4Hong Hong,Zhengmin Zhao, Xinlong Wang, et al. Detection of dynamic structures of speech fundamental frequency in tonal languages[ J ]. Sig- nal processing letters ,2010,17 ( 10 ) :843 - 846.
5朱小燕,王昱,刘俊.汉语声调识别中的基音平滑新方法[J].中文信息学报,2001,15(2):45-50. 被引量：26
6I Shui Penglang,Bao Zheng ,Su Hongtao T. Nonparametric detection of FM signls using time-frequency energy [ J ]. Signal processing,2008,56 (5) :1749 -1760.

二级参考文献19

1关存太,陈永彬.非特定人四声识别[J].声学学报,1993,18(5):379-385. 被引量：4
2徐士林.四声模糊识别方法[J].电子学报,1996,24(1):119-121. 被引量：12
3杨行骏迟惠生.语音信号数字处理[M].北京:电子工业出版社,1995..
4Rabiner L R, Cheng M J, Rosenberg A E, et al. A comparative pelformance study of several pitch detection algorithms. IEEE Trans. on ASSP, 1976, ASSP 24(5):399-418.
5Mallat S and Zhong S. Characterization of signals from multiscale edges. IEEE Trans. on PAMI, 1992, 14(7):710-732.
6Rabiner L,Cheng M,Rosenberg A,et al.A comparative performance study of several pitch detection algorithms[J].IEEE Trans on Acoustics,Speech,and Signal Processing,1976,24 (5):399 -417.
7Noll A M.Cepstrum pitch determination[J].Journal of the Acoustic Society of America,1967,41 (2):293-309.
8Kadambe S,Boudreaux-Bartels G.Application of the wavelet transform for pitch detection of speech signals[J].IEEE Trans on Information Theory,1992,38(2):917 -924.
9Huang D,Lin W,Rahardja S.Speech pitch detection in noisy environment using multi-rate adaptive lossless FIR filters[A].Proceedings of the International Symposium on Circuits and Systems 2004 (ISCAS ' 04)[C].[S.l.]:IEEE,2004.Ⅲ -429-432.
10Xu X,Miyanaga Y.A robust pitch detection in noisy speech with band-pass filtering on modulation spectra[A].Proceedings of International Symposium on Communications and Information Technology (ISCIT2005)[C].[S.l.]:IEEE,2005.266 -269.

共引文献34

1宁继荣.一种语音信号基音频率提取算法的研究及实现[J].中国新通信,2020,0(3):70-70. 被引量：2
2陈蕾,肖珺,贾嫣.基于改进LD归一化算法的汉语声调识别系统的性能研究[J].自动化与仪器仪表,2016(1):148-151.
3汤霖,尹俊勋,粟志昂,赖国庭.基于两级BP模型的普通话声调识别系统[J].计算机工程与应用,2004,40(25):96-99. 被引量：8
4王义元,赵黎明.基于小波变换的汉语三字词语音基音频率提取[J].吉林大学学报（信息科学版）,2005,23(1):22-26. 被引量：2
5黄海亮,谢康林,杜平,吴边.一种高精度的基音提取方案[J].计算机工程,2004,30(B12):343-345. 被引量：4
6柏静,韦岗.一种基于线性预测与自相关函数法的语音基音周期检测新算法[J].电声技术,2005,29(8):43-46. 被引量：14
7李晋,王玲.基于线性预测和最大似然的基音检测算法[J].计算机应用,2006,26(5):1232-1233. 被引量：4
8姜占才,袁海良.基于时域与小波域相结合的语音增强技术[J].青海师范大学学报（自然科学版）,2006,22(3):20-22.
9胡瑛,陈宁,夏旭.一种改进的自相关基音检测算法[J].电子科技,2007,20(2):25-28. 被引量：5
10黄海辉,邹虹.一种高效的语调检测与评估方案[J].重庆邮电大学学报（自然科学版）,2007,19(B06):72-74. 被引量：1

同被引文献32

1刘永祥,黎湘,庄钊文.空间目标进动特性及在雷达识别中的应用[J].自然科学进展,2004,14(11):1329-1332. 被引量：27
2薛国新,孙玉强.正弦曲线三点拟合问题的一种新方法[J].计算机仿真,2006,23(2):107-109. 被引量：7
3孔庆鹏,宋开臣,陈鹰.最小二乘自适应滤波旋转机械阶比跟踪研究[J].浙江大学学报（工学版）,2006,40(9):1648-1651. 被引量：7
4庄钊文,刘永祥,黎湘.目标微动特性研究进展[J].电子学报,2007,35(3):520-525. 被引量：128
5张群,罗斌凤,管桦,池龙,郭英.基于微Doppler提取的具有旋转部件雷达目标成像[J].自然科学进展,2007,17(10):1410-1417. 被引量：13
6李爱平,党幼云.VQ声纹识别算法和实验[J].西安工程科技学院学报,2007,21(6):848-851. 被引量：1
7高明明,常太华,杨国田,李曼.基于子带主频率信息的语音特征提取算法[J].计算机工程,2009,35(18):161-163. 被引量：5
8向玲,唐贵基,胡爱军.旋转机械非平稳振动信号的时频分析比较[J].振动与冲击,2010,29(2):42-45. 被引量：64
9刘进,李金梁,马梁,王雪松,王国玉.基于TFD-Hough变换的毫米波导引头微运动参数提取算法[J].系统工程与电子技术,2010,32(3):518-522. 被引量：6
10罗洁思,于德介,彭富强.齿轮箱故障振动信号的阶比多尺度形态学解调[J].机械工程学报,2010,46(11):114-120. 被引量：16

引证文献3

1王晓华,屈雷,张超,蒋细伟.基于Fisher比的Bark小波包变换的语音特征提取算法[J].西安工程大学学报,2016,30(4):452-457. 被引量：6
2陈沁根,张兴敢.基于时频分析-随机Hough变换的微动目标参数快速提取[J].南京大学学报（自然科学版）,2017,53(6):1178-1186. 被引量：3
3王文智,谷立臣,石玉萍,刘畅畅.机电液系统转速波动分量Vold-Kalman时变滤波提取方法[J].机床与液压,2019,47(10):123-129. 被引量：1

二级引证文献10

1聂小鹏,沈祖成,王晓峰,王春雨.正弦调频连续波信号参数估计新方法[J].电信科学,2018,34(2):74-80. 被引量：2
2王晓华,要鹏超,广夏桐,王文杰,张蕾.基于ROS的移动机器人语音控制设计与实现[J].传感器与微系统,2019,38(5):100-103. 被引量：8
3王鸿姗,周静雷,房乔楚.小波包样本熵的扬声器异常音特征提取方法[J].西安工程大学学报,2019,33(1):57-62. 被引量：11
4付方玲,何飞,付佳,尹恒,黄华,何凌.结合听觉模型的腭裂语音高鼻音等级自动识别[J].计算机工程与应用,2019,55(10):127-134.
5苏云龙,平雪良,李楠.基于RANSAC三维点云的平面提取算法[J].激光与红外,2019,49(6):780-784. 被引量：26
6李昌利,胡丽娜.SAR微动目标检测及其参数估计方法[J].雷达科学与技术,2019,17(4):365-370. 被引量：3
7张龙,吴荣真,雷兵,周建民.基于多尺度熵的滚动轴承故障可拓智能识别[J].噪声与振动控制,2019,39(6):200-205. 被引量：8
8陈又圣,曹智亮,夏林中,张春晓,林炜臻.基于Bark域的电子耳蜗频带划分分析和拟合研究[J].中国医学物理学杂志,2020,37(3):350-354.
9孙永彪.轮机油液监控系统的信息提取与处理[J].船舶物资与市场,2020(7):15-16.
10孙杰,王斌,王宏,吾守尔·斯拉木.基于小波特征的维吾尔语方言识别[J].实验室研究与探索,2023,42(4):148-152.

1蒋奇材,雷武虎,崔轩.基于SPWD多载波频率估计算法的改进[J].航天电子对抗,2009,25(4):59-60.
2顾明亮,夏玉果,杨亦鸣.支持矢量机的汉语声调识别[J].声学技术,2007,26(6):1186-1190. 被引量：2
3顾明亮,夏玉果,王劲松.噪声环境下的汉语声调识别[J].计算机技术与发展,2007,17(8):70-72. 被引量：2
4程旭,刘进,王雪松,戴幻尧.微多普勒特征提取中的时频分布选择[J].应用科学学报,2011,29(4):397-404. 被引量：5
5郭靖,曾孝平.一种重排时频谱的非平稳信号盲源分离方法[J].西南师范大学学报（自然科学版）,2010,35(6):147-151. 被引量：2
6韩巍,陈之龙,吴平东.平滑伪Wigner-Ville分布在脑电信号处理中的应用[J].电子科技,2006,19(1):16-19. 被引量：5
7钟兆根,张立民,武恒州.多传感器雷达侦察信号分选新方法研究[J].传感技术学报,2008,21(6):994-997. 被引量：4
8林正青,牟林,彭圆,张风珍.时频分布重排方法在水下目标回声识别中的应用[J].应用声学,2014,33(1):87-94. 被引量：3
9赵瑞珍,宋国乡,屈汉章.基于小波变换的汉语声调识别新方法　[J].信号处理,2000,16(4):357-361. 被引量：2
10王思俊,许增朴,于德敏,王永强.基于支持向量机的扬声器故障检测方法[J].电声技术,2008,32(3):26-29. 被引量：1

计算机应用与软件

2014年第3期

浏览历史

内容加载中请稍等...

基于SPWD时频脊特征提取的汉语声调识别被引量：3

参考文献6

二级参考文献19

共引文献34

同被引文献32

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于SPWD时频脊特征提取的汉语声调识别 被引量：3

参考文献6

二级参考文献19

共引文献34

同被引文献32

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于SPWD时频脊特征提取的汉语声调识别被引量：3