语音识别中基于语谱图的语音音素分割方法被引量：7

A Method of Automatic Segmentation for Speech Recognition Based on Spectrograms

下载PDF

导出

摘要语谱图在语音分析方面有着广泛的应用.音素的自动分割是语音识别过程中的一个基本阶段,它将把语音句子按音素特征进行分割.本文提出了一个音素自动分割的方法;使用了两个表示语谱图密度变化的形变函数,以及自适应阈值技术来定位每个音素段的边缘.这个方法在计算机上具体实现后.我们对取于一个语谱图数据库的一组实验数据,用本文所介绍的自动分割方法划分音素,将所得结果与由一语音学家分割的结果进行比较,得到的识别率高于93%.这个方法作为语音识别系统的一部分,已经在一个语音分析系统中使用. A spectrogram is a grey scale image, which represents the energy changes of a speech signal. Automatic segmentation is an initial phase in the acoustic-phonetic analysis of automatic speech recognition based on spectrograms. Speech segmentation can be defined as the process of dividing the spectrogram into a sequence of segments, each segment indicating phonemic characteristics. This paper presents a method of automatic segmentation with image processing techniques. We describe two special functions which indicate the intensity changes of the spectrograms called. Together with these two functions, we used adaptive threshold techniques to detect the location of the edges for each segment. The threshold was calculated based on an optimum relation equation which was defined using interpolating linear nulti-ple regression. After the preliminary segmentation, a segmentation check procedure was taken to check the segmentation results. The algorithm was evaluated by comparing the automatic segmentation result with another segmentation result carried out by a phonetic expert. This automatic segmentation facility is a part of an automatic feature extraction program appiled in a speech analysis system.

作者潘凌云孙达传吴美朝

出处《杭州大学学报（自然科学版）》 CSCD 1995年第1期42-46,共5页 Journal of Hangzhou University Natural Science Edition

关键词语谱图语音音素语音识别自动分割 speech recognition spectrograms speech segmentation.

分类号 TN912.34 [电子电信—通信与信息系统] TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献62

1王临惠.汉语方言分区的语音标准刍议[J].南开语言学刊,2005(1):18-22. 被引量：3
2陆致极.汉语方言间亲疏关系的计量描写[J].中国社会科学,1987(1):155-166. 被引量：24
3颜森.江西方言的分区(稿)[J].方言,1986,8(1):19-38. 被引量：97
4沈榕秋.谈汉语方言的定量研究[J].语文研究,1994(2):45-52. 被引量：9
5郑锦全.汉语方言沟通度的计算[J].中国语文,1994(1):35-43. 被引量：24
6陈海伦.论方言相关度、相似度、沟通度指标问题[J].中国语文,1996(5):361-368. 被引量：9
7张宇波.基于信号处理的声音模式识别过程及方法研究[J].计算机仿真,2004,21(9):134-137. 被引量：6
8薛明东,郭立.基于SVM算法的图像分类[J].计算机工程与应用,2004,40(30):230-232. 被引量：13
9陈韬,李昌立,莫福源.汉语孤立字全音节实时识别系统[J].声学学报,1993,18(3):161-171. 被引量：4
10陈海伦.方言间韵母系统相似度测度研究[J].中国语文,2000(2):139-145. 被引量：8

引证文献7

1栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
2梁士利,魏莹,潘迪,张玲,许廷发,王双维.基于语谱图行投影的特定人二字汉语词汇识别[J].吉林大学学报（工学版）,2017,47(1):294-300. 被引量：6
3潘迪,梁士利,魏莹,李广岩,许廷发,王双维.语谱图二次傅里叶变换特定人二字汉语词汇识别[J].东北师大学报（自然科学版）,2017,49(2):95-100. 被引量：2
4王玉兴,游展辉,吴伟斌,黄家曦,刘文超,李泽艺,侯晓捷,游鑫辉.农用运输车果园路谱振动信号采集分析[J].华中农业大学学报,2018,37(4):24-29. 被引量：3
5董华珍,潘文林,王翠,和丽华,杨建香,解学琴.基于免疫遗传优化支持向量机的普米语孤立词语谱图分类[J].云南民族大学学报（自然科学版）,2019,28(1):100-104. 被引量：2
6颜为之,王明文,徐凡,但扬杰,罗健.基于语谱图的江西境内赣方言自动分区研究[J].中文信息学报,2021,35(4):1-7. 被引量：4
7魏莹,王双维,潘迪,张玲,许廷发,梁士利.宽窄带语谱图融合分带投影的特定人汉语词汇识别[J].计算机科学,2016,43(S2):215-219. 被引量：1

二级引证文献52

1茹婷婷,谢湘.耳语音数据库的设计与采集[J].清华大学学报（自然科学版）,2008,48(S1):725-729. 被引量：2
2LIXueli,XUBoling.Tone features in whispered Chinese[J].Progress in Natural Science:Materials International,2005,15(3):285-288. 被引量：5
3杨莉莉,李燕,徐柏龄.汉语耳语音库的建立与听觉实验研究[J].南京大学学报（自然科学版）,2005,41(3):311-317. 被引量：13
4林玮,杨莉莉,徐柏龄.基于修正MFCC参数汉语耳语音的话者识别[J].南京大学学报（自然科学版）,2006,42(1):54-62. 被引量：23
5樊星,卢晶,徐柏龄.汉语耳语音转换为正常音的研究[J].电声技术,2005,29(12):44-47. 被引量：11
6杨莉莉,林玮,徐柏龄.汉语耳语音孤立字识别研究[J].应用声学,2006,25(3):187-192. 被引量：8
7国雁萌,付强,颜永红.复杂噪声环境中的语音端点检测[J].声学学报,2006,31(6):549-554. 被引量：17
8王欢良,韩纪庆,李海峰.基于特征似然度加权和维数缩减的Robust语音端点检测[J].声学学报,2007,32(1):62-68. 被引量：7
9GUO Yanmeng FU Qiang YAN Yonghong.Speech endpoint detection in real noise environments[J].Chinese Journal of Acoustics,2007,26(1):39-48. 被引量：5
10钱博,李燕萍,唐振民,徐利敏.基于频域能量分布分析的自适应元音帧提取算法[J].电子学报,2007,35(2):279-282. 被引量：7

1信息化推动建筑企业持续发展[J].中国建设信息,2013(2):38-41.
2任定中.计算机管理信息系统的开发与设计[J].天津纺织工学院学报,1994,13(4):57-60. 被引量：2
3张艳君.逆向工程及其关键技术概述[J].科技广场,2005(1):11-13. 被引量：6
4乔希.奎特纳.谁将主宰未来的互联网王国?[J].中国新通信,2008,10(12):44-46.
5刘春蕾,陈忠海,龙在云.语音合成技术在智能机器人中的应用[J].电声技术,2003,27(12):29-31.
6侯正昌.小波变换在图像压缩中的应用[J].电脑知识与技术,2005(10):75-77.
7张尤赛,杨姝.局部加权平均虚拟样本的多姿态人脸识别算法[J].江苏科技大学学报（自然科学版）,2013,27(1):74-79. 被引量：2
8韦合.壮母语地区英语语音教学中的壮英比较[J].科技信息,2009(17):204-205. 被引量：1
9郑悦.IBM:云的进击[J].IT经理世界,2014(7):24-26.
10阿里巴巴请机器人为员工写春联[J].检察风云,2017,0(3):6-6.

杭州大学学报（自然科学版）

1995年第1期

浏览历史

内容加载中请稍等...

语音识别中基于语谱图的语音音素分割方法被引量：7

同被引文献62

引证文献7

二级引证文献52

相关作者

相关机构

相关主题

浏览历史

语音识别中基于语谱图的语音音素分割方法 被引量：7

同被引文献62

引证文献7

二级引证文献52

相关作者

相关机构

相关主题

浏览历史

语音识别中基于语谱图的语音音素分割方法被引量：7