为连续语音识别用的单词音节神经网络建模的研究被引量：4

Single Figure Syllable Modeling Based on Neural Network for Continuous Speech Recognition

下载PDF

导出

摘要本文主要研究连续语音中单词音节的神经网络建模问题.采用了一种富有特色的特征提取方法,并依据高维空间点覆盖理论,对实际连续数字语音的各不同数字音节,以人工切自连续数字语音中的2640个单字音节,构建连续语音中各不同数字音节的特征空间覆盖区,并使用7308个自连续数字语音中切分出的单字音节,利用仿生模式识别原理,进行了建模正确性验证.验证结果正确率达到97%以上,对同样数量的少量建模样本,识别率优于SVM方法. The single figure syllable modeling based on neural network for continuous SloUch recognition is discussed. A new feature extraction method is used which mainly includes compressing single figure frames according to a certain inter-frame angle, extracting representative information comparing to standard single figure of fixed length. 2640 single figure syllables made from continuous speech are used to construct each kind of high dimensional space covering area. By biomimetic pattern recognition theory 7308 single figure syllables made from continuous speech are used to confirm this model in CASSANN-Ⅱ neural computer and get a quite good resuit. Experiments show the recognition rate is higher than SVM when the training samples are small.

作者王守觉徐春燕潘晓霞安冬陈旭曹文明

机构地区中国科学院半导体研究所浙江工业大学智能信息系统研究所

出处《电子学报》 EI CAS CSCD 北大核心 2005年第10期1883-1885,共3页 Acta Electronica Sinica

关键词连续语音单词音节高维空间点覆盖神经网络模型 continuous speech high-dimensional space covering single syllable neural network modeling

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献11

1刘加.汉语大词汇量连续语音识别系统研究进展[J].电子学报,2000,28(1):85-91. 被引量：50
2李虎生,刘加,刘润生.高性能汉语数码语音识别算法[J].清华大学学报（自然科学版）,2000,40(1):32-34. 被引量：20
3L R Rabiner.A tutorial on hidden Markov models and selected applications in speech recognition[J].Proceedings of the IEEE,1989,77(2):257-286.
4R J Mammone,X Zhang,R P Ramachandran.Robust speaker recognition:A feature-based approach[J].IEEE Signal Processing,1996(13):58-71.
5王守觉.仿生模式识别(拓扑模式识别)——一种模式识别新模型的理论与应用[J].电子学报,2002,30(10):1417-1420. 被引量：151
6冯俊兰,杜利民.自然口语语音识别研究概况[J].电子科技导报,1999(9):3-7. 被引量：5
7王守觉,王柏南.人工神经网络的多维空间几何分析及其理论[J].电子学报,2002,30(1):1-4. 被引量：87
8王守觉,徐健,王宪保,覃鸿.基于仿生模式识别的多镜头人脸身份确认系统研究[J].电子学报,2003,31(1):1-3. 被引量：38
9王守觉,李兆洲,陈向东,王柏南.通用神经网络硬件中神经元基本数学模型的讨论[J].电子学报,2001,29(5):577-580. 被引量：45
10王守觉,潘晓霞,徐春燕,陈旭,安冬,曹文明.一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究[J].电子学报,2005,33(10):1790-1793. 被引量：7

二级参考文献38

1王守觉,徐春燕,潘晓霞,安冬,陈旭,曹文明.为连续语音识别用的单词音节神经网络建模的研究[J].电子学报,2005,33(10):1883-1885. 被引量：4
2俞士汶,朱学锋,王惠,张芸芸.现代汉语语法信息词典规格说明书[J].中文信息学报,1996,10(2):1-22. 被引量：34
3张建平.大词汇量自然连续语音识别中的语言模型和理解算法研究.博士论文[M].北京:清华大学,1999..
4徐波.汉语非特定人听写机系统研究和集成.博士论文[M].北京:中国科学院自动化研究所,1997..
5A Д亚历山大洛夫等王元等（译）.数学--它的内容、方法和意义，第三卷[M].北京:科学出版社,1962..
6冀复生.关于美国信息技术发展情况的一些看法[N].科技日报,2002-07-18(特别关注).
7张建平，博士学位论文，1999年
8Liu J，Chin J Electron，1998年，7卷，2期，135页
9Zheng R，Chin J Electron，1998年，7卷，2期，122页
10Juang B H，IEEE Signal Processing Magazine，1998年，24页

共引文献300

1蒋文建,韦岗.基于多时间尺度复合子带噪声语音识别新方法[J].电子学报,2001,29(z1):1829-1832.
2鞠熠昊.一种基于乘性规则和支持向量域的水中目标识别分类器探讨[J].舰船电子工程,2008,28(12):171-173.
3唐国.语音识别技术探讨[J].菏泽学院学报,2001,25(4):17-19.
4张宜.汉语语音识别技术的研究与发展[J].广西广播电视大学学报,2003,14(4):18-22. 被引量：3
5王守觉,曲延锋,李卫军,覃鸿.基于仿生模式识别与传统模式识别的人脸识别效果比较研究[J].电子学报,2004,32(7):1057-1061. 被引量：46
6王青伟,马镯,崔琳,王立石,刘时雄,高霖.语音识别领域计算机程序或算法专利申请审查[J].电声技术,2012,36(S1):50-52. 被引量：1
7张祥合,王丹,任露泉,赵宏伟.基于多维空间仿生信息学的目标识别新算法[J].吉林大学学报（工学版）,2011,41(S2):269-274.
8郭婷婷,邬文锦,苏谦,王守觉,安冬.近红外玉米品种鉴别系统预处理和波长选择方法[J].农业机械学报,2009,40(S1):87-92. 被引量：16
9陆从德,张太镒,胡金燕.基于乘性规则的支持向量域分类器[J].计算机学报,2004,27(5):690-694. 被引量：21
10张新峰,沈兰荪.模式识别及其在图像处理中的应用[J].测控技术,2004,23(5):28-32. 被引量：39

同被引文献36

1王守觉,曲延锋,李卫军,覃鸿.基于仿生模式识别与传统模式识别的人脸识别效果比较研究[J].电子学报,2004,32(7):1057-1061. 被引量：46
2安冬,王守觉.基于仿生模式识别和PCA/ICA的DOA估计方法[J].电子学报,2004,32(9):1448-1451. 被引量：14
3薛明东,郭立.基于SVM算法的图像分类[J].计算机工程与应用,2004,40(30):230-232. 被引量：13
4安冬,王守觉.基于仿生模式识别的DOA估计方法[J].电子与信息学报,2004,26(9):1468-1473. 被引量：11
5栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报,2005,30(1):69-75. 被引量：34
6覃鸿,王守觉.多权值神经元网络仿生模式识别方法在低训练样本数量非特定人语音识别中与HMM及DTW的比较研究[J].电子学报,2005,33(5):957-960. 被引量：19
7潘凌云,孙达传,吴美朝.语音识别中基于语谱图的语音音素分割方法[J].杭州大学学报（自然科学版）,1995,22(1):42-46. 被引量：7
8王守觉,潘晓霞,徐春燕,陈旭,安冬,曹文明.一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究[J].电子学报,2005,33(10):1790-1793. 被引量：7
9齐峰岩,鲍长春.一种基于支持向量机的含噪语音的清/浊/静音分类的新方法[J].电子学报,2006,34(4):605-611. 被引量：12
10罗四维,赵连伟.基于谱图理论的流形学习算法[J].计算机研究与发展,2006,43(7):1173-1179. 被引量：76

引证文献4

1王守觉,潘晓霞,徐春燕,陈旭,安冬,曹文明.一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究[J].电子学报,2005,33(10):1790-1793. 被引量：7
2钱博,李燕萍,唐振民,徐利敏.基于频域能量分布分析的自适应元音帧提取算法[J].电子学报,2007,35(2):279-282. 被引量：7
3王宪保,陆飞,陈勇,方路平,王守觉.仿生模式识别的算法实现与应用[J].浙江工业大学学报,2011,39(1):71-74. 被引量：4
4董华珍,潘文林,王翠,和丽华,杨建香,解学琴.基于免疫遗传优化支持向量机的普米语孤立词语谱图分类[J].云南民族大学学报（自然科学版）,2019,28(1):100-104. 被引量：2

二级引证文献19

1王守觉,徐春燕,潘晓霞,安冬,陈旭,曹文明.为连续语音识别用的单词音节神经网络建模的研究[J].电子学报,2005,33(10):1883-1885. 被引量：4
2闾海荣,韩慧,王文渊.基于仿生模式识别思想的时间序列匹配[J].电子学报,2007,35(7):1323-1326. 被引量：5
3张卫强,刘加,陈恩庆.一种基于仿生模式识别思想的固定音频检索方法[J].自然科学进展,2008,18(7):808-813. 被引量：6
4钱博,唐振民,李燕萍,徐利敏.基于背景噪声估计的说话人识别算法[J].计算机工程,2008,34(14):14-16. 被引量：1
5姚潇,武妍,王守觉.一种基于并行覆盖前馈优先神经网络的说话人识别方法[J].计算机科学,2008,35(8):125-128. 被引量：2
6李燕萍,唐振民,丁辉,张燕.半监督学习机制下的说话人辨认算法[J].计算机工程,2009,35(14):221-223. 被引量：2
7康广玉,郭世泽,孙圣和.基于子带能量的GMM含噪语音分类算法[J].仪器仪表学报,2009,30(9):1950-1955. 被引量：2
8张燕,钱博,李燕萍.元音检测和最值点符号特征匹配的音乐检索[J].计算机工程与应用,2009,45(36):126-128.
9王宪保,陆飞,陈勇,方路平,王守觉.仿生模式识别的算法实现与应用[J].浙江工业大学学报,2011,39(1):71-74. 被引量：4
10李皓,唐朝京.基于循环自相关函数的浊音端点检测[J].计算机工程,2011,37(22):5-7. 被引量：1

1刘雪燕,张娜,袁宝玲.说话人识别综述[J].电脑知识与技术,2009,5(1):169-171. 被引量：3
2司德平.条形码的识别原理[J].现代物理知识,2000,12(6):36-36. 被引量：14
3丁军.RFID技术及其应用[J].工业仪表与自动化装置,2006(5):74-75. 被引量：6
4周银东,常青,江津菁,梅顺良.一种新型的基于神经网络的无线信道模型[J].电讯技术,2005,45(2):143-146. 被引量：2
5叶虹,王海伦,姜春娣.非特定人问候语连续语音识别技术的研究[J].浙江工业大学学报,2010,38(5):566-569. 被引量：2
6夏桂芬,赵保军,韩月秋.基于神经网络的远程激光测距机混沌弱信号检测[J].激光技术,2006,30(5):449-451. 被引量：10
7王守觉,沈孙园,曹文明.基于仿生模式识别的小词汇量连续型语音识别的研究[J].哈尔滨工程大学学报,2006,27(B07):1-5. 被引量：3
8王守觉,潘晓霞,徐春燕,陈旭,安冬,曹文明.一种基于高维空间覆盖动态搜索方法的非特定人连续数字语音识别的研究[J].电子学报,2005,33(10):1790-1793. 被引量：7
9刘海文.马刺狭孔用于Wilkinson功分器高次谐波抑制的研究[J].空间电子技术,2010,7(2):102-106.
10牛旭,徐爱英.BP算法在无线信道建模中的应用[J].科技信息,2010(32):104-104.

电子学报

2005年第10期

浏览历史

内容加载中请稍等...

为连续语音识别用的单词音节神经网络建模的研究被引量：4

参考文献11

二级参考文献38

共引文献300

同被引文献36

引证文献4

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

为连续语音识别用的单词音节神经网络建模的研究 被引量：4

参考文献11

二级参考文献38

共引文献300

同被引文献36

引证文献4

二级引证文献19

相关作者

相关机构

相关主题

浏览历史

为连续语音识别用的单词音节神经网络建模的研究被引量：4