多媒体网络语音音调数据特征智能识别方法被引量：1

Intelligent recognition method for multimedia network voice and tone data features

导出

摘要利用传统方法对多媒体网络语音音调数据特征进行识别,存在识别准确性低,识别速度慢的问题。针对上述问题,提出一种新的多媒体网络语音音调数据特征智能识别方法。该方法分为三部分:第一对输入的多媒体网络语音音调数据进行预处理,包括数据转换、预加重、分帧加窗和端点检测等4步;第二提取预处理数据特征参数,包括基音频率、共振峰、mel倒谱系数;第三利用GMM-SVM模型在提取到的特征参数基础上进行智能识别。结果表明:利用本方法对多媒体网络语音音调数据特征进行智能识别,与基于人工神经网络的语音特征识别方法和基于蚁群算法特征选择的语音识别方法相比,平均正确识别率提高8.3%和12.4%,平均所用时间减少0.7 s和1.24 s,识别速度加快。 The traditional methods for recognizing the features of multi-media network speech tone data have the problems of low recognition accuracy and slow recognition speed.In view of the above problems,a new intelligent recognition method for voice and tone data features in multimedia networks is proposed.The method is divided into three parts:first,the input multimedia network voice tone data is pre-processed,including data conversion,pre-emphasis,sub-frame windowing and endpoint detection steps;second,the pre-processed data feature parameters,including pitch frequency,formant,Mel cepstrum coefficient;third,the GMM-SVM model is used to extract the mentioned parameters.Intelligent recognition is done on the basis of characteristic parameters.The results show that this method can be used to recognize the tone data of multimedia network intelligently.Compared with the speech recognition method based on artificial neural network and the speech recognition method based on ant colony algorithm,the average correct recognition rate is increased by 8.3%and 12.4%,and the average recognition time is reduced by 0.7 s and 1.24 s the recognition speed accelerected.

作者周挺杨荣 ZHOU Ting;YANG Rong(Xi’an Aeronautical Polytechnic Institute,Xi’an 710089,China)

机构地区西安航空职业技术学院

出处《自动化与仪器仪表》 2019年第9期132-135,共4页 Automation & Instrumentation

基金陕西省教育厅2017年科学研究项目立项课题:“基于互联网+环境下高职学生综合素质测评体系构建与实践”(No.17JK0400)

关键词多媒体语音音调数据特征识别 multimedia voice and tone data characteristics recognition

分类号 TN912.34 [电子电信—通信与信息系统] TP37 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献13

1陆星家,王玉金,陈志荣,林勇.基于隐SVM和混合高斯模型的目标检测算法[J].计算机工程,2016,42(6):287-292. 被引量：3
2张毅,谢延义,罗元,席兵.一种语音特征提取中Mel倒谱系数的后处理算法[J].智能系统学报,2016,11(2):208-215. 被引量：12
3黄天芸.基于人工智能深度学习的语音识别方法[J].信息记录材料,2017,18(9):20-21. 被引量：6
4高家宝,来羽.一种新的HMM/SVM混合语音识别模型[J].控制工程,2016,23(11):1802-1807. 被引量：6
5邵兵,杜鹏飞.基于卷积神经网络的语音情感识别方法[J].科技创新导报,2016,13(6):87-90. 被引量：6
6朱响斌,邱慧玲.基于智能手机传感器数据的人类行为识别研究[J].计算机工程与应用,2016,52(23):1-5. 被引量：11
7李喆,孙健,倪训友.基于智能手机大数据的交通出行方式识别研究[J].计算机应用研究,2016,33(12):3527-3529. 被引量：19
8王群,曾庆宁,谢先明,郑展恒.低信噪比环境下的语音识别方法研究[J].声学技术,2017,36(1):50-56. 被引量：11
9李惠民.高速信号的预加重和均衡简介[J].国外电子测量技术,2016,35(3):15-20. 被引量：4
10杨立东,谷宇,张明.语音信号特征选择优化提取仿真研究[J].计算机仿真,2016,33(2):409-412. 被引量：7

二级参考文献90

1王娟,慈林林,姚康泽.特征选择方法综述[J].计算机工程与科学,2005,27(12):68-71. 被引量：64
2何珏,刘加.基于汉语语音音位的HMM建模方法[J].清华大学学报（自然科学版）,2007,47(4):518-521. 被引量：1
3马莉,党幼云.特定人孤立词语音识别系统的仿真与分析[J].西安工程科技学院学报,2007,21(3):371-373. 被引量：11
4李海峰,王炜.基于神经网络的交通方式选择模型[J].公路交通科技,2007,24(7):132-136. 被引量：16
5刘赵杰,邵健,张鹏远,赵庆卫,颜永红,冯稷.汉语自然口语中声调识别的研究[J].物理学报,2007,56(12):7064-7069. 被引量：5
6S Nemati, M E Basiri. Text - independent speaker verication using ant colony optimization - based selected features [ J ]. Expert Sys- tems with Applications, 2011,38 ( 1 ) : 620 - 630.
7Wu Qiang, Zhang Liqing and Shi Guangchuan. Robust Muhifactor Speech Feature Extraction Based on Gabor Analysis [ J ]. IEEE Trans. on Audio, Speech, and Language Processing, 2011,19 (4) : 927 -936.
8S Nemati, R Boostani, M D Jazi. A Novel Text - Independent Speaker Verification System Using Ant Colony Optimization Algo- rithm [ J ]. Lecture Notes in Computer Science, 2008, ( 5099 ) :421 - 429.
9M A H A1 - Saedi, A A G Azzawi. Face Recognition Based on Mixed between Selected Feature by Muhiwavelet and Particle Swarm Optimization[ C ]. Proceedings of the 2010 Developments in E - systems Engineering. USA : IEEE, 2010 : 199 - 204.election.
10C S Jung, M Y Kim, H G Kang. Selecting Feature Frames for Au- tomatic Speaker Recognition Using Mutual Information [ J 1. IEEE Transactions on Audio, Speech, and Language Processing, 2010, 18(6) :1332 - 1340.

共引文献77

1张良.人工智能下深度学习的语音识别方法分析[J].计算机产品与流通,2020,9(6):121-121. 被引量：5
2陈建军,黄啟抒,陈子晗,万义良.基于个人轨迹的出行模式识别[J].国土资源导刊,2020,17(4):56-64. 被引量：2
3杨臻.语音信号准确性识别仿真研究[J].计算机仿真,2017,34(2):285-288. 被引量：6
4乔玲玲,郭秀婷.人体语音特征提取身份优化验证仿真研究[J].计算机仿真,2017,34(2):342-345. 被引量：3
5冯一帆,姜文涛.基于语音识别的智能书架设计与实现[J].软件导刊,2017,16(5):57-59. 被引量：3
6须磊.强震动环境下网络通信信号优化提取仿真研究[J].计算机仿真,2017,34(9):195-198. 被引量：1
7李盛,周斌,胡金艳,周鹏程,李涛,袁玉迪.奇异值分解在语音增强中的应用研究[J].徐州工程学院学报（自然科学版）,2017,32(3):53-56. 被引量：1
8李云红,郑婷婷,王震亚,王延年,惠史科.基于层次聚类多任务学习的人类行为识别[J].自动化仪表,2017,38(10):78-81. 被引量：1
9王小君,卢昱明.基于大数据分析的海量数据特征智能采集方法研究[J].自动化与仪器仪表,2017(11):69-71. 被引量：8
10常勇,杨梅.基于改进支持向量机的风电机组故障分类识别[J].兰州石化职业技术学院学报,2017,17(4):8-11. 被引量：1

同被引文献6

1杨帆,徐军.基于人脸识别技术的电源开关控制系统[J].传感器与微系统,2019,38(9):93-95. 被引量：9
2侯勇,毛润华,何献章,张晓宇,李金桐.CNC多工位自动上卸料机械臂设计[J].制造业自动化,2019,41(9):125-128. 被引量：3
3王禾生,梁维保.一种自动夹取及码垛的机械手装置设计[J].机电信息,2019,0(27):103-104. 被引量：4
4李杰,刘子龙.基于计算机视觉的无人机物体识别追踪[J].软件导刊,2020,19(1):21-24. 被引量：11
5梁慧.嵌入式英语语音识别系统误差自动检测方法研究[J].自动化与仪器仪表,2019(9):55-58. 被引量：11
6张瑞,焦晓琼.基于OpenCV的图像处理技术在国画中的应用[J].自动化与仪器仪表,2019(9):226-229. 被引量：6

引证文献1

1祝朝坤,魏伦胜.基于OPENCV手势识别的启蒙教育机器人的设计与实现[J].电子产品世界,2019,26(11):77-80. 被引量：2

二级引证文献2

1李虹飞,胡满红.采摘机器人SEMG手势识别研究——基于RNN循环神经网络[J].农机化研究,2022,44(5):212-216. 被引量：5
2赵孜孜,沈金淼,张文辉,昌路,叶晓平,游张平.基于Scratch的USB模块化可拆卸教育机器人设计与开发[J].南京晓庄学院学报,2022,38(6):1-5. 被引量：3

1于文勃,范萍,俞稼钰,梁丹丹.汉语普通话母语者的节奏组块感知偏好[J].心理科学,2019,42(2):293-298.
2龙珊.专业英语语音课中的韵律节奏练习与儿歌编写——以应用英语(学前方向)专业为例[J].当代旅游,2017,0(10):167-168.
3冷波,李建彬.基于统计学特征的Android恶意应用检测方法[J].计算机应用研究,2019,36(8):2469-2472. 被引量：3
4毕野,熊新,叶波,吴建德,范玉刚,高阳.基于深度学习的涡流热成像技术在无损检测中的应用[J].化工自动化及仪表,2019,46(9):690-696. 被引量：3
5郑志红,周春芬.基于Intel平台的PCIE端口智能配置方法[J].机电工程技术,2019,48(8):123-124.
6杨花雨.海上视频监控系统组合相似度图像智能识别方法[J].舰船科学技术,2019,41(18):181-183. 被引量：1
7黄旭,王伟恒,吴双,胡伟.基于用电大数据的台户关系识别方法研究[J].供用电,2019,36(10):22-29. 被引量：14
8方梦瑞,夏华鵾,周礼赞,吕军.基于GoogLeNet的茶叶嫩芽生长状态智能识别[J].黄山学院学报,2019,21(5):17-21. 被引量：1
9董家仁,刘广聪.基于GRU-CTC混合模型的语音识别方法研究[J].现代计算机,2019,0(26):13-16. 被引量：2
10卓嘎,边巴旺堆.一种藏语连续语音声学特征参数提取算法研究[J].通信技术,2019,52(8):1865-1870. 被引量：3

自动化与仪器仪表

2019年第9期

浏览历史

内容加载中请稍等...

多媒体网络语音音调数据特征智能识别方法被引量：1

参考文献13

二级参考文献90

共引文献77

同被引文献6

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

多媒体网络语音音调数据特征智能识别方法 被引量：1

参考文献13

二级参考文献90

共引文献77

同被引文献6

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

多媒体网络语音音调数据特征智能识别方法被引量：1