智能语音机器人前端语音处理系统的设计及实现被引量：2

Design and Implementation of Front End Speech Processing System for Intelligent Voice Robot

下载PDF

导出

摘要语音前端处理是智能语音机器人中一项关键的技术。传统的语音前端处理方法大多通过DSP来实现,大大增加系统复杂度和研发成本。基于WebRTC语音库,采用SRP-PHAT声音定位算法实现语音前端处理系统可以解决上述问题。该系统使用C++语言实现,可以直接部署在普通通用处理器或嵌入式ARM处理器中。经过实际功能及性能测试,该系统可以满足智能语音机器人对前端语音处理的要求。 Speech front-end processing is a key technology in intelligent speech robot.The traditional DSP implementation method will increase the system complexity and cost.This paper presents a front-end speech processing system based on WebRTC speech database and SRPPHAT sound localization algorithm.The system is implemented by C++voice and can be directly deployed in general purpose processor or embedded ARM processor.After the function and performance test,the system can meet the requirements of intelligent voice robot for front-end voice processing.

作者刘生 LIU Sheng(Nanjing Panda Electronic Equipment Co.,Ltd.,Nanjing 210000)

机构地区南京熊猫电子装备有限公司

出处《现代计算机》 2021年第3期106-110,共5页 Modern Computer

关键词前端语音 WebRTC 声源定位语音机器人 Front End Voice WebRTC Sound Source Localization Speech Robot

分类号 TN912.3 [电子电信—通信与信息系统] TP242.6 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献2

1李晓飞,刘宏.机器人听觉声源定位研究综述[J].智能系统学报,2012,7(1):9-20. 被引量：27
2尚永强,殷未来,姜双双,王金芳.基于相位调制特征的语音活动检测[J].吉林大学学报（信息科学版）,2016,34(1):29-33. 被引量：4

二级参考文献10

1王金芳,虢明.指数函数规整群时延的VAD特征研究[J].吉林大学学报（工学版）,2013,43(S1):435-439. 被引量：1
2MA Y, NISHIHARA A. Efficient Voice Activity Detection Algorithm Using Long-Term Spectral Flatness Measure [ J]. Eurasip Journal on Audio, Speech, and Music Processing, 2013( 1 ) : 1-18.
3DAVIS A, NORDHOLM S, TOGNERI R. Statistical Voice Activity Detection Using Low-Variance Spectrum Estimation and an Adaptive Threshold [ J]. IEEE Transactions on Audio Speech and Language Processing, 2006, 14 (2) : 412-424.
4NEMER E, GOUBRAN R, MAHMOUD S. Robust Voice Activity Detection Using Higher-Order Statistics in the LPC Residual Domain [J]. IEEE Transactions on Speech and Audio Processing, 2001, 9(3) : 217-231.
5MURTHY H A, YEGNANARYANA B. Formant Extraction from Group Delay Function [ J]. Speech Communication, 1991, 10(3) : 209-221.
6YEGNANARYANA B. Formant Extraction from Linear Prediction Phase Spectrum [ J ]. Journal of the Acoustical Society of America, 1978, 63(5): 1638-1640.
7WANG Jinfang, GUO Ming. Research on VAD Feature of Exponent Function Warping Group Delay Function [ J]. Journal of Jilin University : Engineering and Technology Edition, 2013, 43 (3) : 435-439.
8WU Z, XIAO X, CHENG E S, et al. Synthetic Speech Detection Using Temporal Modulation Feature [C]//2013 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Vancouver, Canada: [ s. n. ], 2013 : 7234-7238.
9MURTHY H A, YEGNANARAYANA B. Group Delay Functions and its Applications in Speech Technology [ J ]. Sadhana, 2011, 36(5) : 745-782.
10MURTHY H A, GADDE V. The Modified Group Delay Function and its Application to Phoneme Recognition [ C ]//2003 IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP). Hongkong, China: [ s. n. ], 2003 : 68-71.

共引文献28

1赵美娣,吴蓓珠.“大咨询”与“小咨询”简论[J].情报资料工作,2000,21(2):7-10. 被引量：8
2胡兰子,陈进军.传感器技术在机器人上的应用研究[J].软件,2012,33(7):164-167. 被引量：3
3汪明,陈建辉,王广龙,高凤岐.基于声传感器阵列的机器人语音定向技术研究[J].传感器与微系统,2013,32(9):58-61. 被引量：1
4吴玉秀,孟庆浩,曾明.基于声音的分布式多机器人相对定位[J].自动化学报,2014,40(5):798-809. 被引量：12
5孙昊,仲维灿,刘贺洋,祖丽楠.基于TDOA的声源定位模型中阵列位姿与定位误差之间关系的研究[J].河北工业大学学报,2014,43(5):8-14. 被引量：2
6何赛娟,陈华伟,尹明婕,丁少为.基于差分麦克风阵列和语音稀疏性的多源方位估计方法[J].数据采集与处理,2015,30(2):372-381. 被引量：7
7姜志飞,周风余,李富民,唐相猛.基于声源定位的机器人运动控制系统设计与实现[J].智慧工厂,2016,0(7):79-82. 被引量：1
8贺谦,冯建民,孙志强,韩凯.传声器阵列定位精度影响因素分析研究[J].工程与试验,2016,56(3):30-32. 被引量：2
9王硕朋,杨鹏,孙昊.基于声音位置指纹的室内声源定位方法[J].北京工业大学学报,2017,43(2):224-229. 被引量：10
10张峰,陈华伟,李妍文.基于多核最小二乘支持向量回归的TDOA-DOA映射方法[J].数据采集与处理,2017,32(3):540-549. 被引量：6

同被引文献44

1于翔宇.全息影像技术在数字媒体艺术设计中的应用研究[J].陶瓷科学与艺术,2022,56(3):36-38. 被引量：8
2Wenchang Zhang,Fuchun Sun,Hang Wu,Chuanqi Tan,Yuzhen Ma.Asynchronous Brain-Computer Interface Shared Control of Robotic Grasping[J].Tsinghua Science and Technology,2019,24(3):360-370. 被引量：8
3陈平形,吴伟,吴春旺,吴俊杰,唐玉华.量子计算的研究现状和发展动向[J].国防科技,2014,35(6):3-6. 被引量：3
4魏三强.VR/AR/MR技术在景区中的应用与前瞻[J].吉林师范大学学报（自然科学版）,2017,38(4):129-135. 被引量：12
5鲁馨.增强现实(AR)、虚拟现实(VR)和混合现实(MR)技术[J].办公自动化,2018,0(10):36-38. 被引量：35
6顾君忠.VR、AR和MR-挑战与机遇[J].计算机应用与软件,2018,35(3):1-7. 被引量：58
7王晖.计算机动画技术的研究与工程应用探讨[J].信息与电脑,2019,31(2):161-162. 被引量：1
8王一鸣,陈恳,萨阿卜杜萨拉木·艾海提拉木.基于SDBN和BLSTM注意力融合的端到端视听双模态语音识别[J].电信科学,2019,35(12):79-89. 被引量：2
9俞建强,颜雁,刘葳,孙一鸣.基于改进门控单元神经网络的语音识别声学模型研究[J].长春理工大学学报（自然科学版）,2020,43(1):104-111. 被引量：1
10方成.智能传感器技术发展信息处理功能的应用趋势[J].门窗,2019(24):291-291. 被引量：1

引证文献2

1李荣洋,万月亮,宁焕生.元宇宙驱动的新技术及应用[J].重庆邮电大学学报（自然科学版）,2023,35(4):571-583. 被引量：7
2张晋宁.基于神经网络的视觉语音识别系统[J].电声技术,2023,47(11):101-104.

二级引证文献7

1常进锋,唐娅秋.元宇宙赋能青少年铸牢中华民族共同体意识:价值、风险与实践路径——基于时空社会学视角[J].民族学论丛,2023(2):5-13. 被引量：5
2翟炫杰,胡振崑,张文正,夏淑红.计算机技术在元宇宙社交网络中的应用与发展[J].科技创新与应用,2023,13(32):10-13.
3杨俊生,李月玲.元宇宙赋能教育的应用领域与技术基础[J].教育评论,2024(2):9-15.
4金凌,曾婷,徐宏,陈仲华.基于6G通感算融合的沉浸式XR实践与展望[J].移动通信,2024,48(3):8-13.
5王睿佳.元宇宙视域下高校图书馆知识生态系统研究[J].漯河职业技术学院学报,2024,23(2):79-83. 被引量：1
6兰成东,温顺生,兰月连.乡村振兴战略下元宇宙赋能农业高质量发展——何以可能与何以可为[J].农业与技术,2024,44(9):157-162.
7邓淼磊,翟浩南,马米米,左志斌.元宇宙环境下的身份认证综述[J].计算机工程与应用,2024,60(11):1-16.

1丁玉柱,祁玉龙,黄超,魏绍东.声学成像技术在电力设备带电检测中的应用[J].大众用电,2020(12):25-25. 被引量：3
2防范化解重大风险综合提升应急能力[J].中国应急管理,2020(11):12-12.
3凌晓艳.生物心电信号前端处理系统设计[J].电子测试,2020,31(13):5-7. 被引量：3
4董文辉,于春雨,许磊.基于声指示的疏散引导技术研究[J].消防科学与技术,2020,39(12):1705-1708. 被引量：8
5杨九林,朱建公,廖璇,吴元伟,周军,廖晓波.直流无刷电机S曲线加减速控制算法及其实现[J].机床与液压,2020,48(23):160-165. 被引量：6
6王慧敏,朱天阳.基于“五感”体验的虚拟现实影视舱设计[J].文化学刊,2021(1):32-35. 被引量：2
7任秋兵,沈扬,李明超,孔锐,李明昊.水工建筑物安全监控深度分析模型及其优化研究[J].水利学报,2021,52(1):71-80. 被引量：27

现代计算机

2021年第3期

浏览历史

内容加载中请稍等...

智能语音机器人前端语音处理系统的设计及实现被引量：2

参考文献2

二级参考文献10

共引文献28

同被引文献44

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

智能语音机器人前端语音处理系统的设计及实现 被引量：2

参考文献2

二级参考文献10

共引文献28

同被引文献44

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

智能语音机器人前端语音处理系统的设计及实现被引量：2