-
题名基于吴语和普通话混合的无差别语音识别
- 1
-
-
作者
孟青云
徐滨
沈宏涛
魏明霞
孟巧玲
-
机构
上海健康医学院医疗器械学院
上海理工大学健康科学与工程学院
杭州电子科技大学自动化学院
-
出处
《现代仪器与医疗》
CAS
2023年第3期18-24,共7页
-
基金
上海市2020年度“科技创新行动计划”生物医药科技支撑专项项目(20S31905400)。
-
文摘
针对使用方言的人数多,方言的识别效果较差问题,本文以上肢康复外骨骼的语音指令作为识别对象,使用Python的第三方库Keras和Librosa建立了一种DNN-HMM[深层神经网络(Deep Neural Network),隐马尔可夫模型(Hidden Markov Model)]模型,对吴语方言与普通话混合的语音样本进行无差别语音识别研究和实验。结果表明,本文研究的模型对于吴语方言与普通话混合的语音样本识别率能够达到81%,具有较高的识别精度;且对于单独的吴语方言识别率有65%左右。该研究结果可以进一步的应用于其他地区方言的语音识别,为智能康复外骨骼的控制研究和推广提供了理论和实验基础。
-
关键词
语音识别
吴语方言
语音控制信号
无差别
上肢外骨骼指令
PYTHON
-
Keywords
Speech recognition
Wu dialect
Voice control system
Undifferentiated
Upper limb exoskeleton command
Python
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
TP399
[自动化与计算机技术—计算机应用技术]
-
-
题名基于频域逐级回归的声学回声控制
被引量:4
- 2
-
-
作者
姜开宇
吴超
国雁萌
付强
颜永红
-
机构
中国科学院声学研究所
中科院语言声学与内容理解重点实验室
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2014年第12期2896-2901,共6页
-
基金
国家自然科学基金(10925419
90920302
+3 种基金
61072124
11074275
11161140319)
中国科学院战略性先导科技专项(XDA06030100)资助课题
-
文摘
传统声学回声控制算法一般采用基于随机梯度法更新的频域分块自适应滤波(PBFDAF)方法,但在以语音为主要回声信号的室内混响环境中,由于回声路径不稳定,往往收敛速度较慢,难以实现足够的回声抑制。该文提出一种基于频域逐级回归的声学回声控制算法。通过逐级回归分析远端信号和麦克风信号之间的线性关系,可以在保持较小的偏差的同时实现收敛较快的系统估计。同时,由于逐级分析了两通道间的短时相干性,因而该算法无需像常见方法一样,额外进行基于通道间相干函数的残余回声抑制或双讲检测,从而保持系统的紧凑性。若进一步假定近端背景噪声准平稳,则可利用基于近端信号非平稳程度的自适应平滑因子,在实现系统估计快速收敛的同时确保其稳定性。实验表明,该方法在常见的近端环境噪声水平下,在收敛速度和稳态误差上相对传统方法有显著优势,非常适合应用在室内远讲模式下的声学回声控制中。
-
关键词
语音信号处理:声学回声控制
逐级回归
声学回声抵消
声学回声抑制
-
Keywords
Speech signal processing
Acoustic echo control
Stage-wise regression
Acoustic echo cancellation
Acoustic echo suppression
-
分类号
TN912.3
[电子电信—通信与信息系统]
-