基于上下文敏感区块的模糊语音准确识别方法

Accurate recognition of fuzzy speech based on context sensitive block

下载PDF

导出

摘要为对语音信号进行良性切分,实现有目的性的声源重组,提出一种基于上下文敏感区块的模糊语音准确识别方法。在区块组织的频谱特征中,确定模糊语音的Gabor滤波传输条件,并对Delta描述算子进行定向计算,完成上下文敏感区块模糊语音的特征参数分析。在此基础上,利用深度识别神经网络,对模糊语音的特征线索进行有效分离,并对其识别端点进行逐一排查,完成新型语音准确识别方法的构建。对比实验数据显示,与基础语音识别方法相比,基于上下文敏感区块的模糊语音准确识别方法既可将最大信号切分率提升至95%左右,也能保持声源信号的最大深度不超过4.50×10^-7μm,达到重组声源的目的。 In order to segment speech signal benignly and achieve purposeful source reorganization,an accurate recognition method based on context-sensitive blocks for fuzzy speech is proposed. In the spectrum characteristics of the block organization,the Gabor filter transmission condition of the fuzzy speech is determined,and the Delta descriptor is calculated in orientation to complete the analysis of the characteristic parameters of the context-sensitive block fuzzy speech. On this basis,the deep recognition neural network is used to effectively separate the feature clues of the fuzzy speech,and the recognition endpoints are checked one by one to complete the construction of a new accurate speech recognition method. The experimental results show that compared with the basic speech recognition method,the context-sensitive block-based fuzzy speech recognition method can not only increase the maximum signal segmentation rate to about 95%,but also maintain the maximum depth of the source signal not more than 4.50*10^-7μm,so as to achieve the purpose of recombining the source.

作者全龙翔阿不力克木·吾甫尔马超武江波 QUAN Long⁃xiang;Abulikemu·Wupuer;MA Chao;WU Jiang⁃bo(State Grid Xinjiang Electeic Power Research Institute CO.,LTD,Urumqi 830000,China)

机构地区国网新疆电力有限公司电力科学研究院

出处《电子设计工程》 2020年第1期32-35,44,共5页 Electronic Design Engineering

基金江苏省科技厅项目(CGYKJQQ00000019)

关键词敏感区块模糊语音频谱特征 GABOR滤波 Delta描述子 sensitive blocks fuzzy speech spectrum features Gabor filtering Delta descriptor

分类号 TN912 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献16

1蒋兵,茅玉龙,曹俊纺.GRNN神经网络在雷达信号调制类型识别中的应用[J].电子设计工程,2018,26(16):111-115. 被引量：4
2蒋小华,张飙,吴名欢.嵌入式通信系统远程高速数据准确识别仿真[J].计算机仿真,2018,35(11):362-365. 被引量：6
3胡玉玺,李轶鲲,杨萍.基于上下文敏感的贝叶斯网络及方向关系的遥感图像检索[J].国土资源遥感,2017,29(3):70-76. 被引量：4
4贺杰,郭慧,李琳.基于视觉颜色对比敏感度模型的动态视频压缩预处理算法[J].计算机应用研究,2016,33(8):2552-2556. 被引量：3
5肖熙,周路.基于k均值和基于归一化类内方差的语音识别自适应聚类特征提取算法[J].清华大学学报（自然科学版）,2017,57(8):857-861. 被引量：6
6宋青松,田正鑫,孙文磊,吴小杰,安毅生.用于孤立数字语音识别的一种组合降维方法[J].西安交通大学学报,2016,50(6):42-46. 被引量：9
7刘金刚,周翊,马永保,刘宏清.用于自动语音识别系统的切换语音功率谱估计算法[J].计算机应用,2016,36(12):3369-3373. 被引量：4
8黄光许,田垚,康健,刘加,夏善红.低资源条件下基于i-vector特征的LSTM递归神经网络语音识别系统[J].计算机应用研究,2017,34(2):392-396. 被引量：21
9努尔麦麦提.尤鲁瓦斯,张力文,吾守尔.斯拉木.说话人自适应技术在维吾尔语语音识别中的应用研究[J].中文信息学报,2016,30(3):79-84. 被引量：4
10陈雷,杨俊安,王龙,李晋徽.连续语音识别中基于Dropout修正线性深度置信网络的声学模型[J].声学技术,2016,35(2):146-154. 被引量：4

二级参考文献94

1刘梓溪,张航.基于QPSO算法优化的RBF神经网络设计[J].中南大学学报（自然科学版）,2013,44(S1):27-30. 被引量：3
2汤韩杰,袁晓.子波分析中尺度与波长的关系[J].电子科技大学学报,2006,35(1):13-16. 被引量：6
3杨艺,李建勋,柯熙政.小波方差在信号特征提取中的应用[J].传感器世界,2006,12(1):33-35. 被引量：11
4陈理,袁晓,汤韩杰,帅晓飞.金融时间序列结构波动的子波变换分析[J].四川大学学报（自然科学版）,2007,44(2):293-298. 被引量：1
5Torres-Carrasquillo P A, Singer E, Kohler M A., et al. Approachesto language identification using gaussian mixture models andshifted delta cepstral features [C]//Proc ICSLP. 2002: 33-36.
6Mohamed A, Dahl G, Hinton G. Acoustic modeling using deepbelief networks [J]. IEEE Transactions on Audio, Speech, andLanguage Processing, 2012, 20(1): 14-22.
7Dahl G E, Sainath T N, Hinton G E. Improving deep neural networksfor lvcsr using rectified linear units and dropout[C]//ICASSP,2013.
8Hinton G, Srivastava N, Krizhevsky A, et al. Improving neuralnetworks by preventing co-adaptation of feature detectors[J]. TheComputing Research Repository, abs/1207.0580, 2012.
9Vinod Nair, Geoffrey G, Hinton. rectified linear units improverestricted boltzmann machines[C]//ICML-10.2010.
10Zeiler M D, Ranzato M, Monga R., et al. On Rectified LinearUnits for Speech Processing[C]//ICASSP, 2013.

共引文献86

1孟慧,陶为翔,吕俊杰.融合阈值分割和注意力网络的建筑阴影检测[J].计算机系统应用,2022,31(11):184-191.
2宋宇,李治霖,程超.基于CNN-BILSTM的工业控制系统ARP攻击入侵检测方法[J].计算机应用研究,2020,37(S02):242-244. 被引量：10
3王春荣,黄凌山,熊昌炯,夏尔冬,郑飞杰.基于STM32的智能答疑机器人设计[J].三明学院学报,2016,33(4):67-71. 被引量：3
4彭炜明,宋继华,王宁.汉语析句的形式化问题[J].中文信息学报,2016,30(3):30-35.
5林麒麟,包广清,宋旭辉,张宝强,陶佳.基于语音识别的电梯辅助控制系统设计[J].计算机与数字工程,2017,45(3):544-548. 被引量：11
6梁敏健,崔啸宇,宋青松,赵祥模.基于HOG-Gabor特征融合与Softmax分类器的交通标志识别方法[J].交通运输工程学报,2017,17(3):151-158. 被引量：31
7夏明,蒋仁钢.城际铁路列控系统车-地通信延迟时间估计的深度学习算法研究[J].铁路计算机应用,2018,27(1):55-58. 被引量：3
8童新,姚莉,倪波.基于物联网的Cortex-A53智能云镜系统的设计与实现[J].物联网技术,2018,8(5):48-50. 被引量：3
9吴楠,冯祖勇,韦高梧.智能语音识别系统中噪声估计算法的研究和改进[J].广东工业大学学报,2018,35(3):43-46. 被引量：3
10毛维,曾庆宁,龙超.双微阵列语音增强算法在说话人识别中的应用[J].声学技术,2018,37(3):253-260. 被引量：2

1贺胜晖,李灵巧,刘彤,刘振丙,杨辉华.柑橘黄龙病近红外光谱检测模型[J].桂林电子科技大学学报,2019,39(4):307-311. 被引量：1
2刘彩玲,岳荷荷.基于局部金字塔描述算子的杂草种子识别[J].物联网技术,2019,9(11):80-82.
3郭春花.化纤制造跨入机器智能时代:国内首个“化纤工业智能体解决方案”发布[J].纺织服装周刊,2019,0(40):26-26.
4张雪玉.民族地区职业院校政行企校村合作共赢教育扶贫研究与实践[J].中国多媒体与网络教学学报（电子版）,2018,0(7Z):127-128.
5刘恩泽,吴文福.基于综合指标品质评价算法的单色水果生长状态检测互联网架构[J].吉林大学学报（工学版）,2019,49(6):2019-2026. 被引量：2
6严利民,张婷婷.一种改进A-KAZE算法的特征点匹配方法[J].微电子学与计算机,2019,36(12):64-68. 被引量：2
7中科院金属所负责研制的全海深载人潜水器钛合金载人舱通过验收[J].特种铸造及有色合金,2019,39(12):1392-1392.
8王宏,武永福,刘倩倩,翟浩.推土机转向系统常见故障的诊断[J].建筑机械化,2019,40(12):71-73.
9林永昌,张强禄,陈建立.汉代岭南铁器的传播与运输方式：以墓葬随葬铁器的空间分析为视角[J].南方文物,2019,0(3):122-135. 被引量：1
10周子龙,程瑞山,陈连军,周静,蔡鑫.一种拾取含噪声发射信号到时的改进联合方法（英文）[J].Journal of Central South University,2019,26(10):2878-2890. 被引量：4

电子设计工程

2020年第1期

浏览历史

内容加载中请稍等...

基于上下文敏感区块的模糊语音准确识别方法

参考文献16

二级参考文献94

共引文献86

相关作者

相关机构

相关主题

浏览历史