基于动态时间规整的语音关键词检索算法被引量：2

A Keyword Search Algorithm for Speech Based on Dynamic Time Warping

下载PDF

导出

摘要提出一种通过声学模板匹配进行基于音频模板的语音关键词检索算法。该算法通过动态时间规整将音频模板与待检索语音进行匹配,获得音频模板所对应的关键词的出现位置。为了提升匹配质量,本文对音频模板进行筛选和预处理,获得较原始模板更具代表性的多模板作为匹配单元。所提出的音频模板筛选和预处理方法,与直接采用原始模板匹配相比,得到了相对55. 0%的提升。 The paper presents an audio query based keyword search algorithm by query matching.It matches audio queries with speech utterances by dynamic time warping algorithm to obtain the position of the keyword corresponding to audio queries.To improve the quality of matches,the paper implements query selection and query preprocessing to obtain a set of queries with better representation on keywords than original queries and use the set as matching units.By applying query selection and query preprocessing,the keyword search system achieves relative improvement of 55.0%.

作者张舸张鹏远刘建颜永红 ZHANG Ge;ZHANG Pengyuan;LIU Jian;YAN Yonghong(The Key Laboratory of Speech Acoustics and Content Understanding,Institute of Acoustics,Chinese Academy of Sciences,Beijing,100190,China;University of Chinese Academy of Sciences,Beijing,100190,China;Xinjiang Laboratory of Minority Speech and Language Information Processing,Xinjiang Technical Institute of Physics & Chemistry,Chinese Academy of Sciences,Urumqi,830011,China)

机构地区中国科学院声学研究所语言声学与内容理解重点实验室中国科学院大学中国科学院新疆理化技术研究所新疆民族语音言信息处理实验室

出处《网络新媒体技术》 2019年第1期18-23,共6页 Network New Media Technology

基金国家自然科学基金(U1536117 11590770-4) 国家重点研发计划重点专项(2016YFB0801203 2016YFB0801200) 新疆维吾尔自治区科技重大专项(2016A03007-1)

关键词关键词检索动态时间规整模板匹配模板预处理 Keyword search Dynamic time warping Query matching Query preprocessing

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

同被引文献8

1王朋,屈丹,张文林.基于ATWV优化和偏差补偿的词相关置信度规整[J].信息工程大学学报,2015,16(6):711-717. 被引量：1
2罗元,吴承军,张毅,黎小松,席兵.Mel频率下基于LPC的语音信号深度特征提取算法[J].重庆邮电大学学报（自然科学版）,2016,28(2):174-179. 被引量：12
3艾斯卡尔·肉孜,殷实,张之勇,王东,艾斯卡尔·艾木都拉,郑方.THUYG-20：免费的维吾尔语语音数据库[J].清华大学学报（自然科学版）,2017,57(2):182-187. 被引量：13
4李鹏,屈丹.基于得分归一化和系统融合的语音关键词检测方法[J].数据采集与处理,2017,32(2):346-353. 被引量：2
5孙晓杰.基于N-gram模型的哈萨克语语音识别及处理技术研究[J].信息记录材料,2018,19(9):97-99. 被引量：1
6沙尔旦尔·帕尔哈提,米吉提·阿不里米提,艾斯卡尔·艾木都拉.基于词干单元的维-哈语文本关键词提取研究[J].计算机工程与科学,2020,42(1):131-137. 被引量：4
7李娜,葛万成.语音关键词识别系统的模型训练及性能评价[J].信息通信,2020(3):8-10. 被引量：4
8赵泽宇,张卫强,刘加.采用注意力机制和多任务训练的端到端无语音识别关键词检索系统[J].信号处理,2020,36(6):839-851. 被引量：18

引证文献2

1张伟涛,米吉提·阿不里米提,郑方,艾斯卡尔·艾木都拉.基于深度神经网络的维语语音关键词检索[J].计算机时代,2021(11):21-24. 被引量：3
2张伟涛,米吉提·阿不里米提,郑方,艾斯卡尔·艾木都拉.基于深度神经网络的资源匮乏语言语音关键词检索[J].现代电子技术,2022,45(11):68-72. 被引量：5

二级引证文献7

1赵侦钧,王涛,贝太学,宋涛涛.基于LSTM和Conformer的下肢外骨骼步态预测方法[J].计算机时代,2022(8):1-5. 被引量：2
2宋阳,祝权洲.基于数据挖掘的数字图书馆移动通信资源检索方法[J].长江信息通信,2022,35(11):156-158. 被引量：4
3程鑫颐,刘海.基于3D技术的虚拟口译仿真系统设计[J].自动化与仪器仪表,2023(8):262-267.
4王国隽,金宗安.面向不确定数据的关键词检索方法优化分析[J].电子技术（上海）,2024,53(1):106-107.
5杨邦伟.基于多模态学习的图书馆图书资料关键词自动检索方法[J].信息与电脑,2024,36(4):251-253.
6孟巍,张东宁,郭腾炫,宗振国,孔鹏.基于改进关联规则算法的数据库关键词检索方法[J].移动信息,2024,46(4):274-276.
7张恒,拉巴顿珠,官政先,肖鑫.基于深度神经网络的藏语语音关键词检索方法[J].西藏科技,2024,46(6):73-80.

1张学帅,邹学强,胡琪,张鹏远.基于指纹权重的音频模板检索方法[J].中国科技论文,2018,13(20):2295-2300. 被引量：3
2陆成刚.长度分布悬殊的序列比对法[J].小型微型计算机系统,2019,40(1):169-175. 被引量：2
3王洪雁,邱贺磊,郑佳,裴炳南.光照变化下基于逆向稀疏表示的视觉跟踪方法[J].电子与信息学报,2019,41(3):632-639. 被引量：5
4孙鹏,刘东尧.某型火炮不同模块装药弹带挤进过程的数值模拟[J].兵器装备工程学报,2019,40(1):88-93. 被引量：3
5赵军,张晓峰,徐西林,王政春,房祥春,贺雪峰,谢欣昇,张骋.骨髓间充质干细胞定向分化治疗股骨头坏死:应用效果与评价[J].中国组织工程研究,2019,23(13):2127-2132. 被引量：9
6伍小雪,苟晓琴,石渝,张柯,钱媛,苏敏,黄俊琼.人用H7N9禽流感灭活疫苗免疫效果评价的Meta分析[J].预防医学,2019,31(3):265-270. 被引量：2
7丰奇昊,沈梦杰,杨琨,刘琪.寻找牙周膜干细胞特异性标志物的现状与展望[J].中国组织工程研究,2019,23(13):2113-2120. 被引量：1

网络新媒体技术

2019年第1期

浏览历史

内容加载中请稍等...

基于动态时间规整的语音关键词检索算法被引量：2

同被引文献8

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于动态时间规整的语音关键词检索算法 被引量：2

同被引文献8

引证文献2

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于动态时间规整的语音关键词检索算法被引量：2