-
题名基于加权有限状态机的动态匹配词图生成算法
被引量:4
- 1
-
-
作者
郭宇弘
黎塔
肖业鸣
潘接林
颜永红
-
机构
中国科学院语言声学与内容理解重点实验室
-
出处
《电子与信息学报》
EI
CSCD
北大核心
2014年第1期140-146,共7页
-
基金
国家自然科学基金(10925419
90920302
+8 种基金
61072124
11074275
11161140319
91120001
61271426)
中国科学院战略性先导科技专项(XDA06030100
XDA06030500)
国家863计划项目(2012AA012503)
中科院重点部署项目(KGZD-EW-103-2)资助课题
-
文摘
由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论上分析了WFST解码音素图和词图的可转换关系,然后提出了字典的动态音素匹配方法解决了WFST网络中词尾时间点对齐的问题,最后通过令牌传递的遍历方法生成了词图。同时,考虑到计算量优化,在令牌传递过程中引入了剪枝算法,使音素图转词图的耗时不到解码耗时的3%。得到的词图,不仅可以用于语言模型重打分,由于含有精确的词尾时间点,还可以直接应用到关键词检索系统中。实验结果表明,该文的词图生成算法具有较高的计算效率;和已有动态解码器的词图相比,词图中包含更多解码信息,在大词汇连续语音识别的重打分结果和关键词检索中都能取得更好的性能。
-
关键词
自动语音识别
加权有限状态机
词图生成
关键词检索
-
Keywords
Automatic speech recognition
Weighted Finite State Transducer (WFST)
Lattice generation
Keyword spotting
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名基于语言模型的调度语音智能识别研究
被引量:1
- 2
-
-
作者
杜凡
张敏
单祖植
杨再鹤
-
机构
云南电网有限责任公司
-
出处
《单片机与嵌入式系统应用》
2022年第2期55-59,共5页
-
文摘
针对调度语音识别过程中单遍解码词图生成算法所生成词图精度较差的问题,研究基于语言模型的调度语音智能识别方法。构建由训练过程和识别过程组成的调度语音智能识别模型,训练过程中该模型提取语音数据的语音向量序列构建声学子模型,利用语言子模型训练文本数据构建语音词图,识别过程中对声学子模型、语音词图以及发音词典实施语音解码与搜索获取最优词序列,基于最优词序列完成调度语音智能识别。测试结果显示研究方法所生成的词图精度较高,可准确识别调度语音。
-
关键词
语言模型
语音识别
语音解码
词图生成
-
Keywords
language model
speech recognition
speech decoding
word map generation
-
分类号
TM734
[电气工程—电力系统及自动化]
-