期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
WFST解码器词图生成算法中的非活跃节点检测与内存优化
1
作者 丁佳伟 刘加 +3 位作者 张卫强 冯运波 刘利军 于乐 《中国科学院大学学报(中英文)》 CSCD 北大核心 2019年第1期109-114,共6页
解码器引擎是语音识别系统的核心模块,而基于加权有限状态机(WFST)的解码器则是解码器的一种典型形式。分析静态WFST解码器在实际应用中的资源占用问题,提出一种在解码和词图生成过程中通过检测非活跃节点动态回收系统资源的策略。最后,... 解码器引擎是语音识别系统的核心模块,而基于加权有限状态机(WFST)的解码器则是解码器的一种典型形式。分析静态WFST解码器在实际应用中的资源占用问题,提出一种在解码和词图生成过程中通过检测非活跃节点动态回收系统资源的策略。最后,在OpenKWS 15数据集上进行实验,证明该策略使解码器的内存消耗比不回收系统资源的解码器降低75%左右。 展开更多
关键词 语音识别解码器 加权有限状态机 工程应用 内存回收
下载PDF
基于WFST的俄语字音转换算法研究 被引量:3
2
作者 冯伟 易绵竹 马延周 《中文信息学报》 CSCD 北大核心 2018年第2期87-93,101,共8页
在俄语语音信息处理的资源建设中,字音转换技术起到了至关重要的作用。该文尝试对基于SAMPA的俄语音素集进行改进设计,使标音结果能够反映俄语单词的重音位置及元音弱化现象。依据改进的新音素集构建了包含20 000词的俄语发音词典。在... 在俄语语音信息处理的资源建设中,字音转换技术起到了至关重要的作用。该文尝试对基于SAMPA的俄语音素集进行改进设计,使标音结果能够反映俄语单词的重音位置及元音弱化现象。依据改进的新音素集构建了包含20 000词的俄语发音词典。在此基础上,实现了一种数据驱动的俄语字音转换算法,将加权有限状态转化器(WFST)应用于算法的对齐、建模和解码过程中。首先利用期望最大化算法以"多对多"的方式对俄语字音进行对齐,然后将对齐结果通过联合N-gram模型训练,并转化为WFST发音模型,最后通过WFST解码算法对任意单词的发音进行预测。交叉验证实验结果表明,平均词形正确率为62.9%,平均音素正确率为92.2%。 展开更多
关键词 字音转换 俄语 发音词典 加权有限状态转化器
下载PDF
WFST等望远镜对千新星的探测能力与观测策略研究
3
作者 王慧宇 俞继铭 +2 位作者 刘峥岩 赵文 陆由俊 《中国科学:物理学、力学、天文学》 CSCD 北大核心 2023年第5期105-123,共19页
本文模拟了红移z<0.2的双中子星并合源,并通过采用一个简单的千新星模型,计算了这些并合源所对应的千新星光变曲线.分别分析了大视场巡天望远镜(WFST)、大型综合巡天望远镜(LSST)和巡天空间望远镜(CSST)对这些模拟千新星的观测能力.... 本文模拟了红移z<0.2的双中子星并合源,并通过采用一个简单的千新星模型,计算了这些并合源所对应的千新星光变曲线.分别分析了大视场巡天望远镜(WFST)、大型综合巡天望远镜(LSST)和巡天空间望远镜(CSST)对这些模拟千新星的观测能力.发现WFST和LSST的最佳波段是g波段,它能观测到最多的源.此外,最佳双波段联合观测策略为:在最初的1.5天以内,通过g/r波段观测事件;在1.5天以后,通过r/i波段观测事件.对于CSST而言,通过采用深度无缝光谱来观测,发现GU波段能够在前1.5天观测到事件,GV波段能在前3.5天观测到事件,GI波段可观测事件的时间最长.同时我们发现,观测倾角对光变曲线的影响与质量比有关,对于质量比q<0.8的源,不同观测倾角对光变曲线的影响很小;但是对于质量比q>0.8的源,观测倾角对光变曲线的影响则非常明显. 展开更多
关键词 引力波 双中子星并合 千新星 wfst LSST CSST
原文传递
词类扩充方法在语音识别中的应用 被引量:3
4
作者 杨林国 《电子技术应用》 北大核心 2014年第6期123-125,129,共4页
针对当前基于N-gram的语言模型在特定领域的数据稀缺(如歌手名、音乐名等),提出了基于特定领域的词类扩充方法,从而有效解决特定领域词表即时扩充的问题。
关键词 自动语音识别 听写 语言模型 N-GRAM wfst CMN
下载PDF
基于加权有限状态机的动态匹配词图生成算法 被引量:4
5
作者 郭宇弘 黎塔 +2 位作者 肖业鸣 潘接林 颜永红 《电子与信息学报》 EI CSCD 北大核心 2014年第1期140-146,共7页
由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论... 由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论上分析了WFST解码音素图和词图的可转换关系,然后提出了字典的动态音素匹配方法解决了WFST网络中词尾时间点对齐的问题,最后通过令牌传递的遍历方法生成了词图。同时,考虑到计算量优化,在令牌传递过程中引入了剪枝算法,使音素图转词图的耗时不到解码耗时的3%。得到的词图,不仅可以用于语言模型重打分,由于含有精确的词尾时间点,还可以直接应用到关键词检索系统中。实验结果表明,该文的词图生成算法具有较高的计算效率;和已有动态解码器的词图相比,词图中包含更多解码信息,在大词汇连续语音识别的重打分结果和关键词检索中都能取得更好的性能。 展开更多
关键词 自动语音识别 加权有限状态机 词图生成 关键词检索
下载PDF
基于多模型融合的人名翻译系统 被引量:2
6
作者 庞薇 徐波 《中文信息学报》 CSCD 北大核心 2009年第1期44-49,共6页
该文提出了一种基于加权有限状态转化器(WFST)的多模型融合人名翻译框架。该框架以两个基于字符的转换模型和两个基于发音的转换模型为核心,通过加权有限状态转换器将多模型进行融合实现对人名的翻译。与单个模型相比,该文提出的方法的... 该文提出了一种基于加权有限状态转化器(WFST)的多模型融合人名翻译框架。该框架以两个基于字符的转换模型和两个基于发音的转换模型为核心,通过加权有限状态转换器将多模型进行融合实现对人名的翻译。与单个模型相比,该文提出的方法的优势在于通过从各种信息源得到的数据价值的最大化。实验结果表明,基于多模型融合方法的人名翻译的错误率比单一模型的人名翻译的错误率降低了7.14%。 展开更多
关键词 计算机应用 中文信息处理 多模型融合 音译 命名实体 加权有限状态转换器
下载PDF
低空间复杂度的加权有限状态转换器合成算法
7
作者 李伟 吴及 吕萍 《计算机应用研究》 CSCD 北大核心 2011年第8期2931-2934,共4页
利用加权有限状态转换器相关的合成操作,可以将语音识别需要的模型进行组合,便于识别中各种知识的综合利用,从而提升识别性能。传统合成算法在计算的同时存储了无效状态与状态转移。在进行词典与语言模型等合成操作时,算法需要1 GB甚至... 利用加权有限状态转换器相关的合成操作,可以将语音识别需要的模型进行组合,便于识别中各种知识的综合利用,从而提升识别性能。传统合成算法在计算的同时存储了无效状态与状态转移。在进行词典与语言模型等合成操作时,算法需要1 GB甚至更多内存保存无效信息,这直接导致了算法的高空间复杂度。为解决这一问题,提出同步裁剪合成算法(synchronized pruning composition algorithm,SPCA)。新算法对传统合成算法进行了改进,在合成的同时对无效信息进行及时的分析和去除。实验表明,与经典的合成算法相比,SPCA平均节约内存14.99%,所用最大内存节约25.72%,有效降低了合成的空间复杂度。 展开更多
关键词 加权有限状态转换器 合成 有向图 空间复杂度 语音识别
下载PDF
基于双向长短时记忆联结时序分类和加权有限状态转换器的端到端中文语音识别系统 被引量:16
8
作者 姚煜 RYAD Chellali 《计算机应用》 CSCD 北大核心 2018年第9期2495-2499,共5页
针对隐马尔可夫模型(HMM)在语音识别中存在的不合理条件假设,进一步研究循环神经网络的序列建模能力,提出了基于双向长短时记忆神经网络的声学模型构建方法,并将联结时序分类(CTC)训练准则成功地应用于该声学模型训练中,搭建出不依赖于... 针对隐马尔可夫模型(HMM)在语音识别中存在的不合理条件假设,进一步研究循环神经网络的序列建模能力,提出了基于双向长短时记忆神经网络的声学模型构建方法,并将联结时序分类(CTC)训练准则成功地应用于该声学模型训练中,搭建出不依赖于隐马尔可夫模型的端到端中文语音识别系统;同时设计了基于加权有限状态转换器(WFST)的语音解码方法,有效解决了发音词典和语言模型难以融入解码过程的问题。与传统GMM-HMM系统和混合DNN-HMM系统对比,实验结果显示该端到端系统不仅明显降低了识别错误率,而且大幅提高了语音解码速度,表明了该声学模型可以有效地增强模型区分度和优化系统结构。 展开更多
关键词 语音识别 长短时记忆神经网络 联结时序分类 加权有限状态转换器 端到端系统
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部