期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
一种联合语种识别的新型大词汇量连续语音识别算法 被引量:10
1
作者 单煜翔 邓妍 刘加 《自动化学报》 EI CSCD 北大核心 2012年第3期366-374,共9页
提出了一种联合语种识别的新型大词汇量连续语音识别(Large vocabulary continuo us speech recognition,LVCSR)算法,并构建了实时处理系统.该算法能够充分利用语音解码过程中收集的音素识别假设,在识别语音内容的同时识别语种类别.该... 提出了一种联合语种识别的新型大词汇量连续语音识别(Large vocabulary continuo us speech recognition,LVCSR)算法,并构建了实时处理系统.该算法能够充分利用语音解码过程中收集的音素识别假设,在识别语音内容的同时识别语种类别.该系统可以应用于多语种环境,不仅可以以更小的系统整体计算开销替代独立的语种识别模块,更能有效应对在同一段语音中混有非目标语种的情况,极大地减少由非目标语种引入的无意义识别错误,避免错误积累对后续识别过程的误导.为将语音内容识别和语种识别紧密整合在一个统一语音识别解码过程中,本文提出了三种不同的算法对解码产生的音素格结构进行调整(重构):一方面去除语音识别中由发音字典和语言模型引入的特定目标语种偏置,另一方面在音素格中包含更加丰富的音素识别假设.实验证明,音素格重构算法可有效提高联合识别中语种识别的精度.在汉语为目标语种、汉英混杂的电话对话语音库上测试表明,本文提出的联合识别算法将集外语种引起的无意义识别错误减少了91.76%,纯汉字识别错误率为54.98%. 展开更多
关键词 语音识别 语种识别 集外语种问题 音素格重构
下载PDF
基于扩展N元文法模型的快速语言模型预测算法 被引量:6
2
作者 单煜翔 陈谐 +1 位作者 史永哲 刘加 《自动化学报》 EI CSCD 北大核心 2012年第10期1618-1626,共9页
针对基于动态解码网络的大词汇量连续语音识别器,本文提出了一种采用扩展N元文法模型进行快速语言模型(Language model,LM)预测的方法.扩展N元文法模型统一了语言模型和语言模型预测树的表示与分数计算方法,从而大大简化了解码器的实现... 针对基于动态解码网络的大词汇量连续语音识别器,本文提出了一种采用扩展N元文法模型进行快速语言模型(Language model,LM)预测的方法.扩展N元文法模型统一了语言模型和语言模型预测树的表示与分数计算方法,从而大大简化了解码器的实现,极大地提升了语言模型预测的速度,使得高阶语言模型预测成为可能.扩展N元文法模型在解码之前离线生成,生成过程利用了N元文法的稀疏性加速计算过程,并采用了词尾节点前推和分数量化的方法压缩模型存储空间大小.实验表明,相比于采用动态规划在解码过程中实时计算语言模型预测分数的传统方法,本文提出的方法在相同的字错误率下使得整个识别系统识别速率提升了5~9倍,并且采用高阶语言模型预测可获得比低阶预测更优的解码速度与精度. 展开更多
关键词 语音识别 语言模型预测 N元文法模型 解码
下载PDF
Rave Report中文打印时乱码的解决方案 被引量:1
3
作者 单煜翔 刘玉 《计算机应用与软件》 CSCD 北大核心 2006年第9期73-75,共3页
Delphi7自带的RaveReport是一套功能强大、易于设计与维护的报表组件,但其对中文不支持,打印时存在乱码,给开发与应用带来极大不便。笔者通过对Rave源代码的研究,发现只需对其源码稍做修改就可以解决报表打印时的乱码问题,文中详细讨论... Delphi7自带的RaveReport是一套功能强大、易于设计与维护的报表组件,但其对中文不支持,打印时存在乱码,给开发与应用带来极大不便。笔者通过对Rave源代码的研究,发现只需对其源码稍做修改就可以解决报表打印时的乱码问题,文中详细讨论了乱码的产生原因与具体的解决方案。 展开更多
关键词 RAVE 报表 乱码
下载PDF
大规模词表连续语音识别引擎紧致动态网络的构建 被引量:1
4
作者 刘加 陈谐 +1 位作者 单煜翔 史永哲 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2012年第11期1530-1534,共5页
大规模词表连续语音识别系统需要综合各种知识源,如声学模型、语言模型、发音词典等。其中,解码网络是识别引擎的基础,对提高解码器的性能有着至关重要的影响。有效综合这些知识源,构建一个紧致的解码网络,可以有效减少识别时的搜索空... 大规模词表连续语音识别系统需要综合各种知识源,如声学模型、语言模型、发音词典等。其中,解码网络是识别引擎的基础,对提高解码器的性能有着至关重要的影响。有效综合这些知识源,构建一个紧致的解码网络,可以有效减少识别时的搜索空间和重复计算,显著提高解码速度。该文针对语音识别的动态解码网络进行研究,提出了词标志(word end,WE)节点前推算法,结合传统的前后向合并算法,实现了一个基于隐Markov模型状态为网络节点的紧凑动态解码网络。优化后的解码网络的节点数和边数分别是线性词典解码网络的1/4,是开源工具包HDecode的1/2;需要计算语言模型预测分数的节点数为HDecode的1/2。该声学模型基于三音子建模,可方便地移植到其他语种上。 展开更多
关键词 语音识别 解码网络 声学模型 语言模型预测
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部