期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种联合语种识别的新型大词汇量连续语音识别算法
被引量:
10
1
作者
单煜翔
邓妍
刘加
《自动化学报》
EI
CSCD
北大核心
2012年第3期366-374,共9页
提出了一种联合语种识别的新型大词汇量连续语音识别(Large vocabulary continuo us speech recognition,LVCSR)算法,并构建了实时处理系统.该算法能够充分利用语音解码过程中收集的音素识别假设,在识别语音内容的同时识别语种类别.该...
提出了一种联合语种识别的新型大词汇量连续语音识别(Large vocabulary continuo us speech recognition,LVCSR)算法,并构建了实时处理系统.该算法能够充分利用语音解码过程中收集的音素识别假设,在识别语音内容的同时识别语种类别.该系统可以应用于多语种环境,不仅可以以更小的系统整体计算开销替代独立的语种识别模块,更能有效应对在同一段语音中混有非目标语种的情况,极大地减少由非目标语种引入的无意义识别错误,避免错误积累对后续识别过程的误导.为将语音内容识别和语种识别紧密整合在一个统一语音识别解码过程中,本文提出了三种不同的算法对解码产生的音素格结构进行调整(重构):一方面去除语音识别中由发音字典和语言模型引入的特定目标语种偏置,另一方面在音素格中包含更加丰富的音素识别假设.实验证明,音素格重构算法可有效提高联合识别中语种识别的精度.在汉语为目标语种、汉英混杂的电话对话语音库上测试表明,本文提出的联合识别算法将集外语种引起的无意义识别错误减少了91.76%,纯汉字识别错误率为54.98%.
展开更多
关键词
语音识别
语种识别
集外语种问题
音素格重构
下载PDF
职称材料
基于扩展N元文法模型的快速语言模型预测算法
被引量:
6
2
作者
单煜翔
陈谐
+1 位作者
史永哲
刘加
《自动化学报》
EI
CSCD
北大核心
2012年第10期1618-1626,共9页
针对基于动态解码网络的大词汇量连续语音识别器,本文提出了一种采用扩展N元文法模型进行快速语言模型(Language model,LM)预测的方法.扩展N元文法模型统一了语言模型和语言模型预测树的表示与分数计算方法,从而大大简化了解码器的实现...
针对基于动态解码网络的大词汇量连续语音识别器,本文提出了一种采用扩展N元文法模型进行快速语言模型(Language model,LM)预测的方法.扩展N元文法模型统一了语言模型和语言模型预测树的表示与分数计算方法,从而大大简化了解码器的实现,极大地提升了语言模型预测的速度,使得高阶语言模型预测成为可能.扩展N元文法模型在解码之前离线生成,生成过程利用了N元文法的稀疏性加速计算过程,并采用了词尾节点前推和分数量化的方法压缩模型存储空间大小.实验表明,相比于采用动态规划在解码过程中实时计算语言模型预测分数的传统方法,本文提出的方法在相同的字错误率下使得整个识别系统识别速率提升了5~9倍,并且采用高阶语言模型预测可获得比低阶预测更优的解码速度与精度.
展开更多
关键词
语音识别
语言模型预测
N元文法模型
解码
下载PDF
职称材料
Rave Report中文打印时乱码的解决方案
被引量:
1
3
作者
单煜翔
刘玉
《计算机应用与软件》
CSCD
北大核心
2006年第9期73-75,共3页
Delphi7自带的RaveReport是一套功能强大、易于设计与维护的报表组件,但其对中文不支持,打印时存在乱码,给开发与应用带来极大不便。笔者通过对Rave源代码的研究,发现只需对其源码稍做修改就可以解决报表打印时的乱码问题,文中详细讨论...
Delphi7自带的RaveReport是一套功能强大、易于设计与维护的报表组件,但其对中文不支持,打印时存在乱码,给开发与应用带来极大不便。笔者通过对Rave源代码的研究,发现只需对其源码稍做修改就可以解决报表打印时的乱码问题,文中详细讨论了乱码的产生原因与具体的解决方案。
展开更多
关键词
RAVE
报表
乱码
下载PDF
职称材料
大规模词表连续语音识别引擎紧致动态网络的构建
被引量:
1
4
作者
刘加
陈谐
+1 位作者
单煜翔
史永哲
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2012年第11期1530-1534,共5页
大规模词表连续语音识别系统需要综合各种知识源,如声学模型、语言模型、发音词典等。其中,解码网络是识别引擎的基础,对提高解码器的性能有着至关重要的影响。有效综合这些知识源,构建一个紧致的解码网络,可以有效减少识别时的搜索空...
大规模词表连续语音识别系统需要综合各种知识源,如声学模型、语言模型、发音词典等。其中,解码网络是识别引擎的基础,对提高解码器的性能有着至关重要的影响。有效综合这些知识源,构建一个紧致的解码网络,可以有效减少识别时的搜索空间和重复计算,显著提高解码速度。该文针对语音识别的动态解码网络进行研究,提出了词标志(word end,WE)节点前推算法,结合传统的前后向合并算法,实现了一个基于隐Markov模型状态为网络节点的紧凑动态解码网络。优化后的解码网络的节点数和边数分别是线性词典解码网络的1/4,是开源工具包HDecode的1/2;需要计算语言模型预测分数的节点数为HDecode的1/2。该声学模型基于三音子建模,可方便地移植到其他语种上。
展开更多
关键词
语音识别
解码网络
声学模型
语言模型预测
原文传递
题名
一种联合语种识别的新型大词汇量连续语音识别算法
被引量:
10
1
作者
单煜翔
邓妍
刘加
机构
清华大学电子工程系清华信息科学与技术国家实验室
出处
《自动化学报》
EI
CSCD
北大核心
2012年第3期366-374,共9页
基金
高技术研究发展计划(国家863计划)(2008AA02Z414
2008AA040201)
+2 种基金
国家自然科学基金(60776800
61005019)
国家自然科学基金委员会与香港研究资助局联合科研基金(60931160443)资助~~
文摘
提出了一种联合语种识别的新型大词汇量连续语音识别(Large vocabulary continuo us speech recognition,LVCSR)算法,并构建了实时处理系统.该算法能够充分利用语音解码过程中收集的音素识别假设,在识别语音内容的同时识别语种类别.该系统可以应用于多语种环境,不仅可以以更小的系统整体计算开销替代独立的语种识别模块,更能有效应对在同一段语音中混有非目标语种的情况,极大地减少由非目标语种引入的无意义识别错误,避免错误积累对后续识别过程的误导.为将语音内容识别和语种识别紧密整合在一个统一语音识别解码过程中,本文提出了三种不同的算法对解码产生的音素格结构进行调整(重构):一方面去除语音识别中由发音字典和语言模型引入的特定目标语种偏置,另一方面在音素格中包含更加丰富的音素识别假设.实验证明,音素格重构算法可有效提高联合识别中语种识别的精度.在汉语为目标语种、汉英混杂的电话对话语音库上测试表明,本文提出的联合识别算法将集外语种引起的无意义识别错误减少了91.76%,纯汉字识别错误率为54.98%.
关键词
语音识别
语种识别
集外语种问题
音素格重构
Keywords
Speech recognition, language recognition, out-of-language problem, phone lattice reconstruction
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于扩展N元文法模型的快速语言模型预测算法
被引量:
6
2
作者
单煜翔
陈谐
史永哲
刘加
机构
清华大学电子工程系清华信息科学与技术国家实验室
出处
《自动化学报》
EI
CSCD
北大核心
2012年第10期1618-1626,共9页
基金
国家高技术研究发展计划(863计划)(2008AA040201)
国家自然科学基金(90920302)
+1 种基金
国家科技支撑计划(2009BAH41B01)
国家自然科学基金委员会与香港研究资助局联合科研基金(60931160443)资助~~
文摘
针对基于动态解码网络的大词汇量连续语音识别器,本文提出了一种采用扩展N元文法模型进行快速语言模型(Language model,LM)预测的方法.扩展N元文法模型统一了语言模型和语言模型预测树的表示与分数计算方法,从而大大简化了解码器的实现,极大地提升了语言模型预测的速度,使得高阶语言模型预测成为可能.扩展N元文法模型在解码之前离线生成,生成过程利用了N元文法的稀疏性加速计算过程,并采用了词尾节点前推和分数量化的方法压缩模型存储空间大小.实验表明,相比于采用动态规划在解码过程中实时计算语言模型预测分数的传统方法,本文提出的方法在相同的字错误率下使得整个识别系统识别速率提升了5~9倍,并且采用高阶语言模型预测可获得比低阶预测更优的解码速度与精度.
关键词
语音识别
语言模型预测
N元文法模型
解码
Keywords
Speech recognition, language model look-ahead, N-gram, decoding
分类号
TN912.34 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
Rave Report中文打印时乱码的解决方案
被引量:
1
3
作者
单煜翔
刘玉
机构
华中科技大学电子与信息工程系
出处
《计算机应用与软件》
CSCD
北大核心
2006年第9期73-75,共3页
文摘
Delphi7自带的RaveReport是一套功能强大、易于设计与维护的报表组件,但其对中文不支持,打印时存在乱码,给开发与应用带来极大不便。笔者通过对Rave源代码的研究,发现只需对其源码稍做修改就可以解决报表打印时的乱码问题,文中详细讨论了乱码的产生原因与具体的解决方案。
关键词
RAVE
报表
乱码
Keywords
Rave Report Confused-code
分类号
TP317 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
大规模词表连续语音识别引擎紧致动态网络的构建
被引量:
1
4
作者
刘加
陈谐
单煜翔
史永哲
机构
清华大学电子工程系
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2012年第11期1530-1534,共5页
基金
国家自然科学基金委员会与香港研究资助局联合科研基金资助项目(60931160443)
国家自然科学基金项目(90920302
+2 种基金
61005019)
国家"八六三"高技术项目(2008AA040201)
国家科技支撑计划资助项目(2009BAH41B01)
文摘
大规模词表连续语音识别系统需要综合各种知识源,如声学模型、语言模型、发音词典等。其中,解码网络是识别引擎的基础,对提高解码器的性能有着至关重要的影响。有效综合这些知识源,构建一个紧致的解码网络,可以有效减少识别时的搜索空间和重复计算,显著提高解码速度。该文针对语音识别的动态解码网络进行研究,提出了词标志(word end,WE)节点前推算法,结合传统的前后向合并算法,实现了一个基于隐Markov模型状态为网络节点的紧凑动态解码网络。优化后的解码网络的节点数和边数分别是线性词典解码网络的1/4,是开源工具包HDecode的1/2;需要计算语言模型预测分数的节点数为HDecode的1/2。该声学模型基于三音子建模,可方便地移植到其他语种上。
关键词
语音识别
解码网络
声学模型
语言模型预测
Keywords
speech recognition
decoder network
acoustic model
language model look-ahead
分类号
TN912.34 [电子电信—通信与信息系统]
原文传递
题名
作者
出处
发文年
被引量
操作
1
一种联合语种识别的新型大词汇量连续语音识别算法
单煜翔
邓妍
刘加
《自动化学报》
EI
CSCD
北大核心
2012
10
下载PDF
职称材料
2
基于扩展N元文法模型的快速语言模型预测算法
单煜翔
陈谐
史永哲
刘加
《自动化学报》
EI
CSCD
北大核心
2012
6
下载PDF
职称材料
3
Rave Report中文打印时乱码的解决方案
单煜翔
刘玉
《计算机应用与软件》
CSCD
北大核心
2006
1
下载PDF
职称材料
4
大规模词表连续语音识别引擎紧致动态网络的构建
刘加
陈谐
单煜翔
史永哲
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2012
1
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部