-
题名联机手写体汉字识别后处理技术的研究
被引量:5
- 1
-
-
作者
徐志明
王晓龙
张凯
关毅
-
机构
哈尔滨工业大学计算机科学与技术系
香港理工大学计算机系
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
1999年第5期608-612,共5页
-
基金
国家"八六三"高技术计划基金
-
文摘
文中提出了一种规则和统计相结合的计算语言模型应用于联机手写体汉字识别后处理的技术,把基于统计的大词表Markov语言模型与语言规则量化模型,通过词网格技术集成在一个语言解码器.这种后处理方法由3个阶段组成:词网格生成、语言解码、基于Cache的自学习机制.语言解码器采用Viterbi搜索算法求解最优语句候选.该项技术已应用于HPC(手持机)手写电脑的联机汉字手写体识别系统中,汉字识别率为91.3%.
-
关键词
联机手写体汉字
汉字识别
后处理
计算机
-
Keywords
markov language model, word lattice, online handwritten Chinese character recognition
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
O235
[理学—运筹学与控制论]
-
-
题名语音识别中统计与规则结合的语言模型
被引量:6
- 2
-
-
作者
王轩
王晓龙
张凯
-
机构
哈尔滨工业大学计算机系
-
出处
《自动化学报》
EI
CSCD
北大核心
1999年第3期309-315,共7页
-
基金
国家"八六三"高技术计划
霍英东基金
-
文摘
在分析语音识别系统中,基于规则方法和统计方法的语言模型,提出了一种对规则进行量化的合成语言模型.该模型既避免了规则方法无法适应大规模真实文本处理的缺点,同时也提高了统计模型处理远距离约束关系和语言递归现象的能力.合成语言模型使涵盖6万词条的非特定人孤立词的语音识别系统的准确率比单独使用词的TRIGRAM模型提高了4.9%(男声)和3.5%(女声).
-
关键词
语音识别
统计语言模型
马尔可夫模型
词网格
-
Keywords
speech recognition,statistical language model,markov model,word lattice.
-
分类号
TN912.34
[电子电信—通信与信息系统]
-
-
题名基于HTK的语音识别语言模型设计及性能分析
被引量:2
- 3
-
-
作者
张强
陶宏才
-
机构
西南交通大学信息科学与技术学院
-
出处
《成都信息工程学院学报》
2009年第2期142-146,共5页
-
文摘
在大词汇连续语音识别系统中,统计语言模型是该系统非常重要的一部分,对整个识别系统的识别效果产生重要的影响。分析了统计语言模型原理和相关技术,基于HTK设计了适合大词汇连续语音识别系统的统计语言模型,同时对该语言模型的复杂度、精确识别率进行分析,指出了影响统计语言模型性能的相关因素。
-
关键词
语音识别
统计语言模型
HTK
N-GRAM模型
-
Keywords
speech recognition
statistical language model
HTK (Hidden markov model Toolkit)
n-Gram model
-
分类号
TP391.42
[自动化与计算机技术—计算机应用技术]
-
-
题名一种词义与词的混合语言模型及其应用
- 4
-
-
作者
侯珺
王作英
-
机构
清华大学电子工程系
-
出处
《中文信息学报》
CSCD
北大核心
2001年第6期7-12,共6页
-
基金
国家"九八五"重大项目 (人机自然语言交互技术 ) (985校 22攻关0 6 )
-
文摘
本文提出了一种基于词和词义混合的统计语言模型 ,研究了这个模型在词义标注和汉语普通话语音识别中的性能 ,并且与传统的词义模型和基于词的语言模型进行了对比。这个模型比传统词义模型更准确地描述了词义和词的关系 ,在词义标注中具有较小的混淆度 ;在汉语普通话连续音识别中 ,这个词义模型的性能优于基于词的三元文法模型 。
-
关键词
统计语言模型
词义模型
词义标注
语音识别
混淆度
存储空间
混合模型
-
Keywords
statistical language model
semantic and word based language model
semantics tagging
speech recognition
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
TN912.34
[电子电信—通信与信息系统]
-