期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
一种基于词树的高效解码算法
1
作者 张志强 张太红 董峦 《计算机技术与发展》 2017年第8期43-46,51,共5页
音字转换是汉语言信息处理的一个重要方面,在语音识别、汉语拼音输入等方面都有广泛的应用。为了找到一种行之有效的音字转换解码算法,在研究拼音分词与词树理论并分析词树求解过程的基础上,提出了基于语言模型实现音字转换的高效解码... 音字转换是汉语言信息处理的一个重要方面,在语音识别、汉语拼音输入等方面都有广泛的应用。为了找到一种行之有效的音字转换解码算法,在研究拼音分词与词树理论并分析词树求解过程的基础上,提出了基于语言模型实现音字转换的高效解码算法。该算法采用零概率重估、路径剪枝和多音字处理等多项技术,通过对词树进行的剪枝处理、对常用词的处理以及对解码过程中所产生多音字的处理,实现了普遍意义上的音字转换。为验证所提算法的有效性和可行性,基于新疆维吾尔自治区科技计划项目《多语种民族特色文化信息资源处理及共享服务平台》所提供的三组数据进行了对比实验。实验结果表明,提出的新算法取得了97.78%的转换准确率,优于其他传统算法。 展开更多
关键词 拼音分词 词树 语言模型 N-GRAM模型 音字转换
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部