期刊文献+

最大熵算法在汉语拼音标注中的研究与实现 被引量:1

The Research and Implementation of Maximum Entropy Algorithm in Phonetic Annotation
下载PDF
导出
摘要 经过对最大熵模型的研究,找到一种适合汉语拼音标注的最大熵模型算法.利用该算法解决了多音字单字成词的情况,从而使得所有包含多音字的词都是两字或多字词.使用该算法随机抽取"读者文摘"中的一篇文章进行标注实验,实验表明拼音标注正确率达到了96.6%以上. Through maximum entropy model study, a algorithm for maximum entropy model that is for pinyinmarked must be founded. Using the algorithm put an end to the situation that polyphone word is considered to be a word, so that all words with multiple pronunciations are two or more words. Using the algorithm mark the article in Reader's Digest, the results show that pinyin marked rate has reached 96.6 percent or more.
出处 《微电子学与计算机》 CSCD 北大核心 2012年第8期120-122,126,共4页 Microelectronics & Computer
基金 内蒙古工业大学科学研究项目(ZD201118)
关键词 最大熵模型 多音字 拼音标注 统计 特征 分词 maximum entropy model polyphony phonetic annotation statistics features segmentation
  • 相关文献

参考文献8

二级参考文献41

共引文献85

同被引文献2

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部