期刊文献+

词汇搭配和用户模型在拼音输入法中的应用 被引量:6

Using Collocations and User Model in Pinyin Input Method
下载PDF
导出
摘要 中文输入法是中文信息处理的难题之一。随着互联网上中文用户的不断增加,中文输入法的重要性也变得日益突出。本文在对句子中长距离词汇依赖现象观察的基础上,抽取出语料库中的词汇搭配来获取长距离特征,并以此构建基于词汇搭配关系的拼音输入法系统;同时将词汇搭配的思想应用到拼音输入法的用户模型中,从而使我们的输入法系统能够辅助用户更加有效的输入。实验表明基于词汇搭配关系的改进方法对提高输入法的准确率有积极的作用。 Chinese input method is one of the key challenges in Chinese information processing. With the rapidly increase of the number of Chinese web surfers, the efficiency of the Chinese input method has becomes more and more important. Based on observations of the long-term dependencies in sentences, we implemented a collocation-based pinyin input system by using the collocations we extracted from large-scale corpus. This system has the ability to capture the long-term word collocations. The idea is further introduced into our personalization module of our Pinyin system to help the user input Chinese more efficiently. The experiment results show the methods we propose in this paper are promising.
出处 《中文信息学报》 CSCD 北大核心 2007年第4期105-110,共6页 Journal of Chinese Information Processing
关键词 计算机应用 中文信息处理 中文输入法 中文信息处理 统计语言模型 词汇搭配 长距离特征 用户模型 computer application chinese information processing Chinese input method Chinese information processing statistics language model collocations long-term dependence user model
  • 相关文献

参考文献5

二级参考文献19

  • 1王晓龙,王开铸,孙希文,王英伟.音字转换中的机器学习研究[J].计算机学报,1993,16(5):370-377. 被引量:7
  • 2[3]Han EH,Karypis G.Centroid-Based Document Classification:Analysis & Experimental Results[ EB/OL]. http://www -users. itlabs.umn. edu/~ karypis/publications/data - mining. html, 2000.
  • 3[4]Buzydlowski JW, Whie HD. Term Co-occurrence Analysis as an Interface for Digital Libraries[ A]. JCDL - The First ACM + IEEE Joint Conference on Digital Libraries[C]. 2001.
  • 4[5]Schuetze, Hinrich. Document information retrieval using global word co - occurrence patterns[ EB/OL]. http://www. delphion. com/details?pn10 = US05675819, 1997.
  • 5黄昌宁,语言文字应用,1997年,1期
  • 6王晓龙,计算机学报,1994年,17卷,2期
  • 7刘源,信息处理用现代汉语分词规范及自动分词方法,1994年
  • 8梁南元,中文信息学报,1990年,4卷,2期
  • 9陈原,汉语语言文字信息处理,1997年
  • 10Lee Chin Hui,Automatic Speech and Speaker Recognition:Advanced Topics,1996年

共引文献53

同被引文献49

引证文献6

二级引证文献9

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部