期刊文献+

无监督的动态分词方法 被引量:4

Unsupervised Dynamic Word Segmentation
下载PDF
导出
摘要 介绍了一种变长汉语语料自动分词方法,这种方法以信息理论中极限熵的概念为基础,运用汉字字串间最大似然度的概念,对汉语语料进行自动分词.讨论了这些方法的局限性,并列出了一些试验结果. A variable distance automatic word segmentation method to Chinese corpus is presented.It is based on the concept of limiting entropy in information theory, and utilizes the maximum likelihood between the strings of Chinese characters to do automatic Chinese word segmentation.A method of establishing unsupervised dynamic word segmentation dictionary is specially studied.The limitations of these methods are described.Some experimental results are also covered.
作者 高军 陈锡先
出处 《北京邮电大学学报》 EI CAS CSCD 北大核心 1997年第4期66-69,共4页 Journal of Beijing University of Posts and Telecommunications
关键词 信息处理 汉语语料库 自动分词 information processing Chinese text corpuse automatic word segmentation
  • 相关文献

参考文献4

  • 1万建成,中文信息学报,1995年,8卷,2期
  • 2刘源,信息处理用现代治语分词规范及自动分词方法,1994年
  • 3郭进,中文信息学报,1993年,7卷,1期
  • 4郭进,第一届全国计算机语言学联合学术会议,1991年

同被引文献88

引证文献4

二级引证文献109

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部