期刊文献+

基于词边界分类的中文分词方法 被引量:6

Chinese Word Segmentation Based on Word Boundary Decision
下载PDF
导出
摘要 该文研究和探讨一种新的分词方法:基于词边界分类的方法。该方法直接对字符与字符之间的边界进行分类,判断其是否为两个词之间的边界,从而达到分词的目的。相对于目前主流的基于字标注的分词方法,该方法的实现和训练更加快速、简单和直接,但却能获得比较接近的分词效果。更显著的是我们可以很容易地从词边界分类方法获得在线分词学习方法,该方法能够使我们的分词系统非常迅速地学习新的标注样本。 This paper focuses on the word boundary decision (WBD) approach to Chinese word segmentation. This new approach classifies a boundary between two characters into either a word boundary or not. Compared to the stat-of-the-arts methods based on character tagging, this approach is easier to implement and faster to execute, as well as a competitive performance. Particularly, the robust online learning module can be added to adapt a WBD system to new data quickly, enabling a reliable online Chinese segmentation system without domain or training data constraints.
出处 《中文信息学报》 CSCD 北大核心 2010年第1期3-7,共5页 Journal of Chinese Information Processing
基金 香港理工大学新教授启动资助项目(1-BBZM)
关键词 计算机应用 中文信息处理 中文分词 WBD方法 在线学习 computer application Chinese information processing Chinese word segmentation WBD approach online learning
  • 相关文献

参考文献4

二级参考文献36

共引文献351

同被引文献83

引证文献6

二级引证文献67

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部