期刊文献+

基于NGram的无词典中文分词算法

下载PDF
导出
摘要 本文提出的无词典分词方法,仅依靠未标注语料里面包含的统计信息进行分词。这个方法分为两步:第一步通过统计得到NGram的统计信息;第二步根据这些NGram信息对新的语料进行分词,实验表明该方法在没有词典支持的情况下能够比较正确地分词,特别对于短文本有比较好的效果。
作者 周密 燕继坤
出处 《电信技术研究》 2002年第9期6-9,共4页 Research on telecommunication technology
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部