期刊文献+

基于统计分词的中文文本分类系统 被引量:1

Chinese Text Classification System Based On Statistical Word Segmentation
下载PDF
导出
摘要 本文阐述了一个中文文本分类系统的设计和实现,对文本分类系统的系统结构、特征提取、训练算法、分类算法等进行了详细介绍,将基于统计的二元分词方法应用于中文文本分类,并提出了一种基于汉语中单字词及二字词统计特性的中文文本分类方法,实现了在事先没有词表的情况下,通过统计构造单字及二字词词表,从而对文本进行分词,然后再进行文本的分类。 In the article I described the designation and accomplishment of a Chinese text classifycation system,and introduced system construction? feature selection? training arithmetic and classification arithmetic,achieved the goal that comminute word on condition that having no vocabulary.
出处 《电脑知识与技术》 2005年第4期71-74,共4页 Computer Knowledge and Technology
关键词 分类系统 分词 中文文本分类 系统结构 特征提取 训练算法 详细介绍 分类算法 方法应用 分类方法 统计特性 词表 Chinese Text Classification Statistical Word Segmentation Feature selection
  • 相关文献

参考文献2

二级参考文献1

共引文献31

同被引文献4

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部