期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于Ngram信息的中文文档分类研究 被引量:23
1
作者 周水庚 关佶红 +1 位作者 俞红奇 胡运发 《中文信息学报》 CSCD 北大核心 2001年第1期34-39,共6页
传统文档分类系统都是基于文档的词属性 ,分类过程需要庞大的词典支持和复杂的切词处理。本文研究基于N gram信息的中文文档分类 ,使中文文档分类系统摆脱对词典和切词处理的依赖 ,从而实现中文文档分类的领域无关性和时间无关性。利用... 传统文档分类系统都是基于文档的词属性 ,分类过程需要庞大的词典支持和复杂的切词处理。本文研究基于N gram信息的中文文档分类 ,使中文文档分类系统摆脱对词典和切词处理的依赖 ,从而实现中文文档分类的领域无关性和时间无关性。利用kNN分类方法 ,实现了一个基于N gram信息的中文文档分类系统。 展开更多
关键词 N-GRAM信息 选择 KNN法 中文文档分类系统 领域无关性 时间无关
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部