-
题名中文文本分类器的设计
被引量:10
- 1
-
-
作者
陆建江
张文献
-
机构
解放军理工大学通信工程学院
解放军理工大学理学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2002年第15期49-51,共3页
-
基金
国家自然科学基金重点项目(编号:69931040)
-
文摘
文本分类是指在给定分类体系下,根据文本的内容自动确定文本类型的过程。文章应用球形的k-均值算法确定每个文本的类标签,并通过Boosting算法构建分类器。构建的分类器具有以下特点:分类器的设计针对未知类标签的语料库,实用性好;分类器能随着语料库中文本的变化而增加新的类,具有很好的可扩展性;分类器基于Boosting算法,具有很好的分类精度。
-
关键词
中文文本分类器
设计
机器学习
BOOSTING算法
自然语言处理
-
Keywords
text categorization,Chinese text,machine learning,spherical k-means algorithm,Boosting algorithm
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-