期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
带有短语切分的中文文本分类方法(英文) 被引量:1
1
作者 田昕辉 李成基 《计算机技术与发展》 2010年第1期9-13,共5页
Internet文本信息量极速增加,在组织和处理这些文本数据时,文本分类技术显得尤为重要。利用统计学理论,特征提取和权重计算常常忽略了特征项之间的语法关系。文中提出了一种将短语切分与文本分类相结合的新方法。在经过TFIDF计算之后,... Internet文本信息量极速增加,在组织和处理这些文本数据时,文本分类技术显得尤为重要。利用统计学理论,特征提取和权重计算常常忽略了特征项之间的语法关系。文中提出了一种将短语切分与文本分类相结合的新方法。在经过TFIDF计算之后,在同一个短语中,特征项之间的关系被计算出来,然后调整权值向量,最后可以得到文本分类的正确率。同一般地文本分类方法相比,加入短语切分的文本分类方法的正确率平均提高了1.5%以上。 展开更多
关键词 特征提取 文本分类 短语切分 权值调整
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部