期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于文档类密度的特征权重算法 被引量:1
1
作者 周鹏程 刘旭敏 徐维祥 《计算机应用研究》 CSCD 北大核心 2018年第11期3220-3223,共4页
面对海量数据的管理和分析,文本自动分类技术必不可少。特征权重计算作为文本分类过程的基础,起到了至关重要的作用。为了提升文本分类的质量,针对传统特征权重算法的不足,提出了基于文档类密度的特征权重算法(TF-IDCD)。其中,文档类密... 面对海量数据的管理和分析,文本自动分类技术必不可少。特征权重计算作为文本分类过程的基础,起到了至关重要的作用。为了提升文本分类的质量,针对传统特征权重算法的不足,提出了基于文档类密度的特征权重算法(TF-IDCD)。其中,文档类密度通过类内包含特征的文档数与类内总文档数的比值来度量。最后,在两个中文常见数据集上对五种算法进行实验对比。结果显示,提出的算法相比较其他特征权重算法在F1宏平均和F1微平均上都有较大的提升。 展开更多
关键词 特征权重 文档类密度 文本分 支持向量机
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部