期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于PTM潜在Dirichlet分配的少量标记样本文本分类 被引量:2
1
作者 赵丽 齐兴斌 +1 位作者 李雪梅 田涛 《计算机应用研究》 CSCD 北大核心 2015年第5期1428-1432,1444,共6页
针对现实文本分类环境下通常仅有少量标记样本而影响分类精度的问题,提出了一种基于概率主题模型潜在Dirichlet分配的分类算法。借助标准词频逆文档频率函数将每个文档表示成术语权重向量;利用概率主题模型预处理以简化文档,并从文档中... 针对现实文本分类环境下通常仅有少量标记样本而影响分类精度的问题,提出了一种基于概率主题模型潜在Dirichlet分配的分类算法。借助标准词频逆文档频率函数将每个文档表示成术语权重向量;利用概率主题模型预处理以简化文档,并从文档中提取术语;再利用潜在Dirichlet分配模型进行关系学习,构建基于图的分类器完成分类。在公开的Reuters-21578资源库上的分类实验评估了该方法的有效性,相比分类效果较好的支持向量机,该方法在大部分情况下能够取得更高的分类精度。 展开更多
关键词 文本分类 术语提取 图构建 概率主题模型 少量标记样本 潜在Dirichlet分配
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部