期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
结合邻居辅助策略的两阶段层次文本分类模型
1
作者 古平 王春元 《计算机工程与应用》 CSCD 北大核心 2017年第9期97-102,共6页
传统两阶段层次文本分类模型(THTC模型)是一种解决大规模层次文本分类问题的有效方法,但该模型的分类准确率仍然不是很高。为了缓解这个问题,提出了结合邻居辅助策略的两阶段层次文本分类模型(THTC-NA模型)。THTC-NA模型由搜索阶段和分... 传统两阶段层次文本分类模型(THTC模型)是一种解决大规模层次文本分类问题的有效方法,但该模型的分类准确率仍然不是很高。为了缓解这个问题,提出了结合邻居辅助策略的两阶段层次文本分类模型(THTC-NA模型)。THTC-NA模型由搜索阶段和分类阶段组成。搜索阶段采用扁平策略从所有的叶子类别中选择与待分类文档最相关的k个类别作为候选类别集,这样可以大大减小分类阶段的搜索空间。分类阶段通过结合候选类别的祖先类别和兄弟类别的分类结果来帮助计算候选类别在分类阶段的结果。最后将搜索阶段的结果和分类阶段的结果融合起来共同决定待分类文档的目标类别。在数据集Newsgroups-18828上的实验表明,相对于THTC模型,THTCNA模型对提高层次文本分类准确率有很大的帮助。 展开更多
关键词 两阶段 层次文本分类 邻居辅助策略 类别层次
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部