期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于主动学习的中文问题分类数据集构建 被引量:2
1
作者 邱锡鹏 缪有栋 黄萱菁 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2012年第5期125-128,共4页
为解决在开放领域问题回答问题中语料规模较小、难以满足问题分类训练需要的问题,用主动学习方法来构建中文问题分类数据集.根据主动学习的方法进行中文问题类别标注,并且通过主动式特征选择方法来提升性能.实验结果表明:在使用主动学... 为解决在开放领域问题回答问题中语料规模较小、难以满足问题分类训练需要的问题,用主动学习方法来构建中文问题分类数据集.根据主动学习的方法进行中文问题类别标注,并且通过主动式特征选择方法来提升性能.实验结果表明:在使用主动学习方法时可以快速收敛到最佳准确率(85%),在使用人工标注特征下特征集明显的减小.基于主动学习的标注方法在需要较小人工标注同时取得很好的分类性能,并且在一定程度上还可以明显提高问题分类的准确率. 展开更多
关键词 主动学习 PASSIVE Aggressive算法 特征选择 中文问题分类
下载PDF
一种适用于大规模网页分类的快速算法
2
作者 缪有栋 邱锡鹏 黄萱菁 《计算机应用与软件》 CSCD 北大核心 2012年第7期260-263,281,共5页
网页分类中存在类别多、训练样本少等问题,一般分类器训练应用效果不佳。为了解决这个问题,提出基于类中心的统计学习方法。在较少人工标注网页的训练集情况下,此方法能取得很好的分类性能并且大幅度加快训练时间,并可以通过加入网页层... 网页分类中存在类别多、训练样本少等问题,一般分类器训练应用效果不佳。为了解决这个问题,提出基于类中心的统计学习方法。在较少人工标注网页的训练集情况下,此方法能取得很好的分类性能并且大幅度加快训练时间,并可以通过加入网页层次目录信息提升推理速度。在第一届LSHTC评测数据集上进行实验,结果表明:基于类中心的统计学习方法拥有较快的训练以及推理速度,并且在正确率上有很强的竞争力。 展开更多
关键词 类中心 文本分类 统计学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部