期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于样本不确定性和代表性相结合的可控主动学习算法研究 被引量:4
1
作者 胡正平 高文涛 万春艳 《燕山大学学报》 CAS 2009年第4期341-346,共6页
通过选取最有信息量的样本提交专家进行标注,主动学习算法可以有效地减少无效标注样本的工作量。在充分考虑位于分类边界的不确定样本和基于先验分布的具有代表性样本的基础上,本文构造了不确定性与代表性相结合的可控主动学习算法。首... 通过选取最有信息量的样本提交专家进行标注,主动学习算法可以有效地减少无效标注样本的工作量。在充分考虑位于分类边界的不确定样本和基于先验分布的具有代表性样本的基础上,本文构造了不确定性与代表性相结合的可控主动学习算法。首先利用样本的NN分布状况建立不确定性置信度模型,该思路不需要知道样本分布的具体类型和参数计算;然后在样本聚集度模型的基础上进行聚类,在此基础上建立代表性置信度模型。最后将不确定性置信度模型与代表性置信度模型进行综合,构造可控的主动学习策略,使得每次主动学习选择的样本更具有"价值"。在UCI机器学习数据库上的仿真实验结果表明本文的思路是合理可行的,在实验所用数据集上,当达到相同的目标正确率时,本文的方法比随机采样算法所需的样本数量少得多。 展开更多
关键词 可控主动学习 不确定性样本 样本先验分布 代表性样本
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部