-
题名结合主动学习和密度峰值聚类的协同训练算法
被引量:10
- 1
-
-
作者
龚彦鹭
吕佳
-
机构
重庆师范大学计算机与信息科学学院
重庆师范大学重庆市数字农业服务工程技术研究中心
-
出处
《计算机应用》
CSCD
北大核心
2019年第8期2297-2301,共5页
-
基金
重庆市自然科学基金资助项目(cstc2014jcyjA40011)
重庆市教委科技项目(KJ1400513)
重庆师范大学科研项目(YKC17001,YKC19018)~~
-
文摘
针对协同训练算法对模糊度高的样本容易标记错误导致分类器精度降低和协同训练在迭代时选择加入的无标记样本隐含有用信息不够的问题,提出了一种结合主动学习和密度峰值聚类的协同训练算法。在每次迭代之前,先选择模糊度高的无标记样本主动标记后加入有标记样本集,然后利用密度峰值聚类对无标记样本聚类得到每个无标记样本的密度和相对距离。迭代时选择具有较高密度和相对距离较远的无标记样本交由朴素贝叶斯(NB)分类,反复上述过程直到满足终止条件。利用主动学习标记模糊度高的样本能够改善分类器误标记识别问题,利用密度峰值聚类能够选择出较好表现数据空间结构的样本。在UCI的8个数据集和Kaggle的pima数据集上的实验表明,与SSLNBCA算法相比,所提算法的准确率最高提升6.7个百分点,平均提升1.46个百分点。
-
关键词
协同训练
主动学习
密度峰值
朴素贝叶斯
视图
-
Keywords
co-training
active learning
density peak
Naive Bayes (NB)
view
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名结合半监督聚类和加权KNN的协同训练方法
被引量:8
- 2
-
-
作者
龚彦鹭
吕佳
-
机构
重庆师范大学计算机与信息科学学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2019年第22期114-118,共5页
-
基金
重庆市自然科学基金(No.cstc2014jcyjA40011)
重庆市教委科技项目(No.KJ1400513)
重庆师范大学科研项目(No.YKC17001)
-
文摘
针对协同训练方法在迭代时选择加入的无标记样本所隐含的有用信息不够,以及协同训练方法多个分类器标记不一致带来错误标记无标记样本的问题,提出了一种结合半监督聚类和加权K最近邻的协同训练方法。该方法在每次迭代过程中,先对训练集进行半监督聚类,选择隶属度高的无标记样本给朴素贝叶斯分类,再用加权K最近邻算法对多个分类器分类不一致的无标记样本重新分类。利用半监督聚类能够选择出较好表现数据空间结构的样本,而采用加权K最近邻算法为标记不一致的无标记样本重新标记能够解决标记不一致带来的分类精度降低问题。在UCI数据集上的对比实验验证了该算法的有效性。
-
关键词
协同训练
半监督聚类
加权K最近邻
视图
-
Keywords
co-training
semi-supervised clustering
weighted K-nearest neighbor
view
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-