期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
一种基于Tri-training的数据流集成分类算法 被引量:5
1
作者 胡学钢 马利伟 李培培 《数据采集与处理》 CSCD 北大核心 2017年第5期853-860,共8页
数据流分类是数据挖掘领域的重要研究任务之一,已有的数据流分类算法大多是在有标记数据集上进行训练,而实际应用领域数据流中有标记的数据数量极少。为解决这一问题,可通过人工标注的方式获取标记数据,但人工标注昂贵且耗时。考虑到未... 数据流分类是数据挖掘领域的重要研究任务之一,已有的数据流分类算法大多是在有标记数据集上进行训练,而实际应用领域数据流中有标记的数据数量极少。为解决这一问题,可通过人工标注的方式获取标记数据,但人工标注昂贵且耗时。考虑到未标记数据的数量极大且隐含大量信息,因此在保证精度的前提下,为利用这些未标记数据的信息,本文提出了一种基于Tri-training的数据流集成分类算法。该算法采用滑动窗口机制将数据流分块,在前k块含有未标记数据和标记数据的数据集上使用Tri-training训练基分类器,通过迭代的加权投票方式不断更新分类器直到所有未标记数据都被打上标记,并利用k个Tri-training集成模型对第k+1块数据进行预测,丢弃分类错误率高的分类器并在当前数据块上重建新分类器从而更新当前模型。在10个UCI数据集上的实验结果表明:与经典算法相比,本文提出的算法在含80%未标记数据的数据流上的分类精度有显著提高。 展开更多
关键词 数据流分类 TRI-TRAINING 未标记数据 集成 加权投票
下载PDF
基于懒惰学习的显露模式分类
2
作者 田卫东 温勇 《小型微型计算机系统》 CSCD 北大核心 2016年第4期753-757,共5页
现有基于显露模式的分类方法主要通过精简显露模式的数量以构建实用的轻量级分类器,然而对显露模式集的过度精简会损害数据信息的完整性,进而影响分类器性能.本文提出LLEP分类器,采用懒惰学习策略,将分类器的构建推迟到分类阶段进行,以... 现有基于显露模式的分类方法主要通过精简显露模式的数量以构建实用的轻量级分类器,然而对显露模式集的过度精简会损害数据信息的完整性,进而影响分类器性能.本文提出LLEP分类器,采用懒惰学习策略,将分类器的构建推迟到分类阶段进行,以在获知待分类事务信息的基础上,构建出更具针对性的局部分类器;对于显露模式的冗余消除问题,采用了等价类方法来快速划分包含重复信息的显露模式,以保留鲁棒性更优的显露模式参与分类.本文在UCI机器学习库27个数据集上的实验表明,LLEP分类器同11经典种分类器相比,在分类准确度上表现出了良好的性能. 展开更多
关键词 显露模式 等价类 懒惰学习 覆盖率 鲁棒性
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部