针对数据流分类,时间自适应支持向量机(Time Adaptive Support Vector Machine,TA-SVM)及其改进方法通过在核空间上协同求解多个子分类器而取得了较好的性能,其原理是在局部优化的同时兼顾全局优化,强制子分类器序列稳定地变化。然而在...针对数据流分类,时间自适应支持向量机(Time Adaptive Support Vector Machine,TA-SVM)及其改进方法通过在核空间上协同求解多个子分类器而取得了较好的性能,其原理是在局部优化的同时兼顾全局优化,强制子分类器序列稳定地变化。然而在很多应用场景中,由于数据具有一定的随机性,难以确保概念模型以不变的节奏漂移,因而TA-SVM分类模型中应充分考虑子分类器序列的不稳定性。为了放松TA-SVM方法对子分类器序列的约束,使子分类器法向量、偏置量的变化具有更大的灵活性,提出了柔性漂移支持向量机(Flexible Drift Support Vector Machines,FD-SVM),在继承TA-SVM方法协同求解思想的基础上,灵活对待子分类器变化。实验结果表明,FD-SVM方法能有效提升对非静态数据的分类性能。展开更多
时间自适应支持向量机(TA-SVM)方法在处理非静态数据集时表现出良好的性能,但仅根据邻接子分类器相似而获得的相关信息并不充分,由此可能会导致训练所得模型不可靠,限制其应用能力。该文通过定义子分类器序列的相关性衰减函数,提出新的...时间自适应支持向量机(TA-SVM)方法在处理非静态数据集时表现出良好的性能,但仅根据邻接子分类器相似而获得的相关信息并不充分,由此可能会导致训练所得模型不可靠,限制其应用能力。该文通过定义子分类器序列的相关性衰减函数,提出新的面向非静态数据分类问题的演进支持向量机(Evolving Support VectorMachines,ESVM)。ESVM使用衰变函数以体现子分类器之间的相关程度,通过约束所有子分类器之间的带权差异以求得变化更光滑的子分类器序列,契合了数据中隐藏的渐变概念。在各种数据缓慢变化场景的对比实验中,该文的ESVM方法优于TA-SVM方法。展开更多
数据流挖掘应用对时间、空间有着较高的要求,因而传统的密度估计方法,如核密度估计法、压缩集密度估计法等并不适用于数据流密度估计.提出一种新颖的面向在线数据流的m-混合聚类核密度估计(m-mixed clustering kernel density estimatio...数据流挖掘应用对时间、空间有着较高的要求,因而传统的密度估计方法,如核密度估计法、压缩集密度估计法等并不适用于数据流密度估计.提出一种新颖的面向在线数据流的m-混合聚类核密度估计(m-mixed clustering kernel density estimation,MMCKDE)方法,该方法通过创建MMCKDE节点,用固定个数的混合聚类核获得聚类信息,以代替其他密度估计方法中的所有核.针对数据量不断增加的情况,通过计算Kullback Leibler(KL)距离进行核合并,可进一步以更紧凑的形式表示概率密度估计信息.较之于其他一些方法只能估计整段数据流的密度,MMCKDE方法最终获得的模型不仅适用于整段数据流,还适用于任意时间段上的密度估计.MMCKDE算法同SOMKE算法在不同基准数据集及真实数据集上进行密度估计精度和运行时间的比较.实验结果表明,MMCKDE算法具有更好的性能.展开更多
文摘针对数据流分类,时间自适应支持向量机(Time Adaptive Support Vector Machine,TA-SVM)及其改进方法通过在核空间上协同求解多个子分类器而取得了较好的性能,其原理是在局部优化的同时兼顾全局优化,强制子分类器序列稳定地变化。然而在很多应用场景中,由于数据具有一定的随机性,难以确保概念模型以不变的节奏漂移,因而TA-SVM分类模型中应充分考虑子分类器序列的不稳定性。为了放松TA-SVM方法对子分类器序列的约束,使子分类器法向量、偏置量的变化具有更大的灵活性,提出了柔性漂移支持向量机(Flexible Drift Support Vector Machines,FD-SVM),在继承TA-SVM方法协同求解思想的基础上,灵活对待子分类器变化。实验结果表明,FD-SVM方法能有效提升对非静态数据的分类性能。
文摘时间自适应支持向量机(TA-SVM)方法在处理非静态数据集时表现出良好的性能,但仅根据邻接子分类器相似而获得的相关信息并不充分,由此可能会导致训练所得模型不可靠,限制其应用能力。该文通过定义子分类器序列的相关性衰减函数,提出新的面向非静态数据分类问题的演进支持向量机(Evolving Support VectorMachines,ESVM)。ESVM使用衰变函数以体现子分类器之间的相关程度,通过约束所有子分类器之间的带权差异以求得变化更光滑的子分类器序列,契合了数据中隐藏的渐变概念。在各种数据缓慢变化场景的对比实验中,该文的ESVM方法优于TA-SVM方法。