-
题名滑动窗口内进化数据流任意形状聚类算法
被引量:6
- 1
-
-
作者
吴枫
仲妍
金鑫
吴泉源
贾焰
杨树强
-
机构
国防科学技术大学计算机学院
湖南长沙民政职业技术学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2009年第5期887-890,共4页
-
基金
国家“八六三”高技术研究发展计划基金项目(2006AA01Z451,2007AA01Z474)资助
-
文摘
任意形状聚类是数据流挖掘中的重要研究课题.提出一种滑动窗口内进化数据流任意形状聚类算法SWASCStream.提出了改良的微簇特征结构,能够全面地描述滑动窗口内任意形状的簇;提出新的稀疏微簇、临界微簇和非疏微簇的概念,有助于从本质上提高滑动窗口内的聚类质量;提出了合理的微簇周期删除策略,能够有效降低算法的维护代价,并且保证误差可控.通过一系列真实和人工数据集上的试验,验证了本文算法的高效性.
-
关键词
进化数据流
任意形状聚类
滑动窗口
时间衰减模型
-
Keywords
evolving data stream
arbitrary shape clustering
sliding window
time decaying model
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于层次与密度的任意形状聚类算法
被引量:8
- 2
-
-
作者
许合利
牛丽君
-
机构
河南理工大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第7期159-164,共6页
-
基金
国家自然科学基金资助项目(61202286)
国家科技重大专项基金资助项目(2014ZX01045-102)
-
文摘
结合层次聚类算法和密度聚类算法,提出一种新的任意形状聚类算法,以密度峰值点为初始聚类中心将数据集划分为大量子簇。根据聚类合并准则,对簇间边界区域密度大于等于其中任何一个簇平均密度的相邻子簇进行合并。通过动态建模方法进行子簇合并,无需人工输入终止参数即可自动确定聚类终止点。在测试数据集和真实数据集上的实验结果表明,该算法对输入参数的选择具有鲁棒性,能有效识别任意形状、大小和密度的聚类,并且适用于密度分布不均匀的数据集。
-
关键词
层次聚类算法
密度聚类算法
任意形状聚类
动态模型
边界区域密度
密度峰值点
-
Keywords
hierarchical clustering algorithm
density clustering algorithm
arbitrary shape clustering
dynamic model
border region density
density peak point
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名可处理混合属性的任意形状聚类
被引量:2
- 3
-
-
作者
苏晓珂
兰洋
程耀东
万仁霞
-
机构
东华大学信息科学与技术学院
郑州轻工业学院计算机与通信工程学院。郑州
信阳师范学院计算机与信息技术学院
中国科学院高能物理研究所计算中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第34期136-139,共4页
-
基金
国家高技术研究发展计划(863)(No.2006AA01A120)
河南省教育厅自然科学基础研究计划(No.2010A520033)
郑州轻工业学院博士科研基金资助项目~~
-
文摘
聚类是数据挖掘中一个非常活跃的研究分支,任意形状的聚类则是一个有待研究的开放问题。提出一种包含分类属性取值频率信息的类间差异性度量和一种对象与类的相似度定义,在此基础上提出一种能处理任意形状的聚类算法,可处理混合属性数据集。在人造数据集和真实数据集上检验了提出的算法,并与相关算法进行了对比,实验结果表明,提出的算法是有效可行的。
-
关键词
任意形状聚类
混合属性
相似度
-
Keywords
arbitrary shape clustering
mixed attributes
similarity degree
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于自适应微簇的任意形状概念漂移数据流聚类
被引量:1
- 4
-
-
作者
韦洁华
-
机构
广州南洋理工职业学院通识教育学院
-
出处
《计算机应用与软件》
北大核心
2020年第11期260-267,共8页
-
基金
广东省高等职业技术教育研究会一般课题(GDGZ18Y095)。
-
文摘
传统进化数据流聚类算法所需的数据维度、分簇大小等先验知识在实用中很难满足,上述参数的取值偏差对数据流的聚类性能产生极大的影响。对此设计一种基于自适应微簇的任意形状进化数据流聚类算法。设计递归的微簇半径更新机制,自适应地搜索微簇半径的局部最优值。采用最优路径森林组织宏簇的完全图,将能量值最高的微簇作为最优路径树的根节点,根据最优路径将新到达的数据分类。基于合成数据集和真实数据集均进行了仿真实验,结果表明该算法实现了较高的聚类准确率。
-
关键词
进化数据流
概念漂移
任意形状聚类
递归模型
最优路径森林
-
Keywords
Evolving data stream
Concept drift
Arbitrary shape clustering
Recursive model
Optimum path forest
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于聚类融合的异常检测算法
被引量:1
- 5
-
-
作者
苏晓珂
王秉政
-
机构
郑州轻工业学院计算机与通信工程学院
-
出处
《郑州轻工业学院学报(自然科学版)》
CAS
2011年第3期8-11,共4页
-
基金
河南省科技攻关项目(092102210108)
河南省教育厅自然科学基础研究计划项目(2010A520033)
郑州轻工业学院博士科研基金资助项目
-
文摘
针对任意形状聚类算法用于异常检测时参数设置困难的问题,提出一种基于聚类融合的异常检测算法:设置不同的半径阈值进行多次聚类,统计每次聚类中标记为异常的簇频率,将频率高的簇作为真正的异常.在UCI数据集上对该算法进行实验,结果表明:本算法可降低直接将小簇作为异常的高误报率,并且能提供给用户更为友好的操作.
-
关键词
异常检测
聚类融合
异常簇
任意形状聚类
-
Keywords
outlier detection
clustering ensemble
abnormal cluster
arbitrary shape clustering
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名无监督连接划分聚类算法及其在入侵检测中的应用
被引量:3
- 6
-
-
作者
张阿品
徐保国
-
机构
江南大学通信与控制工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2006年第3期384-386,共3页
-
基金
教育部科学技术研究基础条件平台建设基金项目(505006)
-
文摘
阐述了一种无监督连接划分聚类算法,算法基本思想是首先通过分割的方法将数据集划分为若干个原子簇,滤除噪声原子簇,然后通过对原子簇间连接亲密度的分析,构造原子簇间的连接图,切断连接亲密度很低的原子簇连接,合并连接亲密度高的连接,划分得到最后的聚类结果。算法具有很高的有效性,适用于高维数据集,能够对任意形状的簇进行聚类。通过分析与实验,证明该方法具有良好的效果。
-
关键词
无监督聚类
连接划分
任意形状聚类
入侵检测
网络安全
-
Keywords
unsupervised clustering
link division
arbitrary shape clustering
intrusion detection
network security
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
-
-
题名K步稳定的鞋印花纹图像自动聚类
被引量:1
- 7
-
-
作者
王新年
舒莹莹
-
机构
大连海事大学信息科学技术学院
-
出处
《中国图象图形学报》
CSCD
北大核心
2016年第5期574-587,共14页
-
基金
国家高技术研究发展计划(863)基金项目(2010AA710**)~~
-
文摘
目的鞋印是刑事侦查的重要物证之一,如何对积累的大量鞋印花纹图像进行自动归类管理是刑事技术迫切需要解决的问题之一。与其他类图像不同,鞋印花纹图像具有种类多但数目未知、同类花纹分布不均匀且同类花纹数目少的特点。基于鞋印花纹图像的这些特点,用目前典型的聚类算法对鞋印花纹图像集进行聚类,并不能取得很好的效果。在对鞋印花纹图像进行分析的基础上,提出一种K步稳定的鞋印花纹图像自动聚类算法。方法对已标记的鞋印花纹图像进行统计发现,各类鞋印花纹之间在特征空间上存在互不相交的区域(本文称为隔离带)。算法的核心思想是寻找各类鞋印花纹之间的隔离带,来将各类分开。过程为:以单调递增或递减的方式调整特征空间中判定两点为一类的阈值,得到数据集的多次划分;若在连续K次划分的过程中,某一类的成员不发生变化,则说明这K次调整是在隔离带中进行的,即聚出一类,并从数据集中删除已标记的数据;选择下一个阈值对剩余的数据集进行划分,输出K步不变的类;依此类推,直到剩余数据集为空,聚类完成。结果在两类公开测试数据集和实际鞋印花纹数据集上进行实验,本文算法的主要性能指标都超过典型算法,其中在包含5 792枚实际鞋印花纹数据集上的聚类准确率和F-Measure值分别达到了99.68%和95.99%。结论针对鞋印花纹图像特点,提出了一种通过寻找各类之间的隔离带进行自动聚类的算法,并在实际应用中取得了很好的效果。且算法性能受参数的变化以及类的形状影响较小。本文算法同样适用于具有类似特点的其他数据集的自动聚类。
-
关键词
鞋印花纹图像
聚类
隔离带
K步稳定
可达半径
类集成树
任意形状类
-
Keywords
shoeprint image
clustering
margin
K-steps stabilization
reachable radius
cluster aggregation tree
clus- ters of arbitrary shape
-
分类号
TN911.73
[电子电信—通信与信息系统]
-