题名 基于密度与近邻传播的数据流聚类算法
被引量:28
1
作者
张建朋
陈福才
李邵梅
刘力雄
机构
国家数字交换系统工程技术研究中心
出处
《自动化学报》
EI
CSCD
北大核心
2014年第2期277-288,共12页
基金
国家高技术研究发展计划(863计划)(2011AA010603
2011AA010605)资助~~
文摘
针对现有算法聚类精度不高、处理离群点能力较差以及不能实时检测数据流变化的缺陷,提出一种基于密度与近邻传播融合的数据流聚类算法.该算法采用在线/离线两阶段处理框架,通过引入微簇衰减密度来精确反映数据流的演化信息,并采用在线动态维护和删减微簇机制,使算法模型更符合原始数据流的内在特性.同时,当模型中检测到新的类模式出现时,采用一种改进的加权近邻传播聚类(Weighted and hierarchical affinity propagation,WAP)算法对模型进行重建,因而能够实时检测到数据流的变化,并能给出任意时间的聚类结果.在真实数据集和人工数据集上的实验表明,该算法具有良好的适用性、有效性和可扩展性,能够取得较好的聚类效果.
关键词
数据流挖掘
近邻传播
基于密度聚类
变化检测
Keywords
data stream mining, affinity propagation , density-based clustering , change detection method
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 基于近邻传播与密度相融合的进化数据流聚类算法
被引量:34
2
作者
邢长征
刘剑
机构
辽宁工程技术大学研究生院
出处
《计算机应用》
CSCD
北大核心
2015年第7期1927-1932,1949,共7页
基金
国家自然科学基金资助项目(61402212)
文摘
针对目前数据流离群点不能很好地被处理、数据流聚类效率较低以及对数据流的动态变化不能实时检测等问题,提出一种基于近邻传播与密度相融合的进化数据流聚类算法(I-APDen Stream)。此算法使用传统的两阶段处理模型,即在线与离线聚类两部分。不仅引进了能够体现数据流动态变化的微簇衰减密度以及在线动态维护微簇的删减机制,而且在对模型采用扩展的加权近邻传播(WAP)聚类进行模型重建时,还引进了异常点检测删除机制。通过在两种类型数据集上的实验结果表明,所提算法的聚类准确率基本能保持在95%以上,其纯度对比实验等其他相关测试都有较好结果,能够高实效、高质量、高效率地处理数据流数据聚类。
关键词
离群点
数据流聚类
近邻传播
微簇
Keywords
outlier
data stream clustering
affinity propagation (AP)
micro-cluster
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 基于近邻传播的分布式数据流聚类算法
被引量:3
3
作者
张建朋
金鑫
陈福才
陈鸿昶
侯颖
机构
国家数字交换系统工程技术研究中心
国家计算机网络与信息安全管理中心
出处
《计算机应用》
CSCD
北大核心
2013年第9期2477-2481,共5页
基金
国家863计划项目(2011AA010603
2011AA010605)
文摘
针对分布式数据流聚类算法存在的聚类质量不高、通信代价大的问题,提出了密度和代表点聚类思想相结合的分布式数据流聚类算法。该算法的局部站点采用近邻传播聚类,引入了类簇代表点的概念来描述局部分布的概要信息,全局站点采用基于改进的密度聚类算法合并局部站点上传的概要数据结构进而获得全局模型。仿真实验结果表明,所提算法能明显提高分布式环境下数据流的聚类质量,同时算法使用类簇代表点能够发现不同形状的聚簇并显著降低数据传输量。
关键词
数据挖掘
分布式聚类
数据流
近邻传播
基于密度聚类
Keywords
data mining
distributed clustering
data stream
affinity propagation
density clustering
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
题名 基于仿射传播的进化数据流在线聚类算法
被引量:5
4
作者
张建朋
陈福才
李邵梅
刘力雄
机构
国家数字交换系统工程技术研究中心电信网实验室
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2014年第5期443-451,共9页
基金
国家高技术研究发展863计划项目(No.2011AA010603
2011AA010605)资助
文摘
为提高数据流聚类的精度和时效性,提出一种具有时态特征与近邻传播思想的高效数据流聚类算法(TCAPStream).该算法利用改进的WAP将新检测到的类模式合并到聚类模型中,同时利用微簇时态密度表征数据流的时态演化特征,并提出在线动态删除机制对微簇进行维护,使算法模型既能体现数据流的时态特征,又能反映数据流的分布特性,得到更精确的聚类结果.实验结果表明,该算法在多个人工数据集和真实数据集上不仅具有良好的聚类效果,而且具有较好的伸缩性和可扩展性.
关键词
数据挖掘
近邻传播聚类
时态密度
模型重建
数据流
Keywords
data Mining
affinity propagation clustering
Temporal Density
Model Reconstruction
data stream
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 基于近邻传播的不确定数据流演化聚类算法
被引量:4
5
作者
夏聪
陆亿红
机构
浙江工业大学计算机科学与技术学院
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2016年第5期472-480,共9页
基金
水利部公益性行业科研专项(No.201401044)
国家科技支撑计划项目(No.2012BAD10B01)资助~~
文摘
鉴于现有算法缺乏从时序演化角度解决不确定数据流聚类问题,提出基于近邻传播的不确定数据流演化聚类算法.考虑不确定数据流在线形成微簇时的变化因素对离线聚类的影响,提出不确定微簇变化率的概念.从不确定数据流演化的角度衡量微簇之间的相似程度,提出不确定微簇关联度的概念,并以此为基础构造不确定相似度矩阵,结合近邻传播思想实现不确定数据流演化聚类.通过实验证明文中算法的有效性和良好的聚类效果.
关键词
近邻传播
不确定数据流
演化聚类
Keywords
affinity propagation , uncertain data stream , evolutionary clustering
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
题名 基于半监督近邻传播的数据流聚类算法
被引量:1
6
作者
王文帅
陈刚
机构
中国科学院高能物理研究所计算中心
中国科学院大学
出处
《计算机工程与应用》
CSCD
2013年第8期6-8,47,共4页
基金
国家自然科学基金资助重点项目(No.90912004)
文摘
为了提高进化数据流的聚类质量,提出基于半监督近邻传播的数据流聚类算法(SAPStream),该算法借鉴半监督聚类的思想对初始数据流构造相似度矩阵进行近邻传播聚类,建立在线聚类模型,随着数据流的进化,应用衰减窗口技术对聚类模型适时做出调整,对产生的类代表点和新到来的数据点再次聚类得到数据流的聚类结果。对数据流进行动态聚类的实验结果表明该算法是高质有效的。
关键词
数据流
半监督
近邻传播聚类
衰减窗口
Keywords
data stream
semi-supervised
affinity propagation clustering
decay windows
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 一种新的雷达信号实时分选方法
被引量:3
7
作者
刘志鹏
张国毅
机构
中国人民解放军
空军航空大学
出处
《航天电子对抗》
2016年第2期6-9,17,共5页
文摘
针对现有实时分选方法依赖滑动窗(单次处理脉冲数)的选取、分选效率低以及分选结果存在严重增批现象等缺陷,将脉冲串的接收视为数据流过程,从而设计了一种基于进化数据流聚类的雷达信号实时分选框架。该框架分为在线处理和离线分析两个阶段,通过引入时态密度特征避免了主观上对滑动窗长度的选取,并利用衰变检测和噪声点检测来提高在线聚类的效率。离线阶段通过对历史快照的分析可以判明雷达的活动情况,并将属于一部雷达的脉冲批组进行关联。仿真实验表明了该框架的有效性和可行性。
关键词
信号分选
数据流
时态密度
放射传播聚类
离线分析
Keywords
signal deinterleaving
data stream
temporal density
affinity propagation cluster
off line analysis
分类号
TN957.51
[电子电信—信号与信息处理]