期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
一种面向混合属性数据流的基于密度的聚类算法研究 被引量:5
1
作者 陈晋音 何辉豪 杨东勇 《小型微型计算机系统》 CSCD 北大核心 2016年第1期43-47,共5页
混合属性数据流聚类是数据流挖掘中的重要问题.针对现存聚类方法在处理混合属性数据流聚类时存在聚类精度低和实时性差的问题,提出一种基于密度的混合属性数据流聚类算法HDSDen(Heterogeneous Data Stream based on Density Clustering ... 混合属性数据流聚类是数据流挖掘中的重要问题.针对现存聚类方法在处理混合属性数据流聚类时存在聚类精度低和实时性差的问题,提出一种基于密度的混合属性数据流聚类算法HDSDen(Heterogeneous Data Stream based on Density Clustering Algorithm),算法由在线聚类/离线优化两部分组成,在线聚类快速完成距离计算与聚类,离线优化实现二次聚类提高聚类精度.针对现存混合型属性计算距离方式精度低的问题,本文设计属性占优分析预先确定混合属性数据流中分类或数值属性占优的,随即选择对应的相似度计算公式,从而保证了混合属性的相似度计算满足属性重要性平衡,降低非占优属性数据对整体数据聚类的影响,在线聚类最终通过给定参数ε和μ确定当前窗口到达的数据点中的核心数据点.离线部分从核心数据点出发将所有密度可达的数据点聚成一个自然类,并将未被聚类的数据点存入暂存区,若暂存区内数据点达到一定数量,将暂存区的数据再聚类优化整体的聚类效果,从而实现了离群点的二次聚类,保证了聚类的精度.最后HDSDen算法对真实数据集进行聚类实验,验证HDSDen算法比现有几种典型数据流聚类方法具有更高的聚类质量,并能给出任意时间的聚类结果,能够有效地处理混合属性数据流聚类问题. 展开更多
关键词 数据流 混合属性 属性占优 数据聚类 密度
下载PDF
一种基于混合量子粒子群的快速运动目标跟踪算法研究 被引量:6
2
作者 陈晋音 何辉豪 +1 位作者 厉行枫 徐海波 《控制工程》 CSCD 北大核心 2014年第6期812-817,共6页
量子粒子群算法在优化过程中需要权衡局部探索性和全局开拓性,进化后期由于全局开拓能力的丧失使得种群多样性减少,设计了一种基于欧式距离的混合量子粒子群算法,通过计算粒子的种群多样性,当种群多样性低于阈值范围时加入基于欧式距离... 量子粒子群算法在优化过程中需要权衡局部探索性和全局开拓性,进化后期由于全局开拓能力的丧失使得种群多样性减少,设计了一种基于欧式距离的混合量子粒子群算法,通过计算粒子的种群多样性,当种群多样性低于阈值范围时加入基于欧式距离的种群划分策略划分子种群,从而保证获得全局最优解。利用标准测试函数验证提出的混合量子群算法有效性。提出了基于混合量子粒子群的Mean Shift算法(HQPSO Mean Shift)完成目标快速跟踪,克服传统Mean Shift算法的在跟踪快速移动目标时出现"跟丢"的问题。 展开更多
关键词 量子粒子群算法 欧氏距离 快速移动 种群多样性 目标跟踪
下载PDF
基于密度的聚类中心自动确定的混合属性数据聚类算法研究 被引量:38
3
作者 陈晋音 何辉豪 《自动化学报》 EI CSCD 北大核心 2015年第10期1798-1813,共16页
面对广泛存在的混合属性数据,现有大部分混合属性聚类算法普遍存在聚类质量低、聚类算法参数依赖性大、聚类类别个数和聚类中心无法准确自动确定等问题,针对这些问题本文提出了一种基于密度的聚类中心自动确定的混合属性数据聚类算法.... 面对广泛存在的混合属性数据,现有大部分混合属性聚类算法普遍存在聚类质量低、聚类算法参数依赖性大、聚类类别个数和聚类中心无法准确自动确定等问题,针对这些问题本文提出了一种基于密度的聚类中心自动确定的混合属性数据聚类算法.该算法通过分析混合属性数据特征,将混合属性数据分为数值占优、分类占优和均衡型混合属性数据三类,分析不同情况的特征选取相应的距离度量方式.在计算数据集各个点的密度和距离分布图基础上,深入分析获得规律:高密度且与比它更高密度的数据点有较大距离的数据点最可能成为聚类中心,通过线性回归模型和残差分析确定奇异点,理论论证这些奇异点即为聚类中心,从而实现了自动确定聚类中心.采用粒子群算法(Particle swarm optimization,PSO)寻找最优dc值,通过参数dc能够计算得到任意数据对象的密度和到比它密度更高的点的最小距离,根据聚类中心自动确定方法确定每个簇中心,并将其他点按到最近邻的更高密度对象的最小距离划分到相应的簇中,从而实现聚类.最终将本文提出算法与其他现有的多种混合属性聚类算法在多个数据集上进行算法性能比较,验证本文提出算法具有较高的聚类质量. 展开更多
关键词 数据挖掘 混合属性 数据聚类 密度 混合距离度量
下载PDF
基于时序约束模糊有向图的电网故障诊断 被引量:3
4
作者 陈晋音 何辉豪 +1 位作者 周晓 杨东勇 《控制工程》 CSCD 北大核心 2016年第6期800-811,共12页
对电网故障进行快速而准确的诊断对电网的安全运行至关重要。针对SCADA获取的警报信息不完备情况,提出了一种基于时序模糊有向图(Time Constraint Fuzzy Directed Graph,TCFDG)的故障诊断方法,利用时序约束有效识别警报信息的丢失、误... 对电网故障进行快速而准确的诊断对电网的安全运行至关重要。针对SCADA获取的警报信息不完备情况,提出了一种基于时序模糊有向图(Time Constraint Fuzzy Directed Graph,TCFDG)的故障诊断方法,利用时序约束有效识别警报信息的丢失、误报、时序不一致情况,并对错误警报信息进行过滤,克服警报信息不完备缺陷,为精确定位故障源提供保障;其次提出了基于时序模糊有向图的推理方法,利用时序关联矩阵的最小运算和乘法运算确定故障源,并采用关联矩阵约简的方法,降低了矩阵的维数,提高诊断速度。最后,用典型电力系统发生的故障案例对所提出的方法进行了说明,并与已有几种典型先进方法比较,验证了所提出诊断方法的优势。 展开更多
关键词 故障诊断 时序属性 有向图 电力系统 关联矩阵约简
下载PDF
基于密度和混合距离度量方法的混合属性数据聚类研究 被引量:11
5
作者 陈晋音 何辉豪 《控制理论与应用》 EI CAS CSCD 北大核心 2015年第8期993-1002,共10页
针对基于密度的传统算法不能处理混合属性数据,以及目前的混合属性聚类算法大多数聚类质量不高等问题,提出了基于密度和混合距离度量方法的混合属性聚类算法.该算法通过分析混合属性数据特征,将混合属性数据分为数值占优、分类占优和均... 针对基于密度的传统算法不能处理混合属性数据,以及目前的混合属性聚类算法大多数聚类质量不高等问题,提出了基于密度和混合距离度量方法的混合属性聚类算法.该算法通过分析混合属性数据特征,将混合属性数据分为数值占优、分类占优和均衡型混合属性数据3类,分析不同情况的特征选取相应的距离度量方式,通过预设参数能够发现数据密集区域,确定核心点,再利用核心点确定密度相连的对象实现聚类,获得最终的聚类结果.将算法应用于多种数据集上的实验结果表明,该算法具有较高的聚类质量,能够有效处理混合属性数据. 展开更多
关键词 数据挖掘 混合属性 聚类 密度 混合距离度量
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部