针对计算机兵棋推演数据的特点,提出了一种基于密度的快速聚类算法—基于密度的快速空间聚类算法(quick density based spatial clustering of applications with noise,QDBSCAN),目的是通过聚类检测孤立点,快速定位地面部队兵力部署上...针对计算机兵棋推演数据的特点,提出了一种基于密度的快速聚类算法—基于密度的快速空间聚类算法(quick density based spatial clustering of applications with noise,QDBSCAN),目的是通过聚类检测孤立点,快速定位地面部队兵力部署上的缺陷。QDBSCAN算法在基于密度的空间聚类算法(density based spatial cluste-ring of applications with noise,DBSCAN)算法的基础上做了相关改进:在邻近度度量上提出了最短可行路径的概念,使聚类更符合计算机兵棋的规则;动态设置密度参数;采用提出的代表对象选择方法来减少对对象邻域的判断次数;按区域对数据进行分组以缩小聚类规模。实验表明,QDBSCAN算法的性能在数据规模较大的情况下,明显优于DBSCAN算法。展开更多
对基于密度的分布式聚类算法DBDC(density based distributed clustering)进行改进,提出了一种基于密度的分布式聚类算法DBDC*.该算法在局部筛选代表点时结合贝叶斯信息准则BIC,得到少量精准反映局部站点数据分布的BIC核心点,有效降低...对基于密度的分布式聚类算法DBDC(density based distributed clustering)进行改进,提出了一种基于密度的分布式聚类算法DBDC*.该算法在局部筛选代表点时结合贝叶斯信息准则BIC,得到少量精准反映局部站点数据分布的BIC核心点,有效降低了分布式聚类过程中的数据通信量,全局聚类时综合考虑了各站点数据的分布情况.实验结果表明,算法DBDC*的效率优于DBDC,聚类效果好.展开更多
针对数据密集型计算环境下数据具有海量、分布、异构、高速变化等特点,分析传统的基于密度的分布式聚类(Density Base Distributed Clustering,DBDC)算法,借助MapReduce编程模型,提出一种新的分布式聚类算法,采用局部和全局的方式处理...针对数据密集型计算环境下数据具有海量、分布、异构、高速变化等特点,分析传统的基于密度的分布式聚类(Density Base Distributed Clustering,DBDC)算法,借助MapReduce编程模型,提出一种新的分布式聚类算法,采用局部和全局的方式处理海量、异构数据,解决具有以上特点的数据密集型计算环境下数据的分析挖掘问题。得出算法的复杂度为O((nlog2n)/p),实验验证在数据量与节点数变化时算法具有较高的稳定性和可伸缩性,与原算法对比该算法具有较高的准确度。展开更多
为了从移动终端位置数据中精准识别居民职住地,提出了一种基于时空约束密度聚类的职住地识别方法。首先,利用基于K-means的DBSCAN(density-based spatial clustering of applications with noise)时空驻点聚类过程将居民多天的原始轨迹...为了从移动终端位置数据中精准识别居民职住地,提出了一种基于时空约束密度聚类的职住地识别方法。首先,利用基于K-means的DBSCAN(density-based spatial clustering of applications with noise)时空驻点聚类过程将居民多天的原始轨迹点分成不同的时空驻点簇;然后,利用基于速度阈值的停留点簇和移动点簇识别过程将居民的每一个时空驻点簇区分为停留点簇或移动点簇;接着,利用基于K近距离的DBSCAN重要停留点聚类过程将居民的停留点分成不同的重要停留点簇;最后,利用基于KD-tree优化的KNN(K-nearest neighbor)职住地识别过程将居民的每个重要停留点识别为工作地、居住地、职住同一区域或兴趣地点区域。实验结果表明,该方法的每个过程都是合理有效的,并且最终的职住地识别效果要优于时间阈值法、累加时间法和信息熵法。展开更多
针对并行化密度聚类的过程中,不同密度聚类簇边界点划分模糊,并且存在数据噪声,从而影响聚类性能,使聚类结果受制于局部最优影响的问题,提出一种基于MapReduce与优化布谷鸟算法的并行密度聚类算法。首先,该算法结合K-means中的近邻与逆...针对并行化密度聚类的过程中,不同密度聚类簇边界点划分模糊,并且存在数据噪声,从而影响聚类性能,使聚类结果受制于局部最优影响的问题,提出一种基于MapReduce与优化布谷鸟算法的并行密度聚类算法。首先,该算法结合K-means中的近邻与逆近邻思路的策略KDBSCAN(K-means DBSCAN),通过计算各数据点的影响空间,以此重新定义基于密度的聚类(Density-based spatial dutering of apptications with noise,DBSCAN)算法中聚类簇的拓展条件,避免了不同密度聚类簇边界点划分模糊的问题;其次,结合KDBSCAN密度聚类中的近邻思想提出了一种可行的迭代性噪声点处理策略,减轻数据中噪声点对于聚类算法性能的影响;再次,提出基于传统布谷鸟算法的优化改进策略MCS(Majorization cuckoo search),通过衰减发现巢穴概率的权重,随着迭代搜寻次数的增加提升算法收敛速度,解决了聚类结果受制于局部最优的问题;最后,结合MapReduce提出了并行密度聚类策略MCS-KDBSCAN,通过并行化密度聚类算法运算,减轻了并行聚类算法局部最优解传递的通信负担,提升了算法性能。实验证明,提出的MCS-KDBSCAN并行化密度聚类算法在聚类精度、聚类运行时间等方面均较优。展开更多
针对传统雷达信号识别方法对重点目标识别的针对性、时效性不强的问题,提出一种基于聚类和时序相关的重点雷达信号实时识别方法。首先,依据具有噪声的基于密度的聚类(density-based spatial clustering of application with noise,DBSC...针对传统雷达信号识别方法对重点目标识别的针对性、时效性不强的问题,提出一种基于聚类和时序相关的重点雷达信号实时识别方法。首先,依据具有噪声的基于密度的聚类(density-based spatial clustering of application with noise,DBSCAN)算法对侦获信号的脉冲描述字进行分选;而后,利用分选所得脉冲的时序特征与重点目标信号脉冲重复间隔(pulse repetition interval,PRI)生成仿真信号;最后,计算仿真信号的互相关函数,基于相关度判断PRI参数是否匹配。仿真实验表明:所提方法明显提升了对重点目标信号的识别时效,能够应对存在噪声干扰和信号交叠的复杂信号环境,对局部脉冲参数丢失不敏感。展开更多
文摘针对计算机兵棋推演数据的特点,提出了一种基于密度的快速聚类算法—基于密度的快速空间聚类算法(quick density based spatial clustering of applications with noise,QDBSCAN),目的是通过聚类检测孤立点,快速定位地面部队兵力部署上的缺陷。QDBSCAN算法在基于密度的空间聚类算法(density based spatial cluste-ring of applications with noise,DBSCAN)算法的基础上做了相关改进:在邻近度度量上提出了最短可行路径的概念,使聚类更符合计算机兵棋的规则;动态设置密度参数;采用提出的代表对象选择方法来减少对对象邻域的判断次数;按区域对数据进行分组以缩小聚类规模。实验表明,QDBSCAN算法的性能在数据规模较大的情况下,明显优于DBSCAN算法。
文摘对基于密度的分布式聚类算法DBDC(density based distributed clustering)进行改进,提出了一种基于密度的分布式聚类算法DBDC*.该算法在局部筛选代表点时结合贝叶斯信息准则BIC,得到少量精准反映局部站点数据分布的BIC核心点,有效降低了分布式聚类过程中的数据通信量,全局聚类时综合考虑了各站点数据的分布情况.实验结果表明,算法DBDC*的效率优于DBDC,聚类效果好.
文摘针对数据密集型计算环境下数据具有海量、分布、异构、高速变化等特点,分析传统的基于密度的分布式聚类(Density Base Distributed Clustering,DBDC)算法,借助MapReduce编程模型,提出一种新的分布式聚类算法,采用局部和全局的方式处理海量、异构数据,解决具有以上特点的数据密集型计算环境下数据的分析挖掘问题。得出算法的复杂度为O((nlog2n)/p),实验验证在数据量与节点数变化时算法具有较高的稳定性和可伸缩性,与原算法对比该算法具有较高的准确度。
文摘为了从移动终端位置数据中精准识别居民职住地,提出了一种基于时空约束密度聚类的职住地识别方法。首先,利用基于K-means的DBSCAN(density-based spatial clustering of applications with noise)时空驻点聚类过程将居民多天的原始轨迹点分成不同的时空驻点簇;然后,利用基于速度阈值的停留点簇和移动点簇识别过程将居民的每一个时空驻点簇区分为停留点簇或移动点簇;接着,利用基于K近距离的DBSCAN重要停留点聚类过程将居民的停留点分成不同的重要停留点簇;最后,利用基于KD-tree优化的KNN(K-nearest neighbor)职住地识别过程将居民的每个重要停留点识别为工作地、居住地、职住同一区域或兴趣地点区域。实验结果表明,该方法的每个过程都是合理有效的,并且最终的职住地识别效果要优于时间阈值法、累加时间法和信息熵法。
文摘针对并行化密度聚类的过程中,不同密度聚类簇边界点划分模糊,并且存在数据噪声,从而影响聚类性能,使聚类结果受制于局部最优影响的问题,提出一种基于MapReduce与优化布谷鸟算法的并行密度聚类算法。首先,该算法结合K-means中的近邻与逆近邻思路的策略KDBSCAN(K-means DBSCAN),通过计算各数据点的影响空间,以此重新定义基于密度的聚类(Density-based spatial dutering of apptications with noise,DBSCAN)算法中聚类簇的拓展条件,避免了不同密度聚类簇边界点划分模糊的问题;其次,结合KDBSCAN密度聚类中的近邻思想提出了一种可行的迭代性噪声点处理策略,减轻数据中噪声点对于聚类算法性能的影响;再次,提出基于传统布谷鸟算法的优化改进策略MCS(Majorization cuckoo search),通过衰减发现巢穴概率的权重,随着迭代搜寻次数的增加提升算法收敛速度,解决了聚类结果受制于局部最优的问题;最后,结合MapReduce提出了并行密度聚类策略MCS-KDBSCAN,通过并行化密度聚类算法运算,减轻了并行聚类算法局部最优解传递的通信负担,提升了算法性能。实验证明,提出的MCS-KDBSCAN并行化密度聚类算法在聚类精度、聚类运行时间等方面均较优。
文摘针对传统雷达信号识别方法对重点目标识别的针对性、时效性不强的问题,提出一种基于聚类和时序相关的重点雷达信号实时识别方法。首先,依据具有噪声的基于密度的聚类(density-based spatial clustering of application with noise,DBSCAN)算法对侦获信号的脉冲描述字进行分选;而后,利用分选所得脉冲的时序特征与重点目标信号脉冲重复间隔(pulse repetition interval,PRI)生成仿真信号;最后,计算仿真信号的互相关函数,基于相关度判断PRI参数是否匹配。仿真实验表明:所提方法明显提升了对重点目标信号的识别时效,能够应对存在噪声干扰和信号交叠的复杂信号环境,对局部脉冲参数丢失不敏感。