针对计算机兵棋推演数据的特点,提出了一种基于密度的快速聚类算法—基于密度的快速空间聚类算法(quick density based spatial clustering of applications with noise,QDBSCAN),目的是通过聚类检测孤立点,快速定位地面部队兵力部署上...针对计算机兵棋推演数据的特点,提出了一种基于密度的快速聚类算法—基于密度的快速空间聚类算法(quick density based spatial clustering of applications with noise,QDBSCAN),目的是通过聚类检测孤立点,快速定位地面部队兵力部署上的缺陷。QDBSCAN算法在基于密度的空间聚类算法(density based spatial cluste-ring of applications with noise,DBSCAN)算法的基础上做了相关改进:在邻近度度量上提出了最短可行路径的概念,使聚类更符合计算机兵棋的规则;动态设置密度参数;采用提出的代表对象选择方法来减少对对象邻域的判断次数;按区域对数据进行分组以缩小聚类规模。实验表明,QDBSCAN算法的性能在数据规模较大的情况下,明显优于DBSCAN算法。展开更多
对基于密度的分布式聚类算法DBDC(density based distributed clustering)进行改进,提出了一种基于密度的分布式聚类算法DBDC*.该算法在局部筛选代表点时结合贝叶斯信息准则BIC,得到少量精准反映局部站点数据分布的BIC核心点,有效降低...对基于密度的分布式聚类算法DBDC(density based distributed clustering)进行改进,提出了一种基于密度的分布式聚类算法DBDC*.该算法在局部筛选代表点时结合贝叶斯信息准则BIC,得到少量精准反映局部站点数据分布的BIC核心点,有效降低了分布式聚类过程中的数据通信量,全局聚类时综合考虑了各站点数据的分布情况.实验结果表明,算法DBDC*的效率优于DBDC,聚类效果好.展开更多
针对并行化密度聚类的过程中,不同密度聚类簇边界点划分模糊,并且存在数据噪声,从而影响聚类性能,使聚类结果受制于局部最优影响的问题,提出一种基于MapReduce与优化布谷鸟算法的并行密度聚类算法。首先,该算法结合K-means中的近邻与逆...针对并行化密度聚类的过程中,不同密度聚类簇边界点划分模糊,并且存在数据噪声,从而影响聚类性能,使聚类结果受制于局部最优影响的问题,提出一种基于MapReduce与优化布谷鸟算法的并行密度聚类算法。首先,该算法结合K-means中的近邻与逆近邻思路的策略KDBSCAN(K-means DBSCAN),通过计算各数据点的影响空间,以此重新定义基于密度的聚类(Density-based spatial dutering of apptications with noise,DBSCAN)算法中聚类簇的拓展条件,避免了不同密度聚类簇边界点划分模糊的问题;其次,结合KDBSCAN密度聚类中的近邻思想提出了一种可行的迭代性噪声点处理策略,减轻数据中噪声点对于聚类算法性能的影响;再次,提出基于传统布谷鸟算法的优化改进策略MCS(Majorization cuckoo search),通过衰减发现巢穴概率的权重,随着迭代搜寻次数的增加提升算法收敛速度,解决了聚类结果受制于局部最优的问题;最后,结合MapReduce提出了并行密度聚类策略MCS-KDBSCAN,通过并行化密度聚类算法运算,减轻了并行聚类算法局部最优解传递的通信负担,提升了算法性能。实验证明,提出的MCS-KDBSCAN并行化密度聚类算法在聚类精度、聚类运行时间等方面均较优。展开更多
针对传统雷达信号识别方法对重点目标识别的针对性、时效性不强的问题,提出一种基于聚类和时序相关的重点雷达信号实时识别方法。首先,依据具有噪声的基于密度的聚类(density-based spatial clustering of application with noise,DBSC...针对传统雷达信号识别方法对重点目标识别的针对性、时效性不强的问题,提出一种基于聚类和时序相关的重点雷达信号实时识别方法。首先,依据具有噪声的基于密度的聚类(density-based spatial clustering of application with noise,DBSCAN)算法对侦获信号的脉冲描述字进行分选;而后,利用分选所得脉冲的时序特征与重点目标信号脉冲重复间隔(pulse repetition interval,PRI)生成仿真信号;最后,计算仿真信号的互相关函数,基于相关度判断PRI参数是否匹配。仿真实验表明:所提方法明显提升了对重点目标信号的识别时效,能够应对存在噪声干扰和信号交叠的复杂信号环境,对局部脉冲参数丢失不敏感。展开更多
多源时空轨迹数据隐含丰富的城市出行信息,通过对其进行挖掘、处理和分析,可以找到个体与群体之间的交互关系。针对轨迹数据挖掘研究范围单一,缺少多空间尺度研究的问题,提出一种融合多空间尺度特征的出行轨迹数据挖掘分析方法。以广东...多源时空轨迹数据隐含丰富的城市出行信息,通过对其进行挖掘、处理和分析,可以找到个体与群体之间的交互关系。针对轨迹数据挖掘研究范围单一,缺少多空间尺度研究的问题,提出一种融合多空间尺度特征的出行轨迹数据挖掘分析方法。以广东为例,结合社交媒体腾讯用户密度(Tencent user density,TUD)数据集,通过具有噪声的基于密度的聚类方法(density-based spatial clustering of applications with noise,DBSCAN)聚类算法与局部密度峰值计算法提取时空相似性轨迹区域,进而簇类分成一系列热点区域,获得不同时间粒度、不同空间尺度下的出行轨迹规律特征。这能够实现在不同空间尺度融合下展示同一地区的热点区域,进一步探讨出行轨迹的规律变化。可见所提出的方法为利用时空大数据进行城市空间结构研究提供科学参考。展开更多
文摘针对计算机兵棋推演数据的特点,提出了一种基于密度的快速聚类算法—基于密度的快速空间聚类算法(quick density based spatial clustering of applications with noise,QDBSCAN),目的是通过聚类检测孤立点,快速定位地面部队兵力部署上的缺陷。QDBSCAN算法在基于密度的空间聚类算法(density based spatial cluste-ring of applications with noise,DBSCAN)算法的基础上做了相关改进:在邻近度度量上提出了最短可行路径的概念,使聚类更符合计算机兵棋的规则;动态设置密度参数;采用提出的代表对象选择方法来减少对对象邻域的判断次数;按区域对数据进行分组以缩小聚类规模。实验表明,QDBSCAN算法的性能在数据规模较大的情况下,明显优于DBSCAN算法。
文摘对基于密度的分布式聚类算法DBDC(density based distributed clustering)进行改进,提出了一种基于密度的分布式聚类算法DBDC*.该算法在局部筛选代表点时结合贝叶斯信息准则BIC,得到少量精准反映局部站点数据分布的BIC核心点,有效降低了分布式聚类过程中的数据通信量,全局聚类时综合考虑了各站点数据的分布情况.实验结果表明,算法DBDC*的效率优于DBDC,聚类效果好.
文摘针对并行化密度聚类的过程中,不同密度聚类簇边界点划分模糊,并且存在数据噪声,从而影响聚类性能,使聚类结果受制于局部最优影响的问题,提出一种基于MapReduce与优化布谷鸟算法的并行密度聚类算法。首先,该算法结合K-means中的近邻与逆近邻思路的策略KDBSCAN(K-means DBSCAN),通过计算各数据点的影响空间,以此重新定义基于密度的聚类(Density-based spatial dutering of apptications with noise,DBSCAN)算法中聚类簇的拓展条件,避免了不同密度聚类簇边界点划分模糊的问题;其次,结合KDBSCAN密度聚类中的近邻思想提出了一种可行的迭代性噪声点处理策略,减轻数据中噪声点对于聚类算法性能的影响;再次,提出基于传统布谷鸟算法的优化改进策略MCS(Majorization cuckoo search),通过衰减发现巢穴概率的权重,随着迭代搜寻次数的增加提升算法收敛速度,解决了聚类结果受制于局部最优的问题;最后,结合MapReduce提出了并行密度聚类策略MCS-KDBSCAN,通过并行化密度聚类算法运算,减轻了并行聚类算法局部最优解传递的通信负担,提升了算法性能。实验证明,提出的MCS-KDBSCAN并行化密度聚类算法在聚类精度、聚类运行时间等方面均较优。
文摘针对传统雷达信号识别方法对重点目标识别的针对性、时效性不强的问题,提出一种基于聚类和时序相关的重点雷达信号实时识别方法。首先,依据具有噪声的基于密度的聚类(density-based spatial clustering of application with noise,DBSCAN)算法对侦获信号的脉冲描述字进行分选;而后,利用分选所得脉冲的时序特征与重点目标信号脉冲重复间隔(pulse repetition interval,PRI)生成仿真信号;最后,计算仿真信号的互相关函数,基于相关度判断PRI参数是否匹配。仿真实验表明:所提方法明显提升了对重点目标信号的识别时效,能够应对存在噪声干扰和信号交叠的复杂信号环境,对局部脉冲参数丢失不敏感。
文摘桥梁结构的模态参数识别作为桥梁健康检测系统中的主要环节之一,参数识别的精确程度直接影响着桥梁健康评估的准确程度。因此,针对现阶段被广泛运用的确定-随机子空间算法(combined determine-stochastic subspace identification,CDSI)存在的不足,需人工参与稳定图中模态的辨识,提出了将基于密度的聚类算法(density-based spatial clustering of application with noise,DBSCAN)嵌入到该识别算法中,以提高模态参数识别的效率。首先简单介绍了CDSI识别算法和DBSCAN聚类的相关原理及定义,其次详细介绍了如何将DBSCAN聚类算法有效地嵌入到CDSI算法中,以实现对稳定图中模态的智能化辨识;最后以某大型斜拉桥为识别对象,并将识别结果与MIDAS有限元软件所得结果作对比,结果表明,所提改进CDSI识别算法能够精确地识别出桥梁结构的固有频率值,且所得模态振型图与理论振型图具有很好的相似性。
文摘多源时空轨迹数据隐含丰富的城市出行信息,通过对其进行挖掘、处理和分析,可以找到个体与群体之间的交互关系。针对轨迹数据挖掘研究范围单一,缺少多空间尺度研究的问题,提出一种融合多空间尺度特征的出行轨迹数据挖掘分析方法。以广东为例,结合社交媒体腾讯用户密度(Tencent user density,TUD)数据集,通过具有噪声的基于密度的聚类方法(density-based spatial clustering of applications with noise,DBSCAN)聚类算法与局部密度峰值计算法提取时空相似性轨迹区域,进而簇类分成一系列热点区域,获得不同时间粒度、不同空间尺度下的出行轨迹规律特征。这能够实现在不同空间尺度融合下展示同一地区的热点区域,进一步探讨出行轨迹的规律变化。可见所提出的方法为利用时空大数据进行城市空间结构研究提供科学参考。