An improved clustering algorithm was presented based on density-isoline clustering algorithm. The new algorithm can do a better job than density-isoline clustering when dealing with noise, not having to literately cal...An improved clustering algorithm was presented based on density-isoline clustering algorithm. The new algorithm can do a better job than density-isoline clustering when dealing with noise, not having to literately calculate the cluster centers for the samples batching into clusters instead of one by one. After repeated experiments, the results demonstrate that the improved density-isoline clustering algorithm is significantly more efficiency in clustering with noises and overcomes the drawbacks that traditional algorithm DILC deals with noise and that the efficiency of running time is improved greatly.展开更多
Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outl...Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outlier. In this work, an effective outlier detection method based on multi-dimensional clustering and local density(ODBMCLD) is proposed. ODBMCLD firstly identifies the center objects by the local density peak of data objects, and clusters the whole dataset based on the center objects. Then, outlier objects belonging to different clusters will be marked as candidates of abnormal data. Finally, the top N points among these abnormal candidates are chosen as final anomaly objects with high outlier factors. The feasibility and effectiveness of the method are verified by experiments.展开更多
针对出租车随意停靠造成城市交通拥堵甚至交通事故的问题,利用成都实际区域的出租车GPS(Global Position System)数据和爬取的POI(Point of Interest)数据,使用DBSCAN(Density-Based Spatial Clustering of Application with Noise)聚...针对出租车随意停靠造成城市交通拥堵甚至交通事故的问题,利用成都实际区域的出租车GPS(Global Position System)数据和爬取的POI(Point of Interest)数据,使用DBSCAN(Density-Based Spatial Clustering of Application with Noise)聚类算法对上下客点进行聚类,得到出租车的载客热点,根据POI的类型划定载客热点区域的类型,对出租车不同时间的出行需求进行分析,进而划分出出租车的固定停车区域。研究结果表明,出租车固定停车区域的设定与出行者的出行需求有关,即将固定停车区域设置在出行者出行需求多的区域,可以满足出行者的不同出行需求。结合出租车载客热点和爬取POI数据划定固定停车区域的方法具有较高的实用性,可为城市交通安全方面提供理论和现实意义。展开更多
构建了系列球形中空结构的纳米线(NW),采用分子动力学(MD)对每个模型300个不同初始态的样本开展拉伸形变模拟。并利用基于密度的噪声应用空间聚类(density-based spatial clustering of applications with noise,DBSCAN)机器学习算法,...构建了系列球形中空结构的纳米线(NW),采用分子动力学(MD)对每个模型300个不同初始态的样本开展拉伸形变模拟。并利用基于密度的噪声应用空间聚类(density-based spatial clustering of applications with noise,DBSCAN)机器学习算法,获得了初始滑移面的位置。基于大数据统计,分析了初始滑移位置分布以及断裂位置分布两者之间的相关性。研究结果表明:当内部中空半径较小时,断裂位置分布形成于塑性形变阶段,初始滑移分布与断裂位置分布之间无显著的相关性;但是对于脆性特征明显的大中空半径的NW,高能内表面诱导产生的滑移面迅速积累,产生颈缩并导致最终的断裂。因此当内部中空结构达到一定尺寸时初始滑移位置的分布与最终断裂位置的分布之间有明确的因果关系。展开更多
针对软刚臂系泊系统铰节点在服役过程中出现的疲劳损伤问题,提出一种基于原型监测和局部密度双向聚类算法(Bidirectional Clustering Algorithm based on Local Density,BCALoD)的疲劳寿命计算方法。采用BCALoD算法对获得的船体六自由...针对软刚臂系泊系统铰节点在服役过程中出现的疲劳损伤问题,提出一种基于原型监测和局部密度双向聚类算法(Bidirectional Clustering Algorithm based on Local Density,BCALoD)的疲劳寿命计算方法。采用BCALoD算法对获得的船体六自由度进行工况分类,运用多体动力学将运动数据转算为受力时程,将其作为铰节点疲劳寿命分析的载荷谱。采用Abaqus软件建立各铰节点有限元模型以计算热点应力,结合Miner线性疲劳累积损伤理论和雨流计数方法计算疲劳寿命。进一步分析评估基于实测数据的铰节点疲劳设计指标,指出该FPSO软刚臂上铰节点的疲劳寿命不足以支持其完成服役,且各铰节点难以统一维护和更换。本研究可为在役软刚臂系泊系统的疲劳寿命计算提供一种新的载荷处理方法,为未来海洋平台的设计提供参考。展开更多
准确识别岩质高边坡结构面和获取产状统计信息是进行边坡稳定性分析的重要前提。无人机摄影测量技术为解决高边坡结构面准确勘测难题提供了可能,但缺少高效准确的影像后处理方法,且现有研究没有考虑结构面产状信息特征的不确定性,致使...准确识别岩质高边坡结构面和获取产状统计信息是进行边坡稳定性分析的重要前提。无人机摄影测量技术为解决高边坡结构面准确勘测难题提供了可能,但缺少高效准确的影像后处理方法,且现有研究没有考虑结构面产状信息特征的不确定性,致使结构面识别准确性差、效率低。针对该问题,以江西省南昌市某露天矿高边坡为研究背景,提出了融合无人机摄影、后处理算法及统计分析的一体化结构面识别与产状统计信息采集方法。首先,通过Phantom 4 Pro V2.0无人机获取边坡表面影像;其次,利用Context Capture软件进行处理,得到高密度三维点云数据;然后,采用K近邻(KNN)算法中的确定近邻点数量法构建相似点集,采用基于密度的聚类(DBSCAN)算法进行聚类分析,从而实现边坡结构面识别,获得结构面产状信息并进行统计特征分析;最后,通过现场勘测数据进行对比验证。结果表明:该方法能够快速获取完整的高密度点云数据,准确高效地识别岩质高边坡大部分结构面,识别结果与边坡工程现场实际情况基本吻合;该方法可获取高边坡结构面数量、产状信息及其统计特征,大部分结构面倾角和倾向概率分布与实测数据拟合较好,为高边坡裂隙网络模型构建及稳定性分析提供了重要数据来源。展开更多
为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点...为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点及其满足核心点条件的邻域数据做局部聚类更新,降低聚类更新的时间复杂度,实现对空间数据流的在线聚类.OLDStream算法具有快速处理大规模空间数据流、实时获取全局任意形状的聚类簇结果、对数据流的输入顺序不敏感、并能发现孤立点数据等优势.在真实数据和合成数据上的综合实验验证了算法的聚类效果、高效率性和较高的可伸缩性,同时实验结果的统计分析显示仅有4%的空间点消耗最坏运行时间,对每个空间点的平均聚类时间约为0.033ms.展开更多
文摘An improved clustering algorithm was presented based on density-isoline clustering algorithm. The new algorithm can do a better job than density-isoline clustering when dealing with noise, not having to literately calculate the cluster centers for the samples batching into clusters instead of one by one. After repeated experiments, the results demonstrate that the improved density-isoline clustering algorithm is significantly more efficiency in clustering with noises and overcomes the drawbacks that traditional algorithm DILC deals with noise and that the efficiency of running time is improved greatly.
基金Project(61362021)supported by the National Natural Science Foundation of ChinaProject(2016GXNSFAA380149)supported by Natural Science Foundation of Guangxi Province,China+1 种基金Projects(2016YJCXB02,2017YJCX34)supported by Innovation Project of GUET Graduate Education,ChinaProject(2011KF11)supported by the Key Laboratory of Cognitive Radio and Information Processing,Ministry of Education,China
文摘Outlier detection is an important task in data mining. In fact, it is difficult to find the clustering centers in some sophisticated multidimensional datasets and to measure the deviation degree of each potential outlier. In this work, an effective outlier detection method based on multi-dimensional clustering and local density(ODBMCLD) is proposed. ODBMCLD firstly identifies the center objects by the local density peak of data objects, and clusters the whole dataset based on the center objects. Then, outlier objects belonging to different clusters will be marked as candidates of abnormal data. Finally, the top N points among these abnormal candidates are chosen as final anomaly objects with high outlier factors. The feasibility and effectiveness of the method are verified by experiments.
文摘针对出租车随意停靠造成城市交通拥堵甚至交通事故的问题,利用成都实际区域的出租车GPS(Global Position System)数据和爬取的POI(Point of Interest)数据,使用DBSCAN(Density-Based Spatial Clustering of Application with Noise)聚类算法对上下客点进行聚类,得到出租车的载客热点,根据POI的类型划定载客热点区域的类型,对出租车不同时间的出行需求进行分析,进而划分出出租车的固定停车区域。研究结果表明,出租车固定停车区域的设定与出行者的出行需求有关,即将固定停车区域设置在出行者出行需求多的区域,可以满足出行者的不同出行需求。结合出租车载客热点和爬取POI数据划定固定停车区域的方法具有较高的实用性,可为城市交通安全方面提供理论和现实意义。
文摘构建了系列球形中空结构的纳米线(NW),采用分子动力学(MD)对每个模型300个不同初始态的样本开展拉伸形变模拟。并利用基于密度的噪声应用空间聚类(density-based spatial clustering of applications with noise,DBSCAN)机器学习算法,获得了初始滑移面的位置。基于大数据统计,分析了初始滑移位置分布以及断裂位置分布两者之间的相关性。研究结果表明:当内部中空半径较小时,断裂位置分布形成于塑性形变阶段,初始滑移分布与断裂位置分布之间无显著的相关性;但是对于脆性特征明显的大中空半径的NW,高能内表面诱导产生的滑移面迅速积累,产生颈缩并导致最终的断裂。因此当内部中空结构达到一定尺寸时初始滑移位置的分布与最终断裂位置的分布之间有明确的因果关系。
文摘针对软刚臂系泊系统铰节点在服役过程中出现的疲劳损伤问题,提出一种基于原型监测和局部密度双向聚类算法(Bidirectional Clustering Algorithm based on Local Density,BCALoD)的疲劳寿命计算方法。采用BCALoD算法对获得的船体六自由度进行工况分类,运用多体动力学将运动数据转算为受力时程,将其作为铰节点疲劳寿命分析的载荷谱。采用Abaqus软件建立各铰节点有限元模型以计算热点应力,结合Miner线性疲劳累积损伤理论和雨流计数方法计算疲劳寿命。进一步分析评估基于实测数据的铰节点疲劳设计指标,指出该FPSO软刚臂上铰节点的疲劳寿命不足以支持其完成服役,且各铰节点难以统一维护和更换。本研究可为在役软刚臂系泊系统的疲劳寿命计算提供一种新的载荷处理方法,为未来海洋平台的设计提供参考。
文摘准确识别岩质高边坡结构面和获取产状统计信息是进行边坡稳定性分析的重要前提。无人机摄影测量技术为解决高边坡结构面准确勘测难题提供了可能,但缺少高效准确的影像后处理方法,且现有研究没有考虑结构面产状信息特征的不确定性,致使结构面识别准确性差、效率低。针对该问题,以江西省南昌市某露天矿高边坡为研究背景,提出了融合无人机摄影、后处理算法及统计分析的一体化结构面识别与产状统计信息采集方法。首先,通过Phantom 4 Pro V2.0无人机获取边坡表面影像;其次,利用Context Capture软件进行处理,得到高密度三维点云数据;然后,采用K近邻(KNN)算法中的确定近邻点数量法构建相似点集,采用基于密度的聚类(DBSCAN)算法进行聚类分析,从而实现边坡结构面识别,获得结构面产状信息并进行统计特征分析;最后,通过现场勘测数据进行对比验证。结果表明:该方法能够快速获取完整的高密度点云数据,准确高效地识别岩质高边坡大部分结构面,识别结果与边坡工程现场实际情况基本吻合;该方法可获取高边坡结构面数量、产状信息及其统计特征,大部分结构面倾角和倾向概率分布与实测数据拟合较好,为高边坡裂隙网络模型构建及稳定性分析提供了重要数据来源。
文摘为了解决空间数据流中任意形状簇的聚类问题,提出了一种基于密度的空间数据流在线聚类算法(On-line density-based clustering algorithm for spatial data stream,OLDStream),该算法在先前聚类结果上聚类增量空间数据,仅对新增空间点及其满足核心点条件的邻域数据做局部聚类更新,降低聚类更新的时间复杂度,实现对空间数据流的在线聚类.OLDStream算法具有快速处理大规模空间数据流、实时获取全局任意形状的聚类簇结果、对数据流的输入顺序不敏感、并能发现孤立点数据等优势.在真实数据和合成数据上的综合实验验证了算法的聚类效果、高效率性和较高的可伸缩性,同时实验结果的统计分析显示仅有4%的空间点消耗最坏运行时间,对每个空间点的平均聚类时间约为0.033ms.