期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于改进DBSCAN空间聚类算法的北京市人工智能产业集聚格局研究 被引量:1
1
作者 张平 范文慧 +1 位作者 贾婧 刘义 《地理科学》 CSSCI CSCD 北大核心 2024年第2期238-247,共10页
企业作为产业的重要主体,其发展直接表征着产业的发展,企业的空间格局对产业的发展及资源配置具有重要的引导意义。本文基于北京市工商注册在业的人工智能企业数据,提取企业注册地址并转化为地理位置信息,通过改进有噪声的应用背景下的... 企业作为产业的重要主体,其发展直接表征着产业的发展,企业的空间格局对产业的发展及资源配置具有重要的引导意义。本文基于北京市工商注册在业的人工智能企业数据,提取企业注册地址并转化为地理位置信息,通过改进有噪声的应用背景下的基于密度的空间聚类算法(DBSCAN),分析北京市细粒度层级下人工智能产业集聚在全市域的空间分布格局特征。在DBSCAN算法改进方面,首先调整Minpts参数为企业注册资本总额与企业数量2个维度,企业数量大于5家且注册资本总额大于一定数额,为形成产业集聚区的2个必要条件;其次提取簇内位于边界的企业位置点作为集聚区地理边界点,将边界点连线并绘制形成人工智能产业集聚区。本文重点分析了企业注册资本和地理聚合半径对人工智能产业集聚区形成的影响,同时采用核密度估计法作为参照验证,表明改进DBSCAN方法具有精确刻画产业集聚区地理边界和确定不同规模产业集聚区的优势。通过分析得知,北京市人工智能产业集聚具有明显的中心分布特征,集中在城六区,呈现“两大龙头带动,北京市全域遍地开花”的分布情况,海淀区、朝阳区处于人工智能集聚程度高水平,相较其他区域,人工智能产业发展遥遥领先;西城区、东城区、丰台区、昌平区处于集聚程度较高水平;通州区、大兴区、平谷区、密云区、石景山区、房山区、门头沟区、怀柔区、顺义区处于集聚程度中等水平;延庆区集聚程度较低。通过改进DBSCAN算法精确定位出中关村区域、上地西二旗区域、五道口区域、望京区域、国贸区域、亦庄经开区等人工智能产业集聚区。进一步探究发现,海淀区的人工智能科研人才优势,朝阳区的信息技术领域企业基础,是两区人工智能发展突出的直接原因。延庆区等郊区远离北京市中心城区,产业资源匮乏,同时由于区域功能定位限制等原因,导致人工智能产业集聚水平较低,表明这些区域人工智能产业发展较为缓慢。 展开更多
关键词 人工智能 产业集聚 改进dbscan算法 核密度估计 GIS 北京
下载PDF
核DBSCAN算法在民航客户细分中的应用 被引量:11
2
作者 潘玲玲 张育平 徐涛 《计算机工程》 CAS CSCD 2012年第10期70-73,共4页
针对民航客户行为数据的复杂性,运用数据挖掘中的DBSCAN聚类技术,结合核映射机理,提出一种基于核的DBSCAN算法,用于实现民航客户的细分。实验结果表明,该方法能突出客户之间的行为特征差异,降低聚类结果的混乱性,且其聚类纯度比原DBSCA... 针对民航客户行为数据的复杂性,运用数据挖掘中的DBSCAN聚类技术,结合核映射机理,提出一种基于核的DBSCAN算法,用于实现民航客户的细分。实验结果表明,该方法能突出客户之间的行为特征差异,降低聚类结果的混乱性,且其聚类纯度比原DBSCAN算法约提升30%。 展开更多
关键词 客户关系管理 数据挖掘 dbscan算法 民航客户细分
下载PDF
网格化局部自适应DBSCAN聚类算法 被引量:12
3
作者 代少升 刘小兵 +1 位作者 赖智颖 任忠 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2022年第2期250-257,共8页
经典DBSCAN(density based spatial clustering of applications with noise)算法需要人工指定邻域半径(Eps)和点数阈值(Minpts),且均为全局参数,导致聚类准确率低。针对此问题,为了提高经典DBSCAN聚类算法的聚类准确率,基于网格划分思... 经典DBSCAN(density based spatial clustering of applications with noise)算法需要人工指定邻域半径(Eps)和点数阈值(Minpts),且均为全局参数,导致聚类准确率低。针对此问题,为了提高经典DBSCAN聚类算法的聚类准确率,基于网格划分思想,提出了一种局部自适应DBSCAN聚类算法。根据数据集自身特征生成网格空间,将特征数据映射至相应的网格空间;利用高斯核函数估计每个网格区间的局部密度;联合多维度网格密度分布信息,寻找无连接或弱连接高密度网格之间的区域,同时统计同区域的波峰数量,从而自适应确定各区域的Eps及Minpts参数;使用每个区域独有的参数作为DBSCAN算法输入,并进行聚类。实验结果表明,该算法能够在聚类过程中自适应确定每个局部区域的Eps和Minpts参数,聚类准确率高且耗时较低。 展开更多
关键词 网格 非均匀 高斯核 局部自适应 dbscan算法
下载PDF
改进的自适应参数DBSCAN聚类算法 被引量:38
4
作者 王光 林国宇 《计算机工程与应用》 CSCD 北大核心 2020年第14期45-51,共7页
针对传统DBSCAN算法需要人工输入Eps和MinPts参数,且参数选择不合理导致聚类准确率低的问题,提出了一种改进的自适应参数密度聚类算法。采用核密度估计确定Eps和MinPts参数的合理区间,通过分析数据局部密度特点确定簇数,根据合理区间内... 针对传统DBSCAN算法需要人工输入Eps和MinPts参数,且参数选择不合理导致聚类准确率低的问题,提出了一种改进的自适应参数密度聚类算法。采用核密度估计确定Eps和MinPts参数的合理区间,通过分析数据局部密度特点确定簇数,根据合理区间内的参数值进行聚类,计算满足簇数条件时的轮廓系数,最大轮廓系数对应的参数即为最优参数。在4种经典数据集上进行对比实验,结果表明,该算法能够自动选择最优的Eps和MinPts参数,准确率平均提高6.1%。 展开更多
关键词 密度聚类 dbscan算法 自适应 核密度估计 参数寻优
下载PDF
Spark并行化改进的SDKB-DBSCAN聚类算法
5
作者 史爱武 尹杰 范平 《现代计算机》 2021年第14期14-20,37,共8页
DBSCAN算法是基于密度的聚类算法,可在有噪声点的数据集中发现任意形状类簇,得到广泛应用。但其存在大规模磁盘I/O导致计算速度慢,密度不均匀类簇和人工干预确定阈值导致聚类偏差等缺陷,基于此提出Spark内存迭代并行化SDKB-DBSCAN(Spark... DBSCAN算法是基于密度的聚类算法,可在有噪声点的数据集中发现任意形状类簇,得到广泛应用。但其存在大规模磁盘I/O导致计算速度慢,密度不均匀类簇和人工干预确定阈值导致聚类偏差等缺陷,基于此提出Spark内存迭代并行化SDKB-DBSCAN(Spark Density Division Kernel Density Estimation Boundary Stategy-Density-based Spatial Clustering of Applications with Noise)改进算法,设计Spark缓存机制结合不规则动态分区和边界合并以及核密度估计并行化。实验表明,改进算法一般适用不同形状类簇和较大规模数据聚类,在准确率和计算速率上有一定提升。 展开更多
关键词 dbscan算法 Spark并行化 动态分区 核密度估计 缓存机制
下载PDF
昆明市中心城区服务业空间格局研究 被引量:1
6
作者 石光鹏 李向新 +1 位作者 蒋叶林 朱文 《贵州大学学报(自然科学版)》 2021年第2期17-24,共8页
为了探究昆明市中心城区服务业的空间分布特点,从高德地图开放平台中获取昆明市中心城区的兴趣点(point of interest,POI)数据,通过删除重复兴趣点、删除缺失的属性点对数据进行清理;以服务业兴趣点的密度为研究对象,采用核密度分析法... 为了探究昆明市中心城区服务业的空间分布特点,从高德地图开放平台中获取昆明市中心城区的兴趣点(point of interest,POI)数据,通过删除重复兴趣点、删除缺失的属性点对数据进行清理;以服务业兴趣点的密度为研究对象,采用核密度分析法确定了不同服务业的聚集中心,利用平均最邻近指数确定了研究区域内14类兴趣点在空间中均存在“聚集”的空间分布特征;采用KANN-DBSCAN聚类算法对研究区域内的服务业兴趣点进行聚类,并使用街道面积归一化得到每一类兴趣点在街道上的密度。结果表明:研究区内的服务业空间分布形成“一核多中心”的空间分布特征,城市服务设施呈“Y”型放射状发展;呈贡新区的教育职能突出,吸引了服务业设施的聚集;老城市中心服务职能复杂多样,其特征主要体现在商业设施及其周边配套形成的核心聚集和专业市场形成的多个中心的聚集;不同服务设施间的聚集程度存在较大差异。最后,结合分析结果为昆明市中心城区的服务设施的发展提出3点建议,可对昆明市中心城区服务业的发展提供一定参考。 展开更多
关键词 兴趣点 空间格局 KANN-dbscan算法 核密度分析 平均最邻近指数 昆明
下载PDF
—种树木聚集分布格局模拟方法
7
作者 麦春娜 邹杰 《微型机与应用》 2015年第15期85-88,共4页
针对现有聚集分布格局模拟方法存在的模拟结果主观性强、不自然、未考虑树木冠层要素三维空间分布及生态学聚类效应等不足,提出一种新的模拟方法。该方法首先利用形变核方法创建树木二维空间分布,并采用立体体元法对树木逐一开展可种植... 针对现有聚集分布格局模拟方法存在的模拟结果主观性强、不自然、未考虑树木冠层要素三维空间分布及生态学聚类效应等不足,提出一种新的模拟方法。该方法首先利用形变核方法创建树木二维空间分布,并采用立体体元法对树木逐一开展可种植性判断,之后采用DBSCAN算法对已有的树木分布点位开展聚集区域检测,并对检测后点位进行树种重分配。综合测试表明,本文提出的方法可较好地实现不同林分密度及树种条件下树木聚集分布格局模拟。 展开更多
关键词 聚集分布 森林场景 形变核方法 dbscan算法 体元化 聚类效应
下载PDF
一种基于核距离的车辆轨迹点聚类方法 被引量:5
8
作者 陆川伟 孙群 +3 位作者 季晓林 徐立 温伯威 程绵绵 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2020年第7期1082-1088,共7页
基于聚类算法进行车辆轨迹点信息提取与挖掘,在高精度车道信息提取与更新、道路拥堵时空分析与治理、用户出行线路规划与推荐等应用中具有重要意义。针对现有聚类算法的不足,提出基于核距离的车辆轨迹点聚类方法。首先给出车辆轨迹点的... 基于聚类算法进行车辆轨迹点信息提取与挖掘,在高精度车道信息提取与更新、道路拥堵时空分析与治理、用户出行线路规划与推荐等应用中具有重要意义。针对现有聚类算法的不足,提出基于核距离的车辆轨迹点聚类方法。首先给出车辆轨迹点的定义,分析车辆轨迹的几何特征和轨迹聚类的要求,然后基于核函数的概念,推导核距离的计算过程,提出核距离密度聚类算法,重定义密度聚类算法中核邻域、核心对象等概念,最后以郑州市出租车轨迹数据进行验证。实验表明,聚类算法在减少参数数量、结果沿道路中心线对称分布、降低计算时间、提取长类簇等方面具有显著优势,可以有效地实现有向轨迹点的聚类。 展开更多
关键词 车辆轨迹 点聚类 密度聚类 核距离 dbscan算法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部