期刊文献+
共找到123篇文章
< 1 2 7 >
每页显示 20 50 100
基于邻域互信息与K-means特征聚类的特征选择 被引量:1
1
作者 孙林 梁娜 徐久成 《智能系统学报》 CSCD 北大核心 2024年第4期983-996,共14页
针对多数邻域系统通过人工调试很难搜索到最佳邻域半径,以及传统的K-means聚类需要随机选取簇中心和指定簇的数目等问题,提出了一种基于邻域互信息与K-means特征聚类的特征选择方法。首先,将样本在各特征下与其他样本距离的平均值作为... 针对多数邻域系统通过人工调试很难搜索到最佳邻域半径,以及传统的K-means聚类需要随机选取簇中心和指定簇的数目等问题,提出了一种基于邻域互信息与K-means特征聚类的特征选择方法。首先,将样本在各特征下与其他样本距离的平均值作为自适应邻域半径,确定样本的邻域集,并由此构建自适应邻域熵、邻域互信息、归一化邻域互信息等度量,反映特征之间的相关性;然后,基于归一化邻域互信息构建自适应K近邻集合,利用Pearson相关系数表示特征的权重定义加权K近邻密度,实现自动选取K-means算法的簇中心,进而完成K-means特征聚类;最后,给出加权平均冗余度,选出每个特征簇中加权平均冗余度最大的特征构成最优特征子集。实验结果表明所提算法不仅可以有效提升特征选择的分类结果而且可以获得更好的聚类效果。 展开更多
关键词 特征选择 邻域互信息 K-meanS 特征聚类 自适应K近邻 特征权重 加权K近邻密度
下载PDF
融合最近邻矩阵与局部密度的自适应K-means聚类算法 被引量:6
2
作者 艾力米努尔·库尔班 谢娟英 姚若侠 《计算机科学与探索》 CSCD 北大核心 2023年第2期355-366,共12页
针对传统K-means聚类算法对初始聚类中心和离群孤立点敏感的缺陷,以及现有引入密度概念优化的K-means算法均需要设置密度参数或阈值的缺点,提出一种融合最近邻矩阵与局部密度的自适应K-means聚类算法。受最邻近吸收原则与密度峰值原则启... 针对传统K-means聚类算法对初始聚类中心和离群孤立点敏感的缺陷,以及现有引入密度概念优化的K-means算法均需要设置密度参数或阈值的缺点,提出一种融合最近邻矩阵与局部密度的自适应K-means聚类算法。受最邻近吸收原则与密度峰值原则启发,通过引入数据对象间的距离差异值构造邻近矩阵,根据邻近矩阵计算局部密度,不需要任何参数设置,采取最近邻矩阵与局部密度融合策略,自适应确定初始聚类中心数目和位置,同时完成非中心点的初分配。人工数据集和UCI数据集的实验测试,以及与传统K-means算法、基于离群点改进的K-means算法、基于密度改进的K-means算法的实验比较表明,提出的自适应K-means算法对人工数据集的孤立点免疫度较高,对UCI数据集具有更准确的聚类结果。 展开更多
关键词 自适应K-means聚类算法 密度峰值原则 最邻近吸收原则 局部密度
下载PDF
KNMC:基于近内存计算的k-NN和k-means加速器设计
3
作者 连铎 刘博生 +1 位作者 吴亚兰 武继刚 《小型微型计算机系统》 CSCD 北大核心 2023年第7期1405-1411,共7页
k近邻算法(k-Nearest Neighbor,k-NN)和k-均值(k-means)算法在数据挖掘,文本分类,人脸识别等领域中被广泛应用.相比于深度学习(如卷积神经网络,Convolutional Neural Networks,CNNs),k-NN和k-means能获得相近的精度情况下提供更简单的计... k近邻算法(k-Nearest Neighbor,k-NN)和k-均值(k-means)算法在数据挖掘,文本分类,人脸识别等领域中被广泛应用.相比于深度学习(如卷积神经网络,Convolutional Neural Networks,CNNs),k-NN和k-means能获得相近的精度情况下提供更简单的计算.尽管如此,硬件加速器在计算k-NN和k-means过程中,需大量访问片外动态随机存取存储器(Dynamic Random-Access Memory,DRAM)设备,能耗非常高.为解决这一问题,本项工作提出一个基于近内存计算(near-memory computing)的k-NN和k-means的可配置加速器KNMC.该加速器通过配置能灵活调度k-NN和k-means.为提高加速器的能效,本项工作还进行设计空间探索,探索加速器达到最优能效的片上缓存(on-chip buffer)容量和处理单元(Process Element,PE)规模的配置.实验结果表明,KNMC与最先进的基准加速器相比,能有效提升性能和能效. 展开更多
关键词 加速器 K近邻算法 K-均值算法 近内存计算 设计空间探索
下载PDF
基于覆盖树的自适应均值漂移聚类算法
4
作者 温柳英 庞柯 《计算机工程与设计》 北大核心 2024年第2期452-458,共7页
为解决均值漂移聚类算法聚类效果依赖于带宽参数的主观选取,以及处理密度变化大的数据集时聚类结果精确度问题,提出一种基于覆盖树的自适应均值漂移聚类算法MSCT(MeanShift based on Cover-Tree)。构建一个覆盖树数据集,在计算漂移向量... 为解决均值漂移聚类算法聚类效果依赖于带宽参数的主观选取,以及处理密度变化大的数据集时聚类结果精确度问题,提出一种基于覆盖树的自适应均值漂移聚类算法MSCT(MeanShift based on Cover-Tree)。构建一个覆盖树数据集,在计算漂移向量过程中结合覆盖树数据集获得新的漂移向量结果KnnShift,在不同数据密度分布的数据集上都能自适应产生带宽参数,所有数据点完成漂移过程后获得聚类结果。实验结果表明,MSCT算法的聚类效果整体上优于MS、DBSCAN等算法。 展开更多
关键词 聚类 均值漂移 覆盖树 滑动窗口 最近邻 密度聚类 机器学习
下载PDF
基于K-means和近邻回归算法的Kinect植株深度图像修复 被引量:19
5
作者 沈跃 徐慧 +1 位作者 刘慧 李宁 《农业工程学报》 EI CAS CSCD 北大核心 2016年第19期188-194,共7页
针对Kinect传感器应用于农业植株检测产生的图像噪声问题,特别是由光线以及传感器自身局限导致的匹配图像目标植株数据的缺失,提出一种基于K-means和近邻回归算法的植株深度检测图像修复方法。首先对Kinect传感器获取的彩色RGB图像进行... 针对Kinect传感器应用于农业植株检测产生的图像噪声问题,特别是由光线以及传感器自身局限导致的匹配图像目标植株数据的缺失,提出一种基于K-means和近邻回归算法的植株深度检测图像修复方法。首先对Kinect传感器获取的彩色RGB图像进行阈值分割预处理提取植株目标区域,再利用K-means聚类算法去除背景噪声,使得植株目标区域轮廓更加清晰;然后基于配准的彩色图像和深度图像,对获取的深度图像中可疑像素点的深度数据采取近邻回归算法进行修复,再将修复后的深度图像与目标分割后的彩色图像进行植株区域的匹配,并进行二次近邻回归算法修正错误的深度数据,最后获取目标植株深度信息的检测图像。试验结果证明,采用RGB阈值分割和K-means聚类算法植株目标区域分割误差均值为12.33%,比单一RGB阈值分割和K-means聚类分割误差降低了12.12和41.48个百分点;同时结合聚类后的彩色图像对深度数据进行两次近邻回归算法修复深度数据,能够提高深度数据边缘的清晰度,单帧深度数据空洞点进行修复数据的准确度提高。该研究结果可为农业植株检测、植株三维重构、精准对靶喷雾等提供参考。 展开更多
关键词 图像处理 图像分割 算法 植株检测 深度数据 图像修复 K-meanS聚类 近邻回归
下载PDF
基于最近共享邻居节点的K-means聚类算法 被引量:2
6
作者 单世民 于红 +1 位作者 张业嘉诚 刘馨月 《计算机工程与应用》 CSCD 北大核心 2008年第6期178-181,共4页
聚类分析是一种重要的数据挖掘方法。K-means聚类算法在数据挖掘领域具有非常重要的应用价值。针对K-means需要人工设定聚类个数并且易陷入局部极优的缺陷,提出了一种基于最近共享邻近节点的K-means聚类算法(KSNN)。KSNN在数据集中搜索... 聚类分析是一种重要的数据挖掘方法。K-means聚类算法在数据挖掘领域具有非常重要的应用价值。针对K-means需要人工设定聚类个数并且易陷入局部极优的缺陷,提出了一种基于最近共享邻近节点的K-means聚类算法(KSNN)。KSNN在数据集中搜索中心点,依据中心点查找数据集个数,为K-means聚类提供参数。从而克服了K-means需要人工设定聚类个数的问题,同时具有较好的全局收敛性。实验证明KSNN算法比K-means、粒子群K-means(pso)以及多中心聚类算法(MCA)有更好的聚类效果。 展开更多
关键词 聚类分析 K—means 最近共享邻居
下载PDF
一种改进的局部均值伪近邻算法
7
作者 李毅 张德生 张晓 《计算机工程与应用》 CSCD 北大核心 2024年第5期88-94,共7页
针对基于局部均值的伪近邻分类算法(LMPNN)易受近邻参数k和噪声点影响的问题,提出了一种改进的局部均值伪近邻分类算法(IPLMPNN)。利用双层搜索规则确定待测样本的最近邻,提高近邻集的选择质量;为了克服主观赋权法的不利影响,并且加强... 针对基于局部均值的伪近邻分类算法(LMPNN)易受近邻参数k和噪声点影响的问题,提出了一种改进的局部均值伪近邻分类算法(IPLMPNN)。利用双层搜索规则确定待测样本的最近邻,提高近邻集的选择质量;为了克服主观赋权法的不利影响,并且加强每个局部均值向量对分类的作用,引入注意力机制计算距离加权系数;使用改进的调和平均距离计算待测样本与局部均值向量之间的加权多调和平均距离,由此查找伪近邻点对待测样本进行分类。利用UCI和KEEL中的多个数据集对IPLMPNN算法进行仿真实验,并与8种相关算法进行比较。实验结果表明,IPLMPNN算法取得了令人满意的分类结果。 展开更多
关键词 局部均值的伪近邻分类算法(LMPNN) 双层搜索 注意力机制 多调和平均距离
下载PDF
基于Mean-Shift的广播音频聚类算法 被引量:3
8
作者 郑继明 俞佳 《计算机应用》 CSCD 北大核心 2009年第10期2741-2743,2750,共4页
针对大多数聚类算法依赖聚类数目这一先验知识的不足,提出一种基于均值漂移(Mean-Shift)的新广播音频聚类算法。对需聚类的音频段选取基于小波域的特征构造特征集合,通过主成分分析方法降低所提取特征中的冗余信息。在此基础上,采用Mean... 针对大多数聚类算法依赖聚类数目这一先验知识的不足,提出一种基于均值漂移(Mean-Shift)的新广播音频聚类算法。对需聚类的音频段选取基于小波域的特征构造特征集合,通过主成分分析方法降低所提取特征中的冗余信息。在此基础上,采用Mean-Shift算法对音频信号进行初步聚类,然后利用快速近邻法对其聚类结果进行一次修正,最后合并仅含有单个样本类别的类进行二次修正。实验结果表明,该算法的聚类精度有一定的提高。 展开更多
关键词 主成分分析 均值漂移算法 快速近邻法 二次修正 广播音频聚类
下载PDF
图像高维数据的K-means自适应聚类算法 被引量:6
9
作者 唐颖军 黄淑英 +2 位作者 杨勇 戴利云 李贤虹 《小型微型计算机系统》 CSCD 北大核心 2016年第8期1854-1856,共3页
在图像信息处理中视觉词典生成过程需要对高维数据进行聚类操作.但这些高维数据不可避免会对计算机内存和计算能力提出更高要求.本文针对聚类过程中可能产生的内存耗尽以及初始聚类质心设置问题,对现有K-means算法加以改进.通过建立初... 在图像信息处理中视觉词典生成过程需要对高维数据进行聚类操作.但这些高维数据不可避免会对计算机内存和计算能力提出更高要求.本文针对聚类过程中可能产生的内存耗尽以及初始聚类质心设置问题,对现有K-means算法加以改进.通过建立初始聚类质心与各类场景中的特定语义的关联,使之体现图像各类场景的类别特征集合,进而用于指导K-means过程中的初始质心设置.此外,在迭代过程中通过批次读入特征描述子,采用K近邻进行簇分配,从而避免了一次性读入全部特征描述子而造成的内存耗尽问题.同时,对于新的簇质心生成采用综合判别均值与中位值的办法来提高各族的聚合度.本文方法与Oxford University提出的K-means进行了对比,实验结果表明本文算法在性能与收敛上更具优势. 展开更多
关键词 K均值聚类 视觉词典 图像高维特征描述 K近邻
下载PDF
改进K-means聚类的自适应加权K近邻指纹定位算法 被引量:11
10
作者 邬春明 齐森南 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2021年第6期946-954,共9页
针对指纹定位精度易受指纹数据K-means聚类预处理效果不佳、加权K近邻算法采用固定K值进行匹配定位精度差等问题,提出一种基于改进K-means聚类的自适应加权K近邻算法。算法在对指纹数据进行聚类计算过程中充分考虑参考点间接收信号强度... 针对指纹定位精度易受指纹数据K-means聚类预处理效果不佳、加权K近邻算法采用固定K值进行匹配定位精度差等问题,提出一种基于改进K-means聚类的自适应加权K近邻算法。算法在对指纹数据进行聚类计算过程中充分考虑参考点间接收信号强度值与实际物理坐标的双重影响,以避免参考点分类不明确;根据每个测试点的匹配参考点之间实际距离的均值和标准差设置阈值,动态选择K值。实验结果证明,改进K-means聚类的自适应加权K近邻算法相较于传统室内定位算法定位精度提高了44%,可为相关应用提供更精确的定位服务。 展开更多
关键词 WI-FI 指纹定位 坐标相似度 K-meanS聚类 自适应加权K近邻算法
下载PDF
基于k-means及改进k近邻的WiFi指纹定位算法 被引量:2
11
作者 郭昕刚 胡朗 《长春工业大学学报》 CAS 2018年第1期73-79,共7页
在离线建库阶段,通过k-means聚类对采集到的指纹进行聚类分析,分成k类,使距离相近的指纹组合在一起,以减少在线匹配的工作量。在线定位阶段,首先找到与定位点RSSI信息相似的类,然后通过距离加权KNN算法,对定位点位置进行估算,确定目标... 在离线建库阶段,通过k-means聚类对采集到的指纹进行聚类分析,分成k类,使距离相近的指纹组合在一起,以减少在线匹配的工作量。在线定位阶段,首先找到与定位点RSSI信息相似的类,然后通过距离加权KNN算法,对定位点位置进行估算,确定目标位置。 展开更多
关键词 室内定位 位置指纹 K-meanS聚类 加权k近邻
下载PDF
基于aFCM-KNN的风电功率缺失值填补
12
作者 李一凡 黄景涛 关海平 《计算机仿真》 2024年第8期52-57,共6页
风电实时运行数据在采集、传输和存储过程中的缺失值问题,给基于运行数据的风电功率预测等应用带来困难。针对以上问题,提出一种基于自适应模糊聚类的近邻填补算法aFCM-KNN。鉴于风电数据自身具有的强随机性和波动性,基于FCM算法根据风... 风电实时运行数据在采集、传输和存储过程中的缺失值问题,给基于运行数据的风电功率预测等应用带来困难。针对以上问题,提出一种基于自适应模糊聚类的近邻填补算法aFCM-KNN。鉴于风电数据自身具有的强随机性和波动性,基于FCM算法根据风速对风电数据进行工况聚类,为解决FCM需人为设定聚类个数受主观影响较大的问题,依据风电数据分布特征设计了一个自适应确定聚类个数的策略;考虑到聚类后直接填补容易受噪声的影响,基于KNN算法根据缺失值所在样本的近邻点对每个子簇内的缺失值进行填补,进一步提高了填补精度。在实际数据上的测试分析表明,与其它六种常用填补算法相比,该方法的填补准确率更高。 展开更多
关键词 风电功率 缺失值填补 模糊均值聚类 近邻算法
下载PDF
基于CK-Hough联合算法的人体微多普勒频率估计
13
作者 陈雨馨 彭意群 +1 位作者 柳润金 丁一鹏 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第9期3329-3341,共13页
为了准确地从雷达回波信号中提取运动目标特定部位的微多普勒频率,本文提出一种新颖的CKHough算法,该算法有效地结合了聚类分析和K近邻-霍夫(KNN-Hough)算法。首先,通过短时傅里叶变换获取雷达回波信号的时频谱图;其次,利用自适应模糊C... 为了准确地从雷达回波信号中提取运动目标特定部位的微多普勒频率,本文提出一种新颖的CKHough算法,该算法有效地结合了聚类分析和K近邻-霍夫(KNN-Hough)算法。首先,通过短时傅里叶变换获取雷达回波信号的时频谱图;其次,利用自适应模糊C均值算法对时频图进行聚类分析,在这一过程中,本文采用数据预处理技术自适应调整聚类类别数c以适应多样化应用场景,从而获得人体各散射部位的频域范围,有效地抑制了分量间的相互干扰;第三,通过改进度量函数的K近邻算法增强相邻时刻聚类结果的相关性,拟合各部位的瞬时频率曲线;最后,采用霍夫变换动态调整度量函数中权值μ的取值,得到目标微多普勒频率的精确估计结果。研究结果表明:本文提出的CK-Hough提取了直/曲线行走场景下人类目标四肢的微多普勒频率;与传统的峰值搜索算法、线性预测维特比算法以及基于Bezier-Hough模型的频率拟合算法相比,本文提出的CK-Hough算法在直线行走实验场景下,总频率的估计误差率分别降低了40.40%、45.47%和26.16%;在曲线行走实验场景下,其估计误差率分别降低了58.35%、68.35%和41.65%。 展开更多
关键词 微多普勒频率提取 时频分析 自适应模糊C均值聚类 K近邻 霍夫变换
下载PDF
考虑建成环境的酒驾事故时空分布特征
14
作者 于晓桦 田雨晗 杨大志 《交通科技与经济》 2024年第4期36-44,共9页
为深入了解我国酒驾事故的时空分布特征及其与周围建成环境的空间距离阈值,以济南市2022年发生的1034起酒驾事故与13029起非酒驾事故案例为研究对象,结合季节性强度指数与地理集中指数等衡量指标,分析酒驾事故的时空分布特征;利用近邻... 为深入了解我国酒驾事故的时空分布特征及其与周围建成环境的空间距离阈值,以济南市2022年发生的1034起酒驾事故与13029起非酒驾事故案例为研究对象,结合季节性强度指数与地理集中指数等衡量指标,分析酒驾事故的时空分布特征;利用近邻分析与基于最大类簇直径改进的K-means聚类算法,探究出周围建成环境与酒驾事故点的空间距离阈值。结果表明:酒驾事故的时间分布季节强度指数为4.128,大于非酒驾事故的3.839,时间分布差异性更大,且高发时段(20:00—02:00)与餐饮服务的高峰营业时间一致。酒驾事故的地理集中指数G为32.713%,大于均匀分布情况下的地理集中指数G,空间集聚程度更高,且与周围建成环境分布具有密切联系。餐饮服务、购物服务、住宿服务与商务住宅的聚类中心点到酒驾事故点的距离阈值分别为798.415 m、694.378 m、658.234 m与739.622 m。 展开更多
关键词 交通安全 酒驾事故 近邻分析 K-meanS聚类算法 距离阈值
下载PDF
基于KNN和多特征融合的苹果叶部病害识别检测
15
作者 李亚文 陈月星 呼高翔 《食品与发酵科技》 CAS 2024年第4期25-32,共8页
准确识别与防治苹果叶部病害,能够有效提高苹果的产量与品质。以常见的苹果叶部病害(锈病、黑腐病、黑星病)为研究对象,构建基于KNN和多特征融合的无损检测模型。使用K-means聚类算法分割苹果叶部图像,通过颜色矩、灰度共生矩阵、Hu距... 准确识别与防治苹果叶部病害,能够有效提高苹果的产量与品质。以常见的苹果叶部病害(锈病、黑腐病、黑星病)为研究对象,构建基于KNN和多特征融合的无损检测模型。使用K-means聚类算法分割苹果叶部图像,通过颜色矩、灰度共生矩阵、Hu距分别提取图像的颜色、纹理和形状特征,利用KNN对特征参数进行分类模型训练,能够实现绿色准确识别苹果叶部病害的目的。实验结果表明,以颜色、纹理、形状为单特征检测的苹果叶部病害识别精确率分别为75%、57%、45%,其中颜色特征更加直观,有9个特征量识别率较高,形状特征在进行图像分割时很难确定K点导致识别率低。该研究基于颜色、纹理、形状等多特征融合提取13个特征量,能够准确识别苹果叶部病害,其识别率达84%,为实现绿色农业果园病虫害防治提供技术支持。 展开更多
关键词 K-近邻方法 K-meanS聚类算法 多特征融合提取 苹果叶部 病害识别
下载PDF
A Study of EM Algorithm as an Imputation Method: A Model-Based Simulation Study with Application to a Synthetic Compositional Data
16
作者 Yisa Adeniyi Abolade Yichuan Zhao 《Open Journal of Modelling and Simulation》 2024年第2期33-42,共10页
Compositional data, such as relative information, is a crucial aspect of machine learning and other related fields. It is typically recorded as closed data or sums to a constant, like 100%. The statistical linear mode... Compositional data, such as relative information, is a crucial aspect of machine learning and other related fields. It is typically recorded as closed data or sums to a constant, like 100%. The statistical linear model is the most used technique for identifying hidden relationships between underlying random variables of interest. However, data quality is a significant challenge in machine learning, especially when missing data is present. The linear regression model is a commonly used statistical modeling technique used in various applications to find relationships between variables of interest. When estimating linear regression parameters which are useful for things like future prediction and partial effects analysis of independent variables, maximum likelihood estimation (MLE) is the method of choice. However, many datasets contain missing observations, which can lead to costly and time-consuming data recovery. To address this issue, the expectation-maximization (EM) algorithm has been suggested as a solution for situations including missing data. The EM algorithm repeatedly finds the best estimates of parameters in statistical models that depend on variables or data that have not been observed. This is called maximum likelihood or maximum a posteriori (MAP). Using the present estimate as input, the expectation (E) step constructs a log-likelihood function. Finding the parameters that maximize the anticipated log-likelihood, as determined in the E step, is the job of the maximization (M) phase. This study looked at how well the EM algorithm worked on a made-up compositional dataset with missing observations. It used both the robust least square version and ordinary least square regression techniques. The efficacy of the EM algorithm was compared with two alternative imputation techniques, k-Nearest Neighbor (k-NN) and mean imputation (), in terms of Aitchison distances and covariance. 展开更多
关键词 Compositional Data Linear Regression Model Least Square Method Robust Least Square Method Synthetic Data Aitchison Distance Maximum Likelihood Estimation Expectation-Maximization Algorithm k-nearest neighbor and mean imputation
下载PDF
优化初始聚类中心选择的K-means算法 被引量:8
17
作者 杨一帆 贺国先 李永定 《电脑知识与技术》 2021年第5期252-255,共4页
K-means算法的聚类效果与初始聚类中心的选择以及数据中的孤立点有很大关联,具有很强的不确定性。针对这个缺点,提出了一种优化初始聚类中心选择的K-means算法。该算法考虑数据集的分布情况,将样本点分为孤立点、低密度点和核心点,之后... K-means算法的聚类效果与初始聚类中心的选择以及数据中的孤立点有很大关联,具有很强的不确定性。针对这个缺点,提出了一种优化初始聚类中心选择的K-means算法。该算法考虑数据集的分布情况,将样本点分为孤立点、低密度点和核心点,之后剔除孤立点与低密度点,在核心点中选取初始聚类中心,孤立点不参与聚类过程中各类样本均值的计算。按照距离最近原则将孤立点分配到相应类中完成整个算法。实验结果表明,改进的K-means算法能提高聚类的准确率,减少迭代次数,得到更好的聚类结果。 展开更多
关键词 聚类 K-meanS 最近邻点密度 初始聚类中心 孤立点
下载PDF
最近邻优化的k-means聚类算法 被引量:30
18
作者 林涛 赵璨 《计算机科学》 CSCD 北大核心 2019年第S11期216-219,共4页
传统的k-means算法不论其数据样本的分布情况,将簇边缘位置、簇中心位置、离群点的数据样本全部按照最小距离原则,划分到离它最近的聚类中心所在簇中,没有考虑数据样本与其他簇之间的关系。如果数据样本与另一簇中心的距离接近于最小距... 传统的k-means算法不论其数据样本的分布情况,将簇边缘位置、簇中心位置、离群点的数据样本全部按照最小距离原则,划分到离它最近的聚类中心所在簇中,没有考虑数据样本与其他簇之间的关系。如果数据样本与另一簇中心的距离接近于最小距离,则此数据样本与两个簇的关系都很大,显然这样直接划分并不合理。针对此问题,文中提出了最近邻优化的k-means聚类算法。运用近邻的思想,将这些不“很属于”某簇的数据样本划分到其最近邻数据样本所在的簇中,实验结果表明,这种最近邻优化的k-means聚类算法有效地减少了算法的迭代次数,提高了算法的聚类准确度,得到了良好的聚类效果。 展开更多
关键词 K-meanS 分布 关系 最近邻
下载PDF
基于GAWK-means的地铁车站指纹定位方法 被引量:1
19
作者 金霄 吴飞 +2 位作者 鄢松 陆雯霞 张忠艺 《电子科技》 2022年第2期34-39,共6页
针对在城市轨道交通车站内,利用iBeacon技术进行指纹定位时存在匹配效率较低、定位精度不理想的问题,文中提出了一种基于GAWK-means的地铁车站指纹定位方法。离线阶段,根据指纹数据本身的离散程度进行K-means欧式距离权重优化以便更好... 针对在城市轨道交通车站内,利用iBeacon技术进行指纹定位时存在匹配效率较低、定位精度不理想的问题,文中提出了一种基于GAWK-means的地铁车站指纹定位方法。离线阶段,根据指纹数据本身的离散程度进行K-means欧式距离权重优化以便更好地体现类内相似度,再将改进的K-means结合遗传算法,优化聚类结果以减少陷入局部最优。在线阶段,利用K近邻法将信号向量与最为接近的子指纹库匹配获得定位结果,通过平均定位误差对该方法整体性能进行评估。实验结果表明,在地铁车站离线阶段使用GAWK-means算法平均定位误差为1.52 m,相较于未聚类和传统K-means聚类,定位误差减少了0.41 m以上。 展开更多
关键词 地铁车站 iBeacon技术 指纹定位 遗传算法 K-meanS聚类 欧式距离 K近邻法 GAWK-means
下载PDF
基于KD树的k-means聚类算法优化 被引量:6
20
作者 薛丁文 李建中 《智能计算机与应用》 2021年第11期194-197,共4页
作为模式识别最基本的分类方法之一,聚类在各个科学领域的数据分析中都扮演着重要的角色。然而随着大数据的出现,聚类分析在前沿发展中不断地面临着计算复杂度和计算成本等新的问题和挑战。通过研究k-means聚类算法的时间复杂度O(nk),... 作为模式识别最基本的分类方法之一,聚类在各个科学领域的数据分析中都扮演着重要的角色。然而随着大数据的出现,聚类分析在前沿发展中不断地面临着计算复杂度和计算成本等新的问题和挑战。通过研究k-means聚类算法的时间复杂度O(nk),针对迭代过程中大量的最近邻计算和其特殊场景,引入KD树作为索引,提出了基于单KD树的近似近邻算法和基于多KD树的交叉搜索算法。将k-means聚类算法的时间复杂度降为O(nlog k),并通过实验验证,基于多树的交叉搜索算法具有与k-means聚类算法相当的聚类质量。 展开更多
关键词 聚类分析 K-meanS聚类 KD树 近似近邻
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部