期刊文献+
共找到249篇文章
< 1 2 13 >
每页显示 20 50 100
基于邻域互信息与K-means特征聚类的特征选择 被引量:1
1
作者 孙林 梁娜 徐久成 《智能系统学报》 CSCD 北大核心 2024年第4期983-996,共14页
针对多数邻域系统通过人工调试很难搜索到最佳邻域半径,以及传统的K-means聚类需要随机选取簇中心和指定簇的数目等问题,提出了一种基于邻域互信息与K-means特征聚类的特征选择方法。首先,将样本在各特征下与其他样本距离的平均值作为... 针对多数邻域系统通过人工调试很难搜索到最佳邻域半径,以及传统的K-means聚类需要随机选取簇中心和指定簇的数目等问题,提出了一种基于邻域互信息与K-means特征聚类的特征选择方法。首先,将样本在各特征下与其他样本距离的平均值作为自适应邻域半径,确定样本的邻域集,并由此构建自适应邻域熵、邻域互信息、归一化邻域互信息等度量,反映特征之间的相关性;然后,基于归一化邻域互信息构建自适应K近邻集合,利用Pearson相关系数表示特征的权重定义加权K近邻密度,实现自动选取K-means算法的簇中心,进而完成K-means特征聚类;最后,给出加权平均冗余度,选出每个特征簇中加权平均冗余度最大的特征构成最优特征子集。实验结果表明所提算法不仅可以有效提升特征选择的分类结果而且可以获得更好的聚类效果。 展开更多
关键词 特征选择 邻域互信息 k-means 特征聚类 自适应k近邻 特征权重 加权k近邻密度
下载PDF
融合最近邻矩阵与局部密度的自适应K-means聚类算法 被引量:6
2
作者 艾力米努尔·库尔班 谢娟英 姚若侠 《计算机科学与探索》 CSCD 北大核心 2023年第2期355-366,共12页
针对传统K-means聚类算法对初始聚类中心和离群孤立点敏感的缺陷,以及现有引入密度概念优化的K-means算法均需要设置密度参数或阈值的缺点,提出一种融合最近邻矩阵与局部密度的自适应K-means聚类算法。受最邻近吸收原则与密度峰值原则启... 针对传统K-means聚类算法对初始聚类中心和离群孤立点敏感的缺陷,以及现有引入密度概念优化的K-means算法均需要设置密度参数或阈值的缺点,提出一种融合最近邻矩阵与局部密度的自适应K-means聚类算法。受最邻近吸收原则与密度峰值原则启发,通过引入数据对象间的距离差异值构造邻近矩阵,根据邻近矩阵计算局部密度,不需要任何参数设置,采取最近邻矩阵与局部密度融合策略,自适应确定初始聚类中心数目和位置,同时完成非中心点的初分配。人工数据集和UCI数据集的实验测试,以及与传统K-means算法、基于离群点改进的K-means算法、基于密度改进的K-means算法的实验比较表明,提出的自适应K-means算法对人工数据集的孤立点免疫度较高,对UCI数据集具有更准确的聚类结果。 展开更多
关键词 自适应k-means聚类算法 密度峰值原则 最邻近吸收原则 局部密度
下载PDF
基于概率密度的自适应k近邻缺失值填充方法
3
作者 梁路 林俊跃 霍颖翔 《华南师范大学学报(自然科学版)》 CAS 北大核心 2024年第4期80-90,共11页
基于k近邻的缺失值填充方法通常使用样本间的距离来度量样本的相似性,在计算距离时,没有区分样本各属性的权重,即所有属性对距离的贡献是一样的。然而,在非均匀分布的不平衡数据集中,样本的异质性往往体现在取值不常见的属性上,即样本... 基于k近邻的缺失值填充方法通常使用样本间的距离来度量样本的相似性,在计算距离时,没有区分样本各属性的权重,即所有属性对距离的贡献是一样的。然而,在非均匀分布的不平衡数据集中,样本的异质性往往体现在取值不常见的属性上,即样本之间的相似性受属性取值概率影响,此时用传统的距离公式来度量相似性是不够准确的。因此,文章针对非均匀分布的不平衡数据集提出了一种自适应k近邻缺失值填充方法(AkNNI):首先,引入属性的概率密度,动态调整各个属性的重要性,凸显稀疏值与缩小频繁值在距离计算上的贡献,从而更好地表达样本的异质性以及捕捉样本之间的相似性;然后,针对高缺失率下数据集中完备样本稀少的情况,综合考虑了样本的相似性和完整性,设计了新的k近邻的选择流程。实验选取了6个非均匀分布数据集,对比了AkNNI方法与其他5种经典填充方法的填充效果,验证了填充后的数据集在k近邻分类器的分类效果,深入探索了3种评估指标的相互关系。实验结果表明AkNNI方法具有更高的填充准确度和分类准确度:在6种缺失值填充算法中,AkNNI方法在各个数据集上取得的平均RMSE最低、平均皮尔逊相关系数最高以及平均分类准确率最高。同时,在高缺失率下,AkNNI方法在各个数据集上仍能保持较低的RMSE、较高的皮尔逊相关系数和较高的分类准确度。 展开更多
关键词 欧氏距离 k近邻 缺失值填充 概率密度 非均匀分布
下载PDF
KNMC:基于近内存计算的k-NN和k-means加速器设计
4
作者 连铎 刘博生 +1 位作者 吴亚兰 武继刚 《小型微型计算机系统》 CSCD 北大核心 2023年第7期1405-1411,共7页
k近邻算法(k-Nearest Neighbor,k-NN)和k-均值(k-means)算法在数据挖掘,文本分类,人脸识别等领域中被广泛应用.相比于深度学习(如卷积神经网络,Convolutional Neural Networks,CNNs),k-NN和k-means能获得相近的精度情况下提供更简单的计... k近邻算法(k-Nearest Neighbor,k-NN)和k-均值(k-means)算法在数据挖掘,文本分类,人脸识别等领域中被广泛应用.相比于深度学习(如卷积神经网络,Convolutional Neural Networks,CNNs),k-NN和k-means能获得相近的精度情况下提供更简单的计算.尽管如此,硬件加速器在计算k-NN和k-means过程中,需大量访问片外动态随机存取存储器(Dynamic Random-Access Memory,DRAM)设备,能耗非常高.为解决这一问题,本项工作提出一个基于近内存计算(near-memory computing)的k-NN和k-means的可配置加速器KNMC.该加速器通过配置能灵活调度k-NN和k-means.为提高加速器的能效,本项工作还进行设计空间探索,探索加速器达到最优能效的片上缓存(on-chip buffer)容量和处理单元(Process Element,PE)规模的配置.实验结果表明,KNMC与最先进的基准加速器相比,能有效提升性能和能效. 展开更多
关键词 加速器 k近邻算法 k-均值算法 近内存计算 设计空间探索
下载PDF
基于MDk-DPC的空中目标自动分群方法
5
作者 马钰棠 孙鹏 +2 位作者 张杰勇 闫云飞 赵亮 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第10期3219-3229,共11页
空中目标分群本质上是一个类数未知的聚类问题,也是战场态势估计领域中的研究热点。针对未知的空战场环境,从聚类角度提出一种基于流形距离和k近邻采样密度的MDk-DPC算法。引入流形距离代替欧氏距离,以增加同一流形中目标的相似性;利用... 空中目标分群本质上是一个类数未知的聚类问题,也是战场态势估计领域中的研究热点。针对未知的空战场环境,从聚类角度提出一种基于流形距离和k近邻采样密度的MDk-DPC算法。引入流形距离代替欧氏距离,以增加同一流形中目标的相似性;利用k近邻计算目标的局部密度,使其能更真实地反映目标周围分布;通过自适应选取聚类中心方法确定聚类中心,并运用密度峰值算法指定剩余点类别完成分群。仿真实验表明,所提方法在人工合成数据集和UCI真实数据集上均有更好的聚类性能,同时通过对空战场仿真数据进行分群验证了所提方法的可行性和有效性。 展开更多
关键词 态势估计 目标分群 流形距离 k近邻 密度峰值聚类
下载PDF
基于CK-Hough联合算法的人体微多普勒频率估计
6
作者 陈雨馨 彭意群 +1 位作者 柳润金 丁一鹏 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第9期3329-3341,共13页
为了准确地从雷达回波信号中提取运动目标特定部位的微多普勒频率,本文提出一种新颖的CKHough算法,该算法有效地结合了聚类分析和K近邻-霍夫(KNN-Hough)算法。首先,通过短时傅里叶变换获取雷达回波信号的时频谱图;其次,利用自适应模糊C... 为了准确地从雷达回波信号中提取运动目标特定部位的微多普勒频率,本文提出一种新颖的CKHough算法,该算法有效地结合了聚类分析和K近邻-霍夫(KNN-Hough)算法。首先,通过短时傅里叶变换获取雷达回波信号的时频谱图;其次,利用自适应模糊C均值算法对时频图进行聚类分析,在这一过程中,本文采用数据预处理技术自适应调整聚类类别数c以适应多样化应用场景,从而获得人体各散射部位的频域范围,有效地抑制了分量间的相互干扰;第三,通过改进度量函数的K近邻算法增强相邻时刻聚类结果的相关性,拟合各部位的瞬时频率曲线;最后,采用霍夫变换动态调整度量函数中权值μ的取值,得到目标微多普勒频率的精确估计结果。研究结果表明:本文提出的CK-Hough提取了直/曲线行走场景下人类目标四肢的微多普勒频率;与传统的峰值搜索算法、线性预测维特比算法以及基于Bezier-Hough模型的频率拟合算法相比,本文提出的CK-Hough算法在直线行走实验场景下,总频率的估计误差率分别降低了40.40%、45.47%和26.16%;在曲线行走实验场景下,其估计误差率分别降低了58.35%、68.35%和41.65%。 展开更多
关键词 微多普勒频率提取 时频分析 自适应模糊C均值聚类 k近邻 霍夫变换
下载PDF
基于KNN和多特征融合的苹果叶部病害识别检测
7
作者 李亚文 陈月星 呼高翔 《食品与发酵科技》 CAS 2024年第4期25-32,共8页
准确识别与防治苹果叶部病害,能够有效提高苹果的产量与品质。以常见的苹果叶部病害(锈病、黑腐病、黑星病)为研究对象,构建基于KNN和多特征融合的无损检测模型。使用K-means聚类算法分割苹果叶部图像,通过颜色矩、灰度共生矩阵、Hu距... 准确识别与防治苹果叶部病害,能够有效提高苹果的产量与品质。以常见的苹果叶部病害(锈病、黑腐病、黑星病)为研究对象,构建基于KNN和多特征融合的无损检测模型。使用K-means聚类算法分割苹果叶部图像,通过颜色矩、灰度共生矩阵、Hu距分别提取图像的颜色、纹理和形状特征,利用KNN对特征参数进行分类模型训练,能够实现绿色准确识别苹果叶部病害的目的。实验结果表明,以颜色、纹理、形状为单特征检测的苹果叶部病害识别精确率分别为75%、57%、45%,其中颜色特征更加直观,有9个特征量识别率较高,形状特征在进行图像分割时很难确定K点导致识别率低。该研究基于颜色、纹理、形状等多特征融合提取13个特征量,能够准确识别苹果叶部病害,其识别率达84%,为实现绿色农业果园病虫害防治提供技术支持。 展开更多
关键词 k-近邻方法 k-means聚类算法 多特征融合提取 苹果叶部 病害识别
下载PDF
改进K均值聚类下铣床轴承沟道磨损检测研究
8
作者 睢雪亮 夏景攀 《自动化仪表》 CAS 2024年第10期80-85,共6页
针对铣床轴承沟道磨损检测精度较低的问题,提出改进K均值聚类下铣床轴承沟道磨损检测方法。通过UT372手持式光电速度仪与MPU-605压电加速度仪,采集铣床轴承沟道磨损数据。根据最远最近原则,初步选取数据集的聚类中心。使用欧氏距离计算... 针对铣床轴承沟道磨损检测精度较低的问题,提出改进K均值聚类下铣床轴承沟道磨损检测方法。通过UT372手持式光电速度仪与MPU-605压电加速度仪,采集铣床轴承沟道磨损数据。根据最远最近原则,初步选取数据集的聚类中心。使用欧氏距离计算出数据集各点间的距离与所有数据的平均距离,并结合交叉验证确定聚类中心的两个阈值。引入Canopy算法改进K均值聚类,确定全局最佳的聚类中心,从而实现铣床轴承沟道磨损的智能检测。试验结果表明,改进K均值聚类算法在铣床轴承沟道磨损检测中,迭代次数固定为15次、Jaccard系数极其接近1。该方法能够显著提升聚类的计算速度和稳定性,可识别不同铣床轴承沟道磨损故障类型,且检测精度高。 展开更多
关键词 铣床轴承 沟道磨损 k均值聚类 Canopy算法 聚类中心 欧氏距离 最远最近原则 交叉验证确定
下载PDF
A Hybrid K-Means-GRA-SVR Model Based on Feature Selection for Day-Ahead Prediction of Photovoltaic Power Generation
9
作者 Jiemin Lin Haiming Li 《Journal of Computer and Communications》 2021年第11期91-111,共21页
In order to ensure that the large-scale application of photovoltaic power generation does not affect the stability of the grid, accurate photovoltaic (PV) power generation forecast is essential. A short-term PV power ... In order to ensure that the large-scale application of photovoltaic power generation does not affect the stability of the grid, accurate photovoltaic (PV) power generation forecast is essential. A short-term PV power generation forecast method using the combination of K-means++, grey relational analysis (GRA) and support vector regression (SVR) based on feature selection (Hybrid Kmeans-GRA-SVR, HKGSVR) was proposed. The historical power data were clustered through the multi-index K-means++ algorithm and divided into ideal and non-ideal weather. The GRA algorithm was used to match the similar day and the nearest neighbor similar day of the prediction day. And selected appropriate input features for different weather types to train the SVR model. Under ideal weather, the average values of MAE, RMSE and R2 were 0.8101, 0.9608 kW and 99.66%, respectively. And this method reduced the average training time by 77.27% compared with the standard SVR model. Under non-ideal weather conditions, the average values of MAE, RMSE and R2 were 1.8337, 2.1379 kW and 98.47%, respectively. And this method reduced the average training time of the standard SVR model by 98.07%. The experimental results show that the prediction accuracy of the proposed model is significantly improved compared to the other five models, which verify the effectiveness of the method. 展开更多
关键词 Feature Selection Grey Relational Analysis k-means++ nearest Neighbor Similar Day Photovoltaic Power Support Vector Regression
下载PDF
A Study of EM Algorithm as an Imputation Method: A Model-Based Simulation Study with Application to a Synthetic Compositional Data
10
作者 Yisa Adeniyi Abolade Yichuan Zhao 《Open Journal of Modelling and Simulation》 2024年第2期33-42,共10页
Compositional data, such as relative information, is a crucial aspect of machine learning and other related fields. It is typically recorded as closed data or sums to a constant, like 100%. The statistical linear mode... Compositional data, such as relative information, is a crucial aspect of machine learning and other related fields. It is typically recorded as closed data or sums to a constant, like 100%. The statistical linear model is the most used technique for identifying hidden relationships between underlying random variables of interest. However, data quality is a significant challenge in machine learning, especially when missing data is present. The linear regression model is a commonly used statistical modeling technique used in various applications to find relationships between variables of interest. When estimating linear regression parameters which are useful for things like future prediction and partial effects analysis of independent variables, maximum likelihood estimation (MLE) is the method of choice. However, many datasets contain missing observations, which can lead to costly and time-consuming data recovery. To address this issue, the expectation-maximization (EM) algorithm has been suggested as a solution for situations including missing data. The EM algorithm repeatedly finds the best estimates of parameters in statistical models that depend on variables or data that have not been observed. This is called maximum likelihood or maximum a posteriori (MAP). Using the present estimate as input, the expectation (E) step constructs a log-likelihood function. Finding the parameters that maximize the anticipated log-likelihood, as determined in the E step, is the job of the maximization (M) phase. This study looked at how well the EM algorithm worked on a made-up compositional dataset with missing observations. It used both the robust least square version and ordinary least square regression techniques. The efficacy of the EM algorithm was compared with two alternative imputation techniques, k-Nearest Neighbor (k-NN) and mean imputation (), in terms of Aitchison distances and covariance. 展开更多
关键词 Compositional Data Linear Regression Model Least Square Method Robust Least Square Method Synthetic Data Aitchison distance Maximum Likelihood Estimation Expectation-Maximization Algorithm k-nearest Neighbor and Mean imputation
下载PDF
基于K-means和近邻回归算法的Kinect植株深度图像修复 被引量:19
11
作者 沈跃 徐慧 +1 位作者 刘慧 李宁 《农业工程学报》 EI CAS CSCD 北大核心 2016年第19期188-194,共7页
针对Kinect传感器应用于农业植株检测产生的图像噪声问题,特别是由光线以及传感器自身局限导致的匹配图像目标植株数据的缺失,提出一种基于K-means和近邻回归算法的植株深度检测图像修复方法。首先对Kinect传感器获取的彩色RGB图像进行... 针对Kinect传感器应用于农业植株检测产生的图像噪声问题,特别是由光线以及传感器自身局限导致的匹配图像目标植株数据的缺失,提出一种基于K-means和近邻回归算法的植株深度检测图像修复方法。首先对Kinect传感器获取的彩色RGB图像进行阈值分割预处理提取植株目标区域,再利用K-means聚类算法去除背景噪声,使得植株目标区域轮廓更加清晰;然后基于配准的彩色图像和深度图像,对获取的深度图像中可疑像素点的深度数据采取近邻回归算法进行修复,再将修复后的深度图像与目标分割后的彩色图像进行植株区域的匹配,并进行二次近邻回归算法修正错误的深度数据,最后获取目标植株深度信息的检测图像。试验结果证明,采用RGB阈值分割和K-means聚类算法植株目标区域分割误差均值为12.33%,比单一RGB阈值分割和K-means聚类分割误差降低了12.12和41.48个百分点;同时结合聚类后的彩色图像对深度数据进行两次近邻回归算法修复深度数据,能够提高深度数据边缘的清晰度,单帧深度数据空洞点进行修复数据的准确度提高。该研究结果可为农业植株检测、植株三维重构、精准对靶喷雾等提供参考。 展开更多
关键词 图像处理 图像分割 算法 植株检测 深度数据 图像修复 k-means聚类 近邻回归
下载PDF
图像高维数据的K-means自适应聚类算法 被引量:6
12
作者 唐颖军 黄淑英 +2 位作者 杨勇 戴利云 李贤虹 《小型微型计算机系统》 CSCD 北大核心 2016年第8期1854-1856,共3页
在图像信息处理中视觉词典生成过程需要对高维数据进行聚类操作.但这些高维数据不可避免会对计算机内存和计算能力提出更高要求.本文针对聚类过程中可能产生的内存耗尽以及初始聚类质心设置问题,对现有K-means算法加以改进.通过建立初... 在图像信息处理中视觉词典生成过程需要对高维数据进行聚类操作.但这些高维数据不可避免会对计算机内存和计算能力提出更高要求.本文针对聚类过程中可能产生的内存耗尽以及初始聚类质心设置问题,对现有K-means算法加以改进.通过建立初始聚类质心与各类场景中的特定语义的关联,使之体现图像各类场景的类别特征集合,进而用于指导K-means过程中的初始质心设置.此外,在迭代过程中通过批次读入特征描述子,采用K近邻进行簇分配,从而避免了一次性读入全部特征描述子而造成的内存耗尽问题.同时,对于新的簇质心生成采用综合判别均值与中位值的办法来提高各族的聚合度.本文方法与Oxford University提出的K-means进行了对比,实验结果表明本文算法在性能与收敛上更具优势. 展开更多
关键词 k均值聚类 视觉词典 图像高维特征描述 k近邻
下载PDF
基于最近共享邻居节点的K-means聚类算法 被引量:2
13
作者 单世民 于红 +1 位作者 张业嘉诚 刘馨月 《计算机工程与应用》 CSCD 北大核心 2008年第6期178-181,共4页
聚类分析是一种重要的数据挖掘方法。K-means聚类算法在数据挖掘领域具有非常重要的应用价值。针对K-means需要人工设定聚类个数并且易陷入局部极优的缺陷,提出了一种基于最近共享邻近节点的K-means聚类算法(KSNN)。KSNN在数据集中搜索... 聚类分析是一种重要的数据挖掘方法。K-means聚类算法在数据挖掘领域具有非常重要的应用价值。针对K-means需要人工设定聚类个数并且易陷入局部极优的缺陷,提出了一种基于最近共享邻近节点的K-means聚类算法(KSNN)。KSNN在数据集中搜索中心点,依据中心点查找数据集个数,为K-means聚类提供参数。从而克服了K-means需要人工设定聚类个数的问题,同时具有较好的全局收敛性。实验证明KSNN算法比K-means、粒子群K-means(pso)以及多中心聚类算法(MCA)有更好的聚类效果。 展开更多
关键词 聚类分析 kmeans 最近共享邻居
下载PDF
改进K-means聚类的自适应加权K近邻指纹定位算法 被引量:11
14
作者 邬春明 齐森南 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2021年第6期946-954,共9页
针对指纹定位精度易受指纹数据K-means聚类预处理效果不佳、加权K近邻算法采用固定K值进行匹配定位精度差等问题,提出一种基于改进K-means聚类的自适应加权K近邻算法。算法在对指纹数据进行聚类计算过程中充分考虑参考点间接收信号强度... 针对指纹定位精度易受指纹数据K-means聚类预处理效果不佳、加权K近邻算法采用固定K值进行匹配定位精度差等问题,提出一种基于改进K-means聚类的自适应加权K近邻算法。算法在对指纹数据进行聚类计算过程中充分考虑参考点间接收信号强度值与实际物理坐标的双重影响,以避免参考点分类不明确;根据每个测试点的匹配参考点之间实际距离的均值和标准差设置阈值,动态选择K值。实验结果证明,改进K-means聚类的自适应加权K近邻算法相较于传统室内定位算法定位精度提高了44%,可为相关应用提供更精确的定位服务。 展开更多
关键词 WI-FI 指纹定位 坐标相似度 k-means聚类 自适应加权k近邻算法
下载PDF
基于k-means及改进k近邻的WiFi指纹定位算法 被引量:2
15
作者 郭昕刚 胡朗 《长春工业大学学报》 CAS 2018年第1期73-79,共7页
在离线建库阶段,通过k-means聚类对采集到的指纹进行聚类分析,分成k类,使距离相近的指纹组合在一起,以减少在线匹配的工作量。在线定位阶段,首先找到与定位点RSSI信息相似的类,然后通过距离加权KNN算法,对定位点位置进行估算,确定目标... 在离线建库阶段,通过k-means聚类对采集到的指纹进行聚类分析,分成k类,使距离相近的指纹组合在一起,以减少在线匹配的工作量。在线定位阶段,首先找到与定位点RSSI信息相似的类,然后通过距离加权KNN算法,对定位点位置进行估算,确定目标位置。 展开更多
关键词 室内定位 位置指纹 k-means聚类 加权k近邻
下载PDF
用于雷达信号分选的连通k近邻聚类算法 被引量:1
16
作者 司伟建 张悦 邓志安 《系统工程与电子技术》 EI CSCD 北大核心 2023年第8期2463-2470,共8页
为了能够在密集且复杂多变的信号环境中进行实时有效的信号分选,需要一种具有较低复杂度且能够根据信号环境自动调整参数的聚类方法。在模糊聚类算法的基础上结合k近邻搜索,将λ邻域范围搜索变为λ邻域内k近邻搜索,提出了连通k近邻聚类(... 为了能够在密集且复杂多变的信号环境中进行实时有效的信号分选,需要一种具有较低复杂度且能够根据信号环境自动调整参数的聚类方法。在模糊聚类算法的基础上结合k近邻搜索,将λ邻域范围搜索变为λ邻域内k近邻搜索,提出了连通k近邻聚类(connected k-nearest neighbor clustering,CkNNC)算法。相比模糊聚类算法,所提算法时间复杂度降低而空间复杂度稍有增加。为使得该算法能够根据信号环境自动进行参数调整,提出了基于k距离图的阈值参数确定方法。所提算法具有时间复杂度低与阈值参数自动确定的特点,仿真结果表明所提算法与使用Calinski-Harabasz指标确定最佳阈值的低复杂度模糊聚类算法相比,分选效果差距不大、性能相近,而时间复杂度大幅下降。 展开更多
关键词 电子对抗 信号分选 聚类 k近邻 k距离图
下载PDF
K近邻空间密度分布的模糊聚类算法
17
作者 张利 路颜萍 +1 位作者 侯晴 张皓博 《辽宁大学学报(自然科学版)》 CAS 2023年第4期289-301,F0002,共14页
聚类是数据挖掘研究和应用中必不可少的工具,然而不完整数据对现有聚类算法提出了挑战.针对不完整数据聚类中插补方法带来的不确定性问题,本文提出一种K近邻空间密度分布的模糊聚类算法.首先,根据样本间相似度确定缺失数据的K最近邻样本... 聚类是数据挖掘研究和应用中必不可少的工具,然而不完整数据对现有聚类算法提出了挑战.针对不完整数据聚类中插补方法带来的不确定性问题,本文提出一种K近邻空间密度分布的模糊聚类算法.首先,根据样本间相似度确定缺失数据的K最近邻样本集.在此基础上,由于缺失值具有不确定性,引入基于K最近邻样本集的数据分布信息,进一步将缺失数据填补为区间形式.其次,考虑聚类中离群点影响,引入数据空间密度分布,提出一种密度分布的区间型模糊C均值算法.最后,采用模糊C均值算法将填补的区间数据进行聚类.实验结果表明,在UCI数据集和人工数据集上,该算法能有效提高聚类准确性和鲁棒性. 展开更多
关键词 不完整数据 k近邻 模糊C均值 密度
下载PDF
最近邻优化的k-means聚类算法 被引量:30
18
作者 林涛 赵璨 《计算机科学》 CSCD 北大核心 2019年第S11期216-219,共4页
传统的k-means算法不论其数据样本的分布情况,将簇边缘位置、簇中心位置、离群点的数据样本全部按照最小距离原则,划分到离它最近的聚类中心所在簇中,没有考虑数据样本与其他簇之间的关系。如果数据样本与另一簇中心的距离接近于最小距... 传统的k-means算法不论其数据样本的分布情况,将簇边缘位置、簇中心位置、离群点的数据样本全部按照最小距离原则,划分到离它最近的聚类中心所在簇中,没有考虑数据样本与其他簇之间的关系。如果数据样本与另一簇中心的距离接近于最小距离,则此数据样本与两个簇的关系都很大,显然这样直接划分并不合理。针对此问题,文中提出了最近邻优化的k-means聚类算法。运用近邻的思想,将这些不“很属于”某簇的数据样本划分到其最近邻数据样本所在的簇中,实验结果表明,这种最近邻优化的k-means聚类算法有效地减少了算法的迭代次数,提高了算法的聚类准确度,得到了良好的聚类效果。 展开更多
关键词 k-means 分布 关系 最近邻
下载PDF
基于GAWK-means的地铁车站指纹定位方法 被引量:1
19
作者 金霄 吴飞 +2 位作者 鄢松 陆雯霞 张忠艺 《电子科技》 2022年第2期34-39,共6页
针对在城市轨道交通车站内,利用iBeacon技术进行指纹定位时存在匹配效率较低、定位精度不理想的问题,文中提出了一种基于GAWK-means的地铁车站指纹定位方法。离线阶段,根据指纹数据本身的离散程度进行K-means欧式距离权重优化以便更好... 针对在城市轨道交通车站内,利用iBeacon技术进行指纹定位时存在匹配效率较低、定位精度不理想的问题,文中提出了一种基于GAWK-means的地铁车站指纹定位方法。离线阶段,根据指纹数据本身的离散程度进行K-means欧式距离权重优化以便更好地体现类内相似度,再将改进的K-means结合遗传算法,优化聚类结果以减少陷入局部最优。在线阶段,利用K近邻法将信号向量与最为接近的子指纹库匹配获得定位结果,通过平均定位误差对该方法整体性能进行评估。实验结果表明,在地铁车站离线阶段使用GAWK-means算法平均定位误差为1.52 m,相较于未聚类和传统K-means聚类,定位误差减少了0.41 m以上。 展开更多
关键词 地铁车站 iBeacon技术 指纹定位 遗传算法 k-means聚类 欧式距离 k近邻法 GAWk-means
下载PDF
基于K近邻非参数回归的压痕弹性模量估计
20
作者 金宏平 《湖北汽车工业学院学报》 2023年第4期76-80,共5页
基于球压痕过程的有限元分析,建立了无量纲压痕功和无量纲压痕弹性模量的数据集。采用相关性分析方法发现球压痕的特征参数之间存在明显的非线性特性。结果表明:相对于K近邻、加权K近邻和高斯K近邻,采用5近邻和曼哈顿距离的模糊K近邻回... 基于球压痕过程的有限元分析,建立了无量纲压痕功和无量纲压痕弹性模量的数据集。采用相关性分析方法发现球压痕的特征参数之间存在明显的非线性特性。结果表明:相对于K近邻、加权K近邻和高斯K近邻,采用5近邻和曼哈顿距离的模糊K近邻回归估计算法来估计压痕弹性模量,能够获得较高精度的压痕弹性模量。 展开更多
关键词 压痕弹性模量 k近邻 回归 曼哈顿距离
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部