期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
A Shared Natural Neighbors Based-Hierarchical Clustering Algorithm for Discovering Arbitrary-Shaped Clusters
1
作者 Zhongshang Chen Ji Feng +1 位作者 Fapeng Cai Degang Yang 《Computers, Materials & Continua》 SCIE EI 2024年第8期2031-2048,共18页
In clustering algorithms,the selection of neighbors significantly affects the quality of the final clustering results.While various neighbor relationships exist,such as K-nearest neighbors,natural neighbors,and shared... In clustering algorithms,the selection of neighbors significantly affects the quality of the final clustering results.While various neighbor relationships exist,such as K-nearest neighbors,natural neighbors,and shared neighbors,most neighbor relationships can only handle single structural relationships,and the identification accuracy is low for datasets with multiple structures.In life,people’s first instinct for complex things is to divide them into multiple parts to complete.Partitioning the dataset into more sub-graphs is a good idea approach to identifying complex structures.Taking inspiration from this,we propose a novel neighbor method:Shared Natural Neighbors(SNaN).To demonstrate the superiority of this neighbor method,we propose a shared natural neighbors-based hierarchical clustering algorithm for discovering arbitrary-shaped clusters(HC-SNaN).Our algorithm excels in identifying both spherical clusters and manifold clusters.Tested on synthetic datasets and real-world datasets,HC-SNaN demonstrates significant advantages over existing clustering algorithms,particularly when dealing with datasets containing arbitrary shapes. 展开更多
关键词 cluster analysis shared natural neighbor hierarchical clustering
下载PDF
Efficient Parallel Processing of k-Nearest Neighbor Queries by Using a Centroid-based and Hierarchical Clustering Algorithm
2
作者 Elaheh Gavagsaz 《Artificial Intelligence Advances》 2022年第1期26-41,共16页
The k-Nearest Neighbor method is one of the most popular techniques for both classification and regression purposes.Because of its operation,the application of this classification may be limited to problems with a cer... The k-Nearest Neighbor method is one of the most popular techniques for both classification and regression purposes.Because of its operation,the application of this classification may be limited to problems with a certain number of instances,particularly,when run time is a consideration.However,the classification of large amounts of data has become a fundamental task in many real-world applications.It is logical to scale the k-Nearest Neighbor method to large scale datasets.This paper proposes a new k-Nearest Neighbor classification method(KNN-CCL)which uses a parallel centroid-based and hierarchical clustering algorithm to separate the sample of training dataset into multiple parts.The introduced clustering algorithm uses four stages of successive refinements and generates high quality clusters.The k-Nearest Neighbor approach subsequently makes use of them to predict the test datasets.Finally,sets of experiments are conducted on the UCI datasets.The experimental results confirm that the proposed k-Nearest Neighbor classification method performs well with regard to classification accuracy and performance. 展开更多
关键词 CLASSIFICATION k-nearest neighbor Big data clustering Parallel processing
下载PDF
Density Clustering Algorithm Based on KD-Tree and Voting Rules
3
作者 Hui Du Zhiyuan Hu +1 位作者 Depeng Lu Jingrui Liu 《Computers, Materials & Continua》 SCIE EI 2024年第5期3239-3259,共21页
Traditional clustering algorithms often struggle to produce satisfactory results when dealing with datasets withuneven density. Additionally, they incur substantial computational costs when applied to high-dimensional... Traditional clustering algorithms often struggle to produce satisfactory results when dealing with datasets withuneven density. Additionally, they incur substantial computational costs when applied to high-dimensional datadue to calculating similarity matrices. To alleviate these issues, we employ the KD-Tree to partition the dataset andcompute the K-nearest neighbors (KNN) density for each point, thereby avoiding the computation of similaritymatrices. Moreover, we apply the rules of voting elections, treating each data point as a voter and casting a votefor the point with the highest density among its KNN. By utilizing the vote counts of each point, we develop thestrategy for classifying noise points and potential cluster centers, allowing the algorithm to identify clusters withuneven density and complex shapes. Additionally, we define the concept of “adhesive points” between two clustersto merge adjacent clusters that have similar densities. This process helps us identify the optimal number of clustersautomatically. Experimental results indicate that our algorithm not only improves the efficiency of clustering butalso increases its accuracy. 展开更多
关键词 Density peaks clustering KD-TREE k-nearest neighbors voting rules
下载PDF
A KNN-based two-step fuzzy clustering weighted algorithm for WLAN indoor positioning 被引量:3
4
作者 Xu Yubin Sun Yongliang Ma Lin 《High Technology Letters》 EI CAS 2011年第3期223-229,共7页
Although k-nearest neighbors (KNN) is a popular fingerprint match algorithm for its simplicity and accuracy, because it is sensitive to the circumstances, a fuzzy c-means (FCM) clustering algorithm is applied to i... Although k-nearest neighbors (KNN) is a popular fingerprint match algorithm for its simplicity and accuracy, because it is sensitive to the circumstances, a fuzzy c-means (FCM) clustering algorithm is applied to improve it. Thus, a KNN-based two-step FCM weighted (KTFW) algorithm for indoor positioning in wireless local area networks (WLAN) is presented in this paper. In KTFW algorithm, k reference points (RPs) chosen by KNN are clustered through FCM based on received signal strength (RSS) and location coordinates. The right clusters are chosen according to rules, so three sets of RPs are formed including the set of k RPs chosen by KNN and are given different weights. RPs supposed to have better contribution to positioning accuracy are given larger weights to improve the positioning accuracy. Simulation results indicate that KTFW generally outperforms KNN and its complexity is greatly reduced through providing initial clustering centers for FCM. 展开更多
关键词 wireless local area networks (WLAN) indoor positioning k-nearest neighbors (KNN) fuzzy c-means (FCM) clustering center
下载PDF
Contrastive Clustering for Unsupervised Recognition of Interference Signals
5
作者 Xiangwei Chen Zhijin Zhao +3 位作者 Xueyi Ye Shilian Zheng Caiyi Lou Xiaoniu Yang 《Computer Systems Science & Engineering》 SCIE EI 2023年第8期1385-1400,共16页
Interference signals recognition plays an important role in anti-jamming communication.With the development of deep learning,many supervised interference signals recognition algorithms based on deep learning have emer... Interference signals recognition plays an important role in anti-jamming communication.With the development of deep learning,many supervised interference signals recognition algorithms based on deep learning have emerged recently and show better performance than traditional recognition algorithms.However,there is no unsupervised interference signals recognition algorithm at present.In this paper,an unsupervised interference signals recognition method called double phases and double dimensions contrastive clustering(DDCC)is proposed.Specifically,in the first phase,four data augmentation strategies for interference signals are used in data-augmentation-based(DA-based)contrastive learning.In the second phase,the original dataset’s k-nearest neighbor set(KNNset)is designed in double dimensions contrastive learning.In addition,a dynamic entropy parameter strategy is proposed.The simulation experiments of 9 types of interference signals show that random cropping is the best one of the four data augmentation strategies;the feature dimensional contrastive learning in the second phase can improve the clustering purity;the dynamic entropy parameter strategy can improve the stability of DDCC effectively.The unsupervised interference signals recognition results of DDCC and five other deep clustering algorithms show that the clustering performance of DDCC is superior to other algorithms.In particular,the clustering purity of our method is above 92%,SCAN’s is 81%,and the other three methods’are below 71%when jammingnoise-ratio(JNR)is−5 dB.In addition,our method is close to the supervised learning algorithm. 展开更多
关键词 Interference signals recognition unsupervised clustering contrastive learning deep learning k-nearest neighbor
下载PDF
融合转移概率矩阵的多阶最近邻图聚类算法
6
作者 徐童童 解滨 +1 位作者 张春昊 张喜梅 《计算机应用》 CSCD 北大核心 2024年第5期1527-1538,共12页
聚类是根据样本之间的相似性将数据集划分为多个类簇。现有的大多数聚类方法都存在两个挑战:一方面,在定义样本间相似性时往往没有考虑样本的空间分布结构,无法构建稳定的相似度矩阵;另一方面,图聚类构造的样本图结构过于复杂,计算成本... 聚类是根据样本之间的相似性将数据集划分为多个类簇。现有的大多数聚类方法都存在两个挑战:一方面,在定义样本间相似性时往往没有考虑样本的空间分布结构,无法构建稳定的相似度矩阵;另一方面,图聚类构造的样本图结构过于复杂,计算成本较高。为解决这两个问题,提出融合转移概率矩阵的多阶最近邻图聚类算法(MNNGC)。首先,综合样本的近邻关系和空间分布结构,将共享近邻定义的相似度进行趋密性加权,得到节点间的趋密性亲和矩阵;其次,利用节点间多阶概率转移预测非邻接点的关联程度,并通过融合多阶转移概率矩阵得到稳定的节点间亲和矩阵;再次,为进一步增强图局部结构,重新构建节点的多阶最近邻图,并对多阶最近邻图的局部结构分层聚类;最后,优化了边缘点分配策略。定位实验结果表明,MNNGC在合成数据集上的准确率(Acc)均优于对比算法,且在8个UCI数据集上的Acc为最大值。其中在Compound数据集上,MNNGC的Acc、调整互信息(AMI)、调整兰德指数(ARI)和FM指数(FMI)相较于基于局部密度峰值的谱聚类(LDP-SC)算法分别提高38.6、27.2、45.4、35.1个百分点。 展开更多
关键词 共享近邻 趋密性 转移概率 多阶最近邻 分层聚类
下载PDF
基于改进局部密度的可扩展层次聚类算法
7
作者 陈斌 谢文波 +2 位作者 付勋 张恒基 王欣 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期370-382,共13页
层次聚类是无监督学习的重点研究方向,由于其结果易于分析,因此被广泛应用于数据挖掘领域.目前大多数层次聚类算法都需要根据数据的成对距离进行簇合并操作,因此具有较高的复杂度(不论是时间或空间),无法用于大规模数据的处理.针对以上... 层次聚类是无监督学习的重点研究方向,由于其结果易于分析,因此被广泛应用于数据挖掘领域.目前大多数层次聚类算法都需要根据数据的成对距离进行簇合并操作,因此具有较高的复杂度(不论是时间或空间),无法用于大规模数据的处理.针对以上问题,提出了一种基于改进局部密度的可扩展层次聚类算法(Density-based Scalable Hierarchical Clustering,DBSC).该算法根据数据间的最近邻关系构造最近邻图,并在每个最近邻分量上根据互惠最近邻结点的局部密度选择代表点.为了降低孤立最近邻分量对计算局部密度的干扰,算法利用二阶最近邻将孤立最近邻分量重连至最近邻分量.通过以上步骤算法选择代表点,以迭代的方式自下而上地构建聚类树.大量真实数据集的实验结果表明,该算法可以在保证较高的聚类精度和较快的响应速度的前提下将处理数据的规模提升至数十万项. 展开更多
关键词 层次聚类 局部密度 最近邻图 互惠最近邻
下载PDF
基于动态集成加权概率RF的门诊量预测
8
作者 樊冲 《智能计算机与应用》 2024年第5期209-214,共6页
医院门诊量本质上是一种具有潜在规律的时间序列,通过对门诊量进行有效分析和预测,可以更加科学、合理地配置医疗资源。针对门诊量波动幅度较大的时间序列预测问题,提出一种基于动态集成加权概率RF的门诊量预测方法。首先选择具有强泛... 医院门诊量本质上是一种具有潜在规律的时间序列,通过对门诊量进行有效分析和预测,可以更加科学、合理地配置医疗资源。针对门诊量波动幅度较大的时间序列预测问题,提出一种基于动态集成加权概率RF的门诊量预测方法。首先选择具有强泛化性的随机森林(Random Forest,RF)作为预测模型;并且采用k近邻-层次聚类算法对RF模型中树的强度进行评估,从中动态选择性能最佳的决策树,提高回归模型的性能;为了提升预测模型的准确率,采用加权概率融合规则代替原始RF模型的求平均数的规则。经过与BP神经网络和RF对比实验结果表明,提出方法可以更加精准地对门诊量进行预测和分析,为医院更好的运营管理提供了重要依据和决策支持。 展开更多
关键词 门诊量 随机森林 k近邻-层次聚类 加权概率融合
下载PDF
基于改进的凝聚性和分离性的层次聚类算法 被引量:15
9
作者 郭景峰 赵玉艳 +1 位作者 边伟峰 李晶 《计算机研究与发展》 EI CSCD 北大核心 2008年第z1期202-206,共5页
由于传统的数据聚类算法都是在单一表上进行,因此如何在多表中进行聚类是现在聚类分析的一个新方向.提出了一种基于改进的凝聚性和分离性的层次聚类算法——ICCSH(a hierarchical clustering algorithmbased oni mproved cluster cohesi... 由于传统的数据聚类算法都是在单一表上进行,因此如何在多表中进行聚类是现在聚类分析的一个新方向.提出了一种基于改进的凝聚性和分离性的层次聚类算法——ICCSH(a hierarchical clustering algorithmbased oni mproved cluster cohesion and separation) ,该算法首先通过ID传播把关系数据库中的各个表联系起来,再通过计算共享最近邻的相似度和改进的凝聚性算法将数据对象聚类为大量相对较小的子聚类,然后通过计算改进的簇间分离性合并子类来找到真正的结果簇.实验表明,该算法不仅运行时间相对较短,具有较强的可伸缩性,还可以得到较高精确的聚类结果. 展开更多
关键词 共享最近邻 关系数据库 层次聚类 凝聚性 分离性
下载PDF
一种基于加权多代表点的层次聚类算法 被引量:5
10
作者 倪维健 黄亚楼 +1 位作者 李飞 刘赏 《计算机科学》 CSCD 北大核心 2005年第5期150-154,共5页
CURE算法是一种凝聚的层次聚类算法,它首先提出了使用多代表点描述簇的思想。本文通过对已有的基于多代表点的层次聚类算法特点的分析,提出了一种新的基于多代表点的层次聚类算法WRPC。它使用了基于影响因子的簇代表点选取机制和基于k-... CURE算法是一种凝聚的层次聚类算法,它首先提出了使用多代表点描述簇的思想。本文通过对已有的基于多代表点的层次聚类算法特点的分析,提出了一种新的基于多代表点的层次聚类算法WRPC。它使用了基于影响因子的簇代表点选取机制和基于k-近邻方法的小簇合并机制,可以发现形状、尺寸更为复杂的簇。实验结果表明,该算法在保证执行效率的情况下取得了更好的聚类效果。 展开更多
关键词 聚类算法 代表点 加权 K-近邻 影响因子 聚类效果 执行效率 机制
下载PDF
建筑物层次空间聚类方法研究 被引量:4
11
作者 邓敏 孙前虎 +1 位作者 文小岳 徐枫 《计算机工程与应用》 CSCD 北大核心 2011年第28期120-123,208,共5页
建筑物空间聚类是实现居民地地图自动综合的有效方法。基于图论和Gestalt原理,发展了一种层次的建筑物聚类方法。该方法可以深层次地挖掘建筑物图形的视觉特性,将面状地物信息充分合理地表达在聚类结果中。依据视觉感知原理,借助Dealau... 建筑物空间聚类是实现居民地地图自动综合的有效方法。基于图论和Gestalt原理,发展了一种层次的建筑物聚类方法。该方法可以深层次地挖掘建筑物图形的视觉特性,将面状地物信息充分合理地表达在聚类结果中。依据视觉感知原理,借助Dealaunay三角网构建方法,分析了地图上建筑物的自身形状特性和相互间的邻接关系,并依据建筑物间的可视区域均值距离建立了加权邻近结构图,确定了建筑物的邻近关系(定性约束)。根据Gestalt准则将邻近性、方向性和几何特征等量化为旋转卡壳距离约束和几何相似度约束。通过实例验证了层次聚类方法得到更加符合人类认知的建筑物聚类结果。 展开更多
关键词 空间聚类 地图自动综合 Gestalt准则 层次约束 邻近结构图
下载PDF
基于超图聚类的故事单元的抽取与分析 被引量:4
12
作者 樊昀 王润生 《软件学报》 EI CSCD 北大核心 2003年第4期857-863,共7页
合理而有效地结构化组织视频数据是浏览、检索和管理视频的重要前提.提出了一种新的层次化的结构化组织视频数据的提取故事单元的方法.它采用k-近邻超图描述镜头间的内容相似关系,利用超图模型对镜头聚类,并通过分析镜头类别间的时间投... 合理而有效地结构化组织视频数据是浏览、检索和管理视频的重要前提.提出了一种新的层次化的结构化组织视频数据的提取故事单元的方法.它采用k-近邻超图描述镜头间的内容相似关系,利用超图模型对镜头聚类,并通过分析镜头类别间的时间投影关系提取故事单元,并采用一维字符串描述故事单元.此外,还提出了结合领域知识确定故事单元的类型的算法框架,并将其用于对话场景的检测.将算法用于测试多段视频,实验结果令人满意. 展开更多
关键词 超图 聚类 故事单元 因特网 多媒体信息 视频检索 K-近邻超图 层次聚类 信息检索
下载PDF
粗略不相似度量及其在层次聚类中的应用 被引量:1
13
作者 李春忠 郑玉棒 汪婷 《工程数学学报》 CSCD 北大核心 2017年第4期354-366,共13页
局部结构特征在数据分析过程中具有重要的作用.为获得简单有效的数据集局部结构化特征检测方法,本文结合重采样误差分析和传统的近邻选择方法提出了一种检测局部结构特征的方向一致性度量—粗略不相似性度量.该度量是一种优化的近邻选... 局部结构特征在数据分析过程中具有重要的作用.为获得简单有效的数据集局部结构化特征检测方法,本文结合重采样误差分析和传统的近邻选择方法提出了一种检测局部结构特征的方向一致性度量—粗略不相似性度量.该度量是一种优化的近邻选择方法,不仅考虑了传统的欧氏距离排序,而且考虑了局部方向结构特征.因其计算和存储复杂度小以及具有优越的结构检测性能,可应用于无监督学习形成一种层次化的子图聚类算法—RDClust,与经典聚类算法相比,其优势在于:一是计算复杂度较小,是近似线性算法;二是无需对类的形状和分布形式做任何的假设,可自动体现数据集的局部结构;三是有一个近邻参数,且该参数对结果较鲁棒.在人工和真实数据集上的实验显示了新的度量方式应用于新算法的优越性能. 展开更多
关键词 聚类 近邻域 第k个近邻点连接 层次连接图
下载PDF
最近最远得分的聚类性能评价指标 被引量:8
14
作者 冯柳伟 常冬霞 +1 位作者 邓勇 赵耀 《智能系统学报》 CSCD 北大核心 2017年第1期67-74,共8页
聚类算法是数据分析中广泛使用的方法之一,而类别数往往是决定聚类算法性能的关键。目前,大部分聚类算法需要预先给定类别数,在很多情况下,很难根据数据集的先验知识获得有效的类别数。因此,为了获得数据集的类别数,本文基于最近邻一致... 聚类算法是数据分析中广泛使用的方法之一,而类别数往往是决定聚类算法性能的关键。目前,大部分聚类算法需要预先给定类别数,在很多情况下,很难根据数据集的先验知识获得有效的类别数。因此,为了获得数据集的类别数,本文基于最近邻一致性和最远邻相异性的准则,提出了一种最近最远得分评价指标,并在此基础上提出了一种自动确定类别数的聚类算法。实验结果证明了所提评价指标在确定类别数时的有效性和可行性。 展开更多
关键词 最近邻一致性 最远邻相异性 K-MEANS聚类算法 评分机制 评价指标 层次聚类
下载PDF
基于用户紧密度的在线社会网络社区发现算法 被引量:9
15
作者 熊正理 姜文君 王国军 《计算机工程》 CAS CSCD 2013年第8期50-54,共5页
针对在线社会网络潜在社区难以检测的问题,根据在线社会网络的独有特性,提出一种基于用户紧密度的在线社会网络社区发现算法。创建初步用户图,依据节点属性相似性算法计算用户个体紧密度,基于共有邻居相似性算法计算用户社区紧密度,从... 针对在线社会网络潜在社区难以检测的问题,根据在线社会网络的独有特性,提出一种基于用户紧密度的在线社会网络社区发现算法。创建初步用户图,依据节点属性相似性算法计算用户个体紧密度,基于共有邻居相似性算法计算用户社区紧密度,从而构造出完整用户图,利用层次聚类算法对完整用户图进行处理,发现潜在社区。实验结果表明,与NAS、CNS算法相比,该算法的社区凝聚度与正确率更高,分别达到0.67和97.1%。 展开更多
关键词 在线社会网络 用户紧密度 节点属性相似性 共有邻居相似性 社区发现 层次聚类
下载PDF
面向校园网的IP地址逐步优化层次聚类算法 被引量:3
16
作者 楼若岩 许晓东 朱士瑞 《计算机应用》 CSCD 北大核心 2007年第8期1862-1864,1867,共4页
对校园网主干数据流中IP地址进行聚类,可以得到网络用户访问地址的分布概况从而了解用户行为特征。已有聚类算法大都将IP地址作为普通数字考虑,忽略了其特征属性以致聚类结果不合理。为此提出一种改进算法:首先基于最长前缀匹配和改进... 对校园网主干数据流中IP地址进行聚类,可以得到网络用户访问地址的分布概况从而了解用户行为特征。已有聚类算法大都将IP地址作为普通数字考虑,忽略了其特征属性以致聚类结果不合理。为此提出一种改进算法:首先基于最长前缀匹配和改进的最近邻规则算法得到初始聚类,然后运用逐步优化层次聚类的思想进一步聚合最靠近子类,最终得到基于IP地址特征属性的聚类。实验结果表明该算法与以往算法相比,提高了聚类效果,具有较好的准确性和可行性。 展开更多
关键词 IP地址聚类 最近邻规则 最长前缀匹配 逐步优化的层次聚类
下载PDF
基于区域最近邻生长的层次聚类算法 被引量:2
17
作者 杨栋 詹海亮 苏锦旗 《化工自动化及仪表》 CAS 北大核心 2010年第5期9-12,共4页
对于非球形和其它特殊形状的非凸数据集的聚类,基于划分的聚类算法很难取得理想的聚类结果。层次聚类算法根据数据的特征将距离近的数据进行合并,对于球形数据集和其它具有特殊形状的数据集有很好的聚类效果。在分析现有层次聚类算法的... 对于非球形和其它特殊形状的非凸数据集的聚类,基于划分的聚类算法很难取得理想的聚类结果。层次聚类算法根据数据的特征将距离近的数据进行合并,对于球形数据集和其它具有特殊形状的数据集有很好的聚类效果。在分析现有层次聚类算法的基础上,根据层次聚类的合并思想和最近邻距离的计算提出了基于区域最近邻生长的层次聚类算法。 展开更多
关键词 聚类算法 层次聚类算法 区域最近邻生长
下载PDF
基于相似性混合模型的蛋白质交互识别 被引量:2
18
作者 王宇伟 牛耘 魏欧 《计算机工程》 CAS CSCD 北大核心 2015年第7期25-30,35,共7页
现有采用机器学习方法的蛋白质交互关系识别系统仅以单句为依据,并且存在标注数据缺乏导致训练集规模小的问题。为此,基于相似性混合模型提出一种新的蛋白质交互识别方法。采用基本的关系相似性(RS)模型做初始判断,利用大规模文本计算... 现有采用机器学习方法的蛋白质交互关系识别系统仅以单句为依据,并且存在标注数据缺乏导致训练集规模小的问题。为此,基于相似性混合模型提出一种新的蛋白质交互识别方法。采用基本的关系相似性(RS)模型做初始判断,利用大规模文本计算单词特征间的相似性,在基本RS模型的基础上通过特征聚类方式引入单词相似性模型,从而建立一个混合模型。实验结果表明,该方法能够取得较高且较均衡的精确度和召回率,而单词相似性的引入又进一步提高了F值,并且其直接利用已有的交互信息,可避免额外的人工标注。 展开更多
关键词 蛋白质交互 关系相似性 单词相似性 K近邻分类 层次聚类
下载PDF
一种层次聚类和自适应加权K近邻组合的室内定位算法 被引量:7
19
作者 翟俊杰 李廷会 +3 位作者 黄飞江 袁海波 张虹 胡传君 《时间频率学报》 CSCD 2020年第4期300-309,共10页
针对基于接收信号强度的位置指纹室内定位算法定位精度不高的问题,提出了一种均值层次聚类和自适应加权K近邻(weighted K nearest neighbor,WKNN)的室内定位算法。算法首先在设置的参考点上采集蓝牙信号强度构建离线指纹数据库,然后采... 针对基于接收信号强度的位置指纹室内定位算法定位精度不高的问题,提出了一种均值层次聚类和自适应加权K近邻(weighted K nearest neighbor,WKNN)的室内定位算法。算法首先在设置的参考点上采集蓝牙信号强度构建离线指纹数据库,然后采用均值层次聚类方法将所有参考点根据各自之间的相似度分为n个类,滤除掉相似度较小的参考点,最后根据待定位点和参考点间的信号距离的相似度,计算出距离差的标准差来自适应确定K值,并进行位置估算。实验结果表明,本文提出的算法在定位精度上比WKNN、动态加权K近邻(enhanced weighted K nearest neighbor,EWKNN)方法分别提升了30.0%和18.0%,在定位实时性上比WKNN和EWKNN方法分别提高了19.2%和28.4%。将该算法用于室内物体定位,可以同时提高定位精度和定位实时性。 展开更多
关键词 室内定位 接收信号强度 指纹数据库 均值层次聚类 自适应加权K近邻
下载PDF
一种基于局部特征的层次聚类算法 被引量:6
20
作者 王鹏宇 王国宇 +3 位作者 贾贞 曹晓晓 王泉斌 苏天赟 《中国海洋大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第S02期176-184,共9页
聚类算法在数据挖掘中起到十分重要的作用,其中CHAMELEON算法因具有发现任意形状簇类的能力,成为一种常用算法。本文针对CHAMELEON算法在簇类内部密度存在变化时聚类效果不佳等问题,采用自适应生成近邻图、基于局部特征分割近邻图、聚... 聚类算法在数据挖掘中起到十分重要的作用,其中CHAMELEON算法因具有发现任意形状簇类的能力,成为一种常用算法。本文针对CHAMELEON算法在簇类内部密度存在变化时聚类效果不佳等问题,采用自适应生成近邻图、基于局部特征分割近邻图、聚合子簇等方法,提出了一种基于局部特征与网格结构的层次聚类算法,并使用二维数据集,与不同的聚类算法进行了测试和对比分析。实验结果表明,本文算法在数据分布复杂的情况下,能够得到较理想的聚类效果。 展开更多
关键词 层次聚类 CHAMELEON算法 局部特征 网格结构 自适应近邻图
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部