期刊文献+
共找到80篇文章
< 1 2 4 >
每页显示 20 50 100
基于加权密度Canopy的K-means文本聚类 被引量:1
1
作者 宋健 李岩芳 陈占芳 《中南民族大学学报(自然科学版)》 CAS 北大核心 2023年第5期636-642,共7页
针对现有文本聚类性能不高的问题,提出了一种改进质心初始化的K-means文本聚类算法.该算法首先利用Canopy算法进行文本预聚类,并且对Canopy算法的阈值选取策略进行改进,定义加权密度进行Canopy中心的选取,得到更准确的聚类数以及初始聚... 针对现有文本聚类性能不高的问题,提出了一种改进质心初始化的K-means文本聚类算法.该算法首先利用Canopy算法进行文本预聚类,并且对Canopy算法的阈值选取策略进行改进,定义加权密度进行Canopy中心的选取,得到更准确的聚类数以及初始聚类中心;然后将所得结果作为K-means算法的初始化参数进行后续迭代聚类,有效解决了传统算法因随机选取初始聚类中心而陷入局部最优解的问题,减少了算法的迭代次数,提高了聚类准确性.实验结果表明:与其他同类型算法相比,该算法在文本聚类分析中更具优势. 展开更多
关键词 文本聚类 k-means算法 加权密度 Canopy算法
下载PDF
自适应样本和特征加权的k-means算法
2
作者 郑佳炜 唐厂 《计算机应用》 CSCD 北大核心 2023年第S02期99-104,共6页
针对k-means算法在处理一些同时具备样本噪声与特征噪声的数据集时表现不佳的问题,提出一种自适应样本和特征加权的k-means聚类算法(ASFW)。所提算法引入负熵和一种正则化项,在每次迭代中自适应地调整样本和特征权重,并通过一种新的距... 针对k-means算法在处理一些同时具备样本噪声与特征噪声的数据集时表现不佳的问题,提出一种自适应样本和特征加权的k-means聚类算法(ASFW)。所提算法引入负熵和一种正则化项,在每次迭代中自适应地调整样本和特征权重,并通过一种新的距离度量函数向最优解进行退火,可以有效避免得到较差的局部最小值,同时保持经典k-means算法的简单性。在人工合成数据集的聚类结果表明,相较于同类算法,ASFW的聚类效果更好,且对噪声样本和特征赋予的权值更正确合理,说明所提算法能够有效识别噪声,降低噪声对聚类结果的影响;在6个真实数据集下的聚类结果显示,ASFW在各个数据集的聚类性能均优于对比算法,且在大多数数据集上取得了最佳的标准互信息(NMI)和调整兰德系数(ARI),充分验证了ASFW具有良好的聚类性能。 展开更多
关键词 聚类 k-means算法 自适应学习 样本加权 特征加权 无监督学习
下载PDF
基于初始聚类中心优化和维间加权的改进K-means算法 被引量:7
3
作者 王越 王泉 +1 位作者 吕奇峰 曾晶 《重庆理工大学学报(自然科学)》 CAS 2013年第4期77-80,共4页
针对K-means算法易受随机选择的初始聚类中心的影响和划分准确率不高的缺点,给出了一种改进的K-means算法。首先对初始聚类中心的选择过程进行了改进,然后对各样本点间差异最大的维进行加权处理。在Iris数据集上对原始算法和改进后的K-m... 针对K-means算法易受随机选择的初始聚类中心的影响和划分准确率不高的缺点,给出了一种改进的K-means算法。首先对初始聚类中心的选择过程进行了改进,然后对各样本点间差异最大的维进行加权处理。在Iris数据集上对原始算法和改进后的K-means算法的聚类结果进行对比分析。实验证明:改进后的算法稳定,且聚类的准确率达到了92%。 展开更多
关键词 聚类 k—means算法 初始聚类中心 维间加权 Iris数据集
下载PDF
一种改进的特征加权K-means聚类算法 被引量:12
4
作者 王慧 申石磊 《微电子学与计算机》 CSCD 北大核心 2010年第7期161-163,167,共4页
提出了一种改进的特征加权K-means聚类算法.该算法首先基于数据样本分布选取初始聚类中心,然后设计特征加权的K-means聚类算法.实验结果证明,该算法能产生质量较高的聚类结果,并且能处理数值、符号两类数据.
关键词 聚类 k-means算法 聚类中心 特征加权
下载PDF
基于逻辑回归函数的加权K-means聚类算法 被引量:7
5
作者 林丽 薛芳 《集美大学学报(自然科学版)》 CAS 2021年第2期139-145,共7页
传统K-means聚类算法通过欧式距离计算样本的相似度,将数据所有的属性特征均平等对待,忽略每个属性特征的不同贡献,导致样本相似度计算的准确率不高。针对这个不足,提出一种特征加权的K-means算法进行优化。首先,运用Softmax和Sigmoid... 传统K-means聚类算法通过欧式距离计算样本的相似度,将数据所有的属性特征均平等对待,忽略每个属性特征的不同贡献,导致样本相似度计算的准确率不高。针对这个不足,提出一种特征加权的K-means算法进行优化。首先,运用Softmax和Sigmoid逻辑回归函数计算特征权重,使得加权的欧式距离更能准确地表示样本相似度;其次,优化初始聚类中心选择策略,选择距离较大的K个样本作为初始聚类中心,可有效避免样本的错误聚类及空簇问题。实验结果表明,在UCI标准数据集中采用加权K-means聚类算法可以有效减少迭代次数,提高聚类的准确率、精确率和召回率。 展开更多
关键词 欧式距离 特征加权的k-means算法 逻辑回归函数 初始聚类中心
下载PDF
K-means聚类中心的鲁棒优化算法 被引量:7
6
作者 罗倩 《计算机工程与设计》 北大核心 2015年第9期2395-2400,共6页
针对K-means算法对随机选择的初始聚类中心敏感且聚类结果不稳定、准确率不高的问题,提出一种基于邻域数据距离加权的聚类中心鲁棒优化算法。通过建立数据密度约束将聚类中心优化在数据密集区域,有效克服K-means算法聚类结果稳定性差等... 针对K-means算法对随机选择的初始聚类中心敏感且聚类结果不稳定、准确率不高的问题,提出一种基于邻域数据距离加权的聚类中心鲁棒优化算法。通过建立数据密度约束将聚类中心优化在数据密集区域,有效克服K-means算法聚类结果稳定性差等问题。通过对仿真数据和标准数据集的实验,验证了采用该算法收敛的聚类中心非常接近标准数据集的实际中心,具有较优的聚类准确性、鲁棒性和收敛速度。 展开更多
关键词 k-means聚类算法 初始聚类中心 邻域距离加权 聚类优化 鲁棒算法
下载PDF
基于改进粒子群和K-Means的文本聚类算法研究 被引量:8
7
作者 钮永莉 武斌 《兰州文理学院学报(自然科学版)》 2019年第4期44-47,共4页
在进行文本聚类时,对于大容量、高维、非结构化的文本数据,单纯的K-Means聚类效果不佳,容易陷入局部最优解.本文改进了粒子群优化算法,提出了非线性动态调整惯性权重机制,并将改进后的粒子群算法与局部搜索能力较强的K-Means算法相结合... 在进行文本聚类时,对于大容量、高维、非结构化的文本数据,单纯的K-Means聚类效果不佳,容易陷入局部最优解.本文改进了粒子群优化算法,提出了非线性动态调整惯性权重机制,并将改进后的粒子群算法与局部搜索能力较强的K-Means算法相结合,形成基于改进粒子群和K-Means的文本聚类算法(MPK-Clusters).3种算法的实验对比结果表明,新算法在准确率、召回率和F值方面都优于其他两种算法,取得了更好的文本聚类效果. 展开更多
关键词 k-means算法 MPk-clusters算法 PSO-kMeans算法 惯性权重
下载PDF
基于权重的改进K-means算法应用研究 被引量:1
8
作者 宗春梅 郝耀军 焦莉娟 《高师理科学刊》 2017年第11期24-29,共6页
数据聚类是将数据对象划分到不同的类或簇中,是数据挖掘中的一项重要技术.教育领域拥有海量的学生信息数据,把数据挖掘中的聚类技术引入其中,具有很强的实际价值.阐述了运用数据挖掘中改进的引入权重的聚类技术对成绩数据进行选择、预... 数据聚类是将数据对象划分到不同的类或簇中,是数据挖掘中的一项重要技术.教育领域拥有海量的学生信息数据,把数据挖掘中的聚类技术引入其中,具有很强的实际价值.阐述了运用数据挖掘中改进的引入权重的聚类技术对成绩数据进行选择、预处理和挖掘分析等,展示了3个Matlab实验使成绩数据如何通过K-means算法进行聚类分析,并对3种运行结果的意义各自进行了显示与分析,同时指出了运行结果的不足及意义.针对学生实验中的分类原因进行了研究并在学生成绩分析中发现很多隐含着的不易发现的有价值信息,利用这些聚类结果提出了相应的教学措施及建议,从而有针对性地提高教学质量. 展开更多
关键词 k-means算法 聚类分析 权重
下载PDF
一种基于粗糙熵的改进K-modes聚类算法
9
作者 刘财辉 曾雄 谢德华 《南京理工大学学报》 CAS CSCD 北大核心 2024年第3期335-341,共7页
K-modes聚类算法被广泛应用于人工智能、数据挖掘等领域。传统的K-modes聚类算法有不错的聚类效果,但是存在迭代次数多、计算量大、容易受到冗余属性的干扰等问题,且仅采用简单的0-1匹配的方法来定义2个样本属性值之间的距离,没有充分... K-modes聚类算法被广泛应用于人工智能、数据挖掘等领域。传统的K-modes聚类算法有不错的聚类效果,但是存在迭代次数多、计算量大、容易受到冗余属性的干扰等问题,且仅采用简单的0-1匹配的方法来定义2个样本属性值之间的距离,没有充分考虑每个属性对聚类结果的影响。针对上述问题,该文将粗糙熵引入K-modes算法。首先利用粗糙集属性约简算法消除冗余属性,确定各属性的重要程度;然后利用粗糙熵确定每个属性的权重,从而定义新的类内距离。将该文所提算法与传统的K-modes聚类算法分别在4组公开数据集上进行对比试验。试验结果表明,该文所提算法聚类准确率比传统的K-modes聚类算法更高。 展开更多
关键词 聚类 k-modes算法 粗糙集 粗糙熵 属性约简 权重
下载PDF
基于萤火虫优化的加权K-means算法 被引量:41
10
作者 陈小雪 尉永清 +1 位作者 任敏 孟媛媛 《计算机应用研究》 CSCD 北大核心 2018年第2期466-470,共5页
针对传统K-means算法易受初始聚类中心和异常数据的影响等缺陷,利用萤火虫优化算法全局搜索能力强、收敛速度快的优势,对K-means算法的初始聚类中心进行优化,并通过引用一种加权的欧氏距离,减少异常数据等不确定因素带来的不良影响,提... 针对传统K-means算法易受初始聚类中心和异常数据的影响等缺陷,利用萤火虫优化算法全局搜索能力强、收敛速度快的优势,对K-means算法的初始聚类中心进行优化,并通过引用一种加权的欧氏距离,减少异常数据等不确定因素带来的不良影响,提出了一种基于萤火虫优化的加权K-means算法。该算法在提升聚类性能的同时,有效增强了算法的收敛速度。在实验阶段,通过UCI数据集中的几组数据对该算法进行了聚类实验及有效性测试,实验结果充分表明了该算法的有效性及优越性。 展开更多
关键词 加权k-means 聚类 萤火虫算法
下载PDF
加权局部方差优化初始簇中心的K-means算法 被引量:11
11
作者 蔡宇浩 梁永全 +2 位作者 樊建聪 李璇 刘文华 《计算机科学与探索》 CSCD 北大核心 2016年第5期732-741,共10页
在传统K-means算法中,初始簇中心选择的随机性,导致聚类结果随不同的聚类中心而不同。因此出现了很多簇中心的选择方法,但是很多已有的簇中心选择算法,其聚类结果受参数调节的影响较大。针对这一问题,提出了一种新的初始簇中心选择算法... 在传统K-means算法中,初始簇中心选择的随机性,导致聚类结果随不同的聚类中心而不同。因此出现了很多簇中心的选择方法,但是很多已有的簇中心选择算法,其聚类结果受参数调节的影响较大。针对这一问题,提出了一种新的初始簇中心选择算法,称为WLV-K-means(weighted local variance K-means)。该算法采用加权局部方差度量样本的密度,以更好地发现密度高的样本,并利用改进的最大最小法,启发式地选择簇初始中心点。在UCI数据集上的实验结果表明,WLV-K-means算法不仅能够取得较好的聚类结果,而且受参数变化的影响较小,有更加稳定的表现。 展开更多
关键词 k-means算法 方差 加权 最大最小法 簇初始中心点
下载PDF
基于距离和权重改进的K-means算法 被引量:34
12
作者 王子龙 李进 宋亚飞 《计算机工程与应用》 CSCD 北大核心 2020年第23期87-94,共8页
K-means聚类算法简单高效,应用广泛。针对传统K-means算法初始聚类中心点的选择随机性导致算法易陷入局部最优以及K值需要人工确定的问题,为了得到最合适的初始聚类中心,提出一种基于距离和样本权重改进的K-means算法。该聚类算法采用... K-means聚类算法简单高效,应用广泛。针对传统K-means算法初始聚类中心点的选择随机性导致算法易陷入局部最优以及K值需要人工确定的问题,为了得到最合适的初始聚类中心,提出一种基于距离和样本权重改进的K-means算法。该聚类算法采用维度加权的欧氏距离来度量样本点之间的远近,计算出所有样本的密度和权重后,令密度最大的点作为第一个初始聚类中心,并剔除该簇内所有样本,然后依次根据上一个聚类中心和数据集中剩下样本点的权重并通过引入的参数τi找出下一个初始聚类中心,不断重复此过程直至数据集为空,最后自动得到k个初始聚类中心。在UCI数据集上进行测试,对比经典K-means算法、WK-means算法、ZK-means算法和DCKmeans算法,基于距离和权重改进的K-means算法的聚类效果更好。 展开更多
关键词 数据挖掘 k-means算法 初始聚类中心 加权欧式距离 权重
下载PDF
基于最小方差的K-means用户聚类推荐算法 被引量:10
13
作者 杨大鑫 王荣波 +1 位作者 黄孝喜 谌志群 《计算机技术与发展》 2018年第1期104-107,共4页
协同过滤推荐算法是一种传统的推荐技术,具有简单高效的特点,在实际中有广泛的应用,获得了大量研究者的青睐。虽然传统的协同过滤推荐算法在一定程度上缓解了用户当前所面临的信息超载问题,但其在处理大数据时存在的数据稀疏性和扩展性... 协同过滤推荐算法是一种传统的推荐技术,具有简单高效的特点,在实际中有广泛的应用,获得了大量研究者的青睐。虽然传统的协同过滤推荐算法在一定程度上缓解了用户当前所面临的信息超载问题,但其在处理大数据时存在的数据稀疏性和扩展性等问题却日益突出。于是,提出了一种基于最小方差的K-means用户聚类推荐算法。在缓解数据稀疏性方面,利用Weighted Slope One算法对初始用户—项目评分矩阵进行有效填充,降低了数据稀疏性;在提高算法扩展性方面,采用基于最小方差的K-means算法对用户评分数据进行聚类,将相似的用户聚到一起,减小目标用户的最近邻搜索空间,提高了算法扩展性。通过在Movie Lens数据集上的对比实验,结果表明,相比于传统的协同过滤推荐算法,改进算法具有更高的推荐准确度。 展开更多
关键词 信息过载 协同过滤算法 weighted SLOPE One 最小方差 k—means聚类
下载PDF
基于空间距离自适应权重度量的粗糙K-means算法 被引量:7
14
作者 王慧研 张腾飞 马福民 《计算机科学》 CSCD 北大核心 2018年第7期190-196,共7页
粗糙K-means算法中下近似和边界区域权重系数的设置对算法的聚类效果有着重要的影响。传统的粗糙K-means算法及很多改进的粗糙K-means算法对所有类簇的下近似和边界区域设置固定的权重,忽视了簇内数据对象分布差异性的影响。针对这个问... 粗糙K-means算法中下近似和边界区域权重系数的设置对算法的聚类效果有着重要的影响。传统的粗糙K-means算法及很多改进的粗糙K-means算法对所有类簇的下近似和边界区域设置固定的权重,忽视了簇内数据对象分布差异性的影响。针对这个问题,根据下近似和边界区域的数据对象相对于类簇中心的空间分布情况,提出一种新的基于空间距离自适应权重度量的粗糙K-means算法。该算法在每次迭代过程中,根据每个类簇的下近似和边界区域的数据对象相对于类簇中心的平均距离,综合度量下近似和边界区域对于类簇中心迭代计算的不同重要程度,动态地计算下近似和边界区域的相对权重系数。通过实例验证及实验仿真证明了所提算法的有效性。 展开更多
关键词 粗糙k-means 粗糙集 聚类算法 自适应权重
下载PDF
一种高效的阴阳k-Means聚类算法 被引量:4
15
作者 李长明 张红臣 +3 位作者 王超 李晓光 陆洋 钱超越 《吉林大学学报(理学版)》 CAS 北大核心 2021年第6期1455-1460,共6页
针对传统阴阳k-means算法未利用数据结构导致计算效率较低的问题,提出一种高效阴阳k-means聚类算法.该算法根据数据相似性将原始数据进行逐层分解,并建立满m叉树结构存储各层数据,以树结构各叶子节点中存储的数据信息建立加权数据,运行... 针对传统阴阳k-means算法未利用数据结构导致计算效率较低的问题,提出一种高效阴阳k-means聚类算法.该算法根据数据相似性将原始数据进行逐层分解,并建立满m叉树结构存储各层数据,以树结构各叶子节点中存储的数据信息建立加权数据,运行加权阴阳k-means算法得到收敛中心.在原始数据中以加权数据收敛中心为初始化条件运行传统阴阳k-means算法进一步优化目标函数值.在5组UCI数据集上与k-means、传统阴阳k-means及另外两种加速算法进行对比实验,实验结果表明,该算法具有较高的加速比,且求解精度与传统阴阳k-means聚类基本相同. 展开更多
关键词 聚类分析 阴阳k-means算法 k-means算法 数据加权
下载PDF
基于K-means聚类点密度的WSNs加权质心定位算法 被引量:7
16
作者 张乙竹 周礼争 +1 位作者 唐瑞 余敏 《传感器与微系统》 CSCD 2015年第7期125-127,131,共4页
为降低无线传感器网络(WSNs)在节点众多时算法复杂度,提高定位精度,提出一种基于K—means聚类点密度的WSNs加权质心定位算法(KCPD—WCLA)。首先,对空间中随机大量布设的锚节点进行分组,利用三边测量定位法在二维平面上得到许多接近真实... 为降低无线传感器网络(WSNs)在节点众多时算法复杂度,提高定位精度,提出一种基于K—means聚类点密度的WSNs加权质心定位算法(KCPD—WCLA)。首先,对空间中随机大量布设的锚节点进行分组,利用三边测量定位法在二维平面上得到许多接近真实值的结果;然后将K—means聚类算法引入到WSNs的定位问题中,对K个聚类点密度加以考虑,利用加权质心定位算法(WCLA)得到定位结果。理论分析与仿真结果表明:计算复杂度明显降低,定位精度比多边定位算法(MLA)和WCLA有显著提高。 展开更多
关键词 无线传感器网络 k—means聚类 加权质心定位算法
下载PDF
基于K-means聚类的室内三维定位算法 被引量:5
17
作者 周满满 袁凌云 《计算机工程与设计》 北大核心 2019年第9期2530-2536,共7页
为解决室内定位误差大、难实现三维定位的难题,提出一种基于K-means聚类的三维定位算法,对指纹数据库处理并同时实现三维定位,将RSSI相关系数与传统算法融合加权,使每个位置上的RSSI值直接映射出该位置的位置信息。实验结果表明,该算法... 为解决室内定位误差大、难实现三维定位的难题,提出一种基于K-means聚类的三维定位算法,对指纹数据库处理并同时实现三维定位,将RSSI相关系数与传统算法融合加权,使每个位置上的RSSI值直接映射出该位置的位置信息。实验结果表明,该算法能成功实现三维定位,提高平面定位精度,相对传统算法,将定位准确率提高了9.23个百分点,达到91.13%,将误差减少了95.81 cm,将定位误差控制在93.03 cm以内。 展开更多
关键词 三维定位 室内定位 k-means聚类算法 相似度权重量化 位置指纹 接收信号强度
下载PDF
基于加权K-means聚类和遗传算法的变电站规划 被引量:8
18
作者 成乐祥 季丽 《江苏电机工程》 2016年第6期9-12,共4页
针对变电站规划问题,提出了基于加权K-means聚类的变电站供电范围划分方法,并在此基础上提出了基于加权K-means聚类和遗传算法的变电站规划算法。该算法运用遗传算法的全局搜索能力确定变电站的座数、主变台数和容量的最优组合,解决了... 针对变电站规划问题,提出了基于加权K-means聚类的变电站供电范围划分方法,并在此基础上提出了基于加权K-means聚类和遗传算法的变电站规划算法。该算法运用遗传算法的全局搜索能力确定变电站的座数、主变台数和容量的最优组合,解决了应用加权K-means聚类算法划分变电站供电范围时初始聚类数确定的问题。加权K-means聚类算法能够综合考虑变电站的负载率和供电半径的约束,并在迭代过程中自适应调节。算例结果表明所提算法能够较好地求解变电站优化规划问题。 展开更多
关键词 变电站规划 加权k-means聚类算法 遗传算法 变电站站址 供区优化
全文增补中
基于距离和密度的PBK-means算法 被引量:2
19
作者 魏文浩 唐泽坤 刘刚 《计算机工程》 CAS CSCD 北大核心 2020年第9期68-75,共8页
K-means算法初始中心点选择的随机性以及对噪声点的敏感性,使得聚类结果易陷入局部最优解,为获得最佳初始聚类中心,提出一种基于距离和密度的并行二分K-means算法。计算数据集的平均样本距离,根据数据点之间的距离计算数据的权重,选择... K-means算法初始中心点选择的随机性以及对噪声点的敏感性,使得聚类结果易陷入局部最优解,为获得最佳初始聚类中心,提出一种基于距离和密度的并行二分K-means算法。计算数据集的平均样本距离,根据数据点之间的距离计算数据的权重,选择最大权重数据点作为第一个中心点,小于平均样本距离的数据点不参加下一次聚类,将剩余数据点的权重与中心点距离相乘,选择值最大的数据点作为下一个中心点,得到两个中心点后按照距离对数据进行分配,将每个中心点代表的类分为两类后在每类上继续重复上述步骤。通过模仿细胞分裂的方法对数据进行切分,构建一棵满二叉树,当叶子结点数超过类别数k时停止聚类,合并叶子结点得到k个初始聚类中心执行K-means算法。在UCI公开数据集上进行测试,结果表明,对比传统K-means算法、Canopy-Kmeans算法、二分K-means算法、WK-means算法、MWK-means算法和DCK-means算法,该算法效率更高,具有较好的聚类效果。 展开更多
关键词 二分k-means算法 聚类中心 初始中心点 权重 数据挖掘
下载PDF
基于自适应PSO的改进K-means算法及其在电子病历聚类分析应用 被引量:7
20
作者 沐燕舟 丁卫平 +2 位作者 高峰 余利国 张琼 《计算机与数字工程》 2019年第8期1861-1865,共5页
针对传统的K-means算法在过分依赖初始聚类中心选取方面的不足,论文提出了一种基于自适应PSO的K-means聚类算法。该算法设计了一种自适应惯性权重函数对PSO进行动态调整,然后与K-means算法融合,使K-means的各个初始聚类中心能自适应生成... 针对传统的K-means算法在过分依赖初始聚类中心选取方面的不足,论文提出了一种基于自适应PSO的K-means聚类算法。该算法设计了一种自适应惯性权重函数对PSO进行动态调整,然后与K-means算法融合,使K-means的各个初始聚类中心能自适应生成,达到全局最优,最后将上述改进的聚类算法应用于医学电子病历数据病症的聚类处理。实验结果表明该算法具有更高的电子病历病症聚类准确率和执行效率。 展开更多
关键词 自适应PSO 惯性权重 k-means算法 病症聚类
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部