期刊文献+
共找到942篇文章
< 1 2 48 >
每页显示 20 50 100
基于改进引力搜索的混合K-调和均值聚类算法研究 被引量:11
1
作者 王彩霞 《计算机应用研究》 CSCD 北大核心 2016年第1期118-121,共4页
为了解决聚类算法容易陷入局部最优的问题,以及增强聚类算法的全局搜索能力,基于KHM算法以及改进的引力搜索算法,提出一种混合K-调和均值聚类算法(G-KHM)。G-KHM算法具有KHM算法收敛速度快的优点,但同时针对KHM算法容易陷入局部最优解... 为了解决聚类算法容易陷入局部最优的问题,以及增强聚类算法的全局搜索能力,基于KHM算法以及改进的引力搜索算法,提出一种混合K-调和均值聚类算法(G-KHM)。G-KHM算法具有KHM算法收敛速度快的优点,但同时针对KHM算法容易陷入局部最优解的问题,在初始化后数据开始搜索聚类中心时采用了一种基于对象多样性及收敛性增强的引力搜索算法,该方法改进了引力搜索算法容易失去种群多样性的缺点,并同时具有引力搜索算法较强的全局搜索能力,可以使算法收敛到全局最优解。仿真结果表明,G-KHM算法能有效地避免陷入局部极值,具有较强的全局搜索能力以及稳定性,并且相比KHM算法、K-means聚类算法、C均值聚类算法以及粒子群算法,在分类精度和运行时间上表现出了更好的效果。 展开更多
关键词 混合k-调和均值聚类 KHM算法 改进引力搜索算法 全局搜索能力
下载PDF
基于k-均值聚类算法的高层建筑表面风压分区研究
2
作者 王健 陈统岳 朱杰 《建筑施工》 2024年第7期1001-1004,共4页
为分析高层建筑表面的风压特征和关键区域,以高宽比为4∶1的高层建筑风洞试验模型为对象,采用k-均值聚类算法,对0°风向角下模型各个面的风压测压管时程数据进行分析,研究结果表明:建筑左、右侧面以强烈的负压为主导,且角点附近存... 为分析高层建筑表面的风压特征和关键区域,以高宽比为4∶1的高层建筑风洞试验模型为对象,采用k-均值聚类算法,对0°风向角下模型各个面的风压测压管时程数据进行分析,研究结果表明:建筑左、右侧面以强烈的负压为主导,且角点附近存在负压极值;k-均值聚类算法可以有效地识别不同表面风压场的特征,风压的聚类结果与平均风压系数的分布较为吻合,且能得到代表性的风压测压管。 展开更多
关键词 高层建筑 k-均值 风压分布 风洞试验
下载PDF
基于K-均值聚类法和EOF分析的贵港市台风暴雨特征分析
3
作者 蒙金凤 龙俊宇 +1 位作者 梁虹 梁毅进 《气象研究与应用》 2024年第3期44-49,共6页
利用实况观测资料、中国气象局台风最佳路径数据集,采用K-均值聚类法,结合经验正交函数(EOF)分析方法,分析研究2010—2023年间影响贵港市的65个台风造成的暴雨特征。结果表明:(1)有39个台风造成暴雨,每年平均有2.8次台风暴雨,7、8月是... 利用实况观测资料、中国气象局台风最佳路径数据集,采用K-均值聚类法,结合经验正交函数(EOF)分析方法,分析研究2010—2023年间影响贵港市的65个台风造成的暴雨特征。结果表明:(1)有39个台风造成暴雨,每年平均有2.8次台风暴雨,7、8月是台风暴雨的集中期,港南区南部、覃塘区中西部及桂平北部山区台风暴雨多且高发。(2)根据K-均值聚类分析,将65个台风分为A、B、C类。A、B类台风源地为西北太平洋,C类台风多来自南海。A、B类台风以西北行为主,C类台风路径复杂且在北部湾活跃。B类台风强度最强,C类台风强度最弱。(3)根据贵港市三类台风暴雨第一特征向量空间分布情况分析,A、B类台风暴雨年降雨量表现为全市普遍偏多或者普遍偏少分布型式,C类台风暴雨的年降雨量变化趋势主要为桂平东北部、南部和平南西北部偏多,其余地区偏少,或者桂平东北部、南部和平南西北部偏少,其余地区偏多。 展开更多
关键词 台风暴雨 k-均值 EOF分析 时空变化
下载PDF
基于改进K均值聚类的语音情感识别深度学习方法
4
作者 李巧君 郭彍 《计算机应用与软件》 北大核心 2024年第9期224-229,共6页
针对当前语音情感识别(Speech Emotion Recognition, SER)方法中准确性低和时间复杂度高的问题,提出一种基于改进K均值聚类的语音情感识别深度学习方法。采用改进的K-均值聚类算法从整个音频信号中选取反映情感特征的关键片段;使用短时... 针对当前语音情感识别(Speech Emotion Recognition, SER)方法中准确性低和时间复杂度高的问题,提出一种基于改进K均值聚类的语音情感识别深度学习方法。采用改进的K-均值聚类算法从整个音频信号中选取反映情感特征的关键片段;使用短时傅里叶变换将所选序列转化为一个谱图;利用深度残差模型ResNet和深度双向长短时记忆Bi-LSTM网络从空间和时间上学习表征谱图中与情感相关的隐藏特征,基于Softmax分类器获得最终的情感分类。实验结果表明,所提方法比其他识别方法具有明显的优势,在改善情感识别率的同时,降低了模型的处理时间。 展开更多
关键词 语音情感识别 深度双向长短时记忆 k-均值 短时傅里叶变换
下载PDF
融合改进PSO和K-调和均值的混合聚类算法 被引量:2
5
作者 余亮 曾勍炜 +1 位作者 石永革 肖异瑶 《南昌大学学报(工科版)》 CAS 2017年第2期184-189,共6页
为了提高聚类算法的全局搜索能力,提出了一种融合改进的粒子群算法(IPSO)和K-调和均值聚类(KHM)的混合聚类算法(IPSO-KHM)。该算法为了改进PSO算法容易陷入局部最优的缺点,提出了一种粒子突变策略,根据粒子分布密集程度及粒子在当前最... 为了提高聚类算法的全局搜索能力,提出了一种融合改进的粒子群算法(IPSO)和K-调和均值聚类(KHM)的混合聚类算法(IPSO-KHM)。该算法为了改进PSO算法容易陷入局部最优的缺点,提出了一种粒子突变策略,根据粒子分布密集程度及粒子在当前最优值附近的相对分布位置,通过移动低效粒子使之远离当前局部最优值,从而提高粒子全局搜索的效率,避免陷入局部最优。实证分析结果表明:IPSO-KHM算法的聚类效果、收敛速度、分类精度等性能优于其他算法。 展开更多
关键词 分析 全局搜索 改进粒子群算法 k-调和均值算法
下载PDF
基于混合聚类法的典型行驶工况构建
6
作者 曹骞 侯乐福 +1 位作者 贾咸坤 袁承志 《重型汽车》 2024年第3期29-30,共2页
行驶工况开发对于交通模式识别、车辆技术研发以及交通控制水平风险评估等方面具有重要的研究价值,然而面向传统能源车辆的典型行驶工况越来越难以准确体现当前车辆的普遍行驶规律,也无法满足个性化的研发和应用需求。因此,本文提出了... 行驶工况开发对于交通模式识别、车辆技术研发以及交通控制水平风险评估等方面具有重要的研究价值,然而面向传统能源车辆的典型行驶工况越来越难以准确体现当前车辆的普遍行驶规律,也无法满足个性化的研发和应用需求。因此,本文提出了一种基于“主成分分析+分层聚类+K均值+高斯概率”的混合聚类方法,该方法通过对高密度分布大样本的聚类分析,构建典型行驶工况。构建结果表明,所得工况的各特征参数相对偏差均低于10%,平均偏差低于4%,本文提出的构建方法具备合理性。 展开更多
关键词 行驶工况 主成分分析 K均值 高斯概率 混合
下载PDF
一种结合人工蜂群和K-均值的混合聚类算法 被引量:15
7
作者 毕晓君 宫汝江 《计算机应用研究》 CSCD 北大核心 2012年第6期2040-2042,2046,共4页
传统的K-均值聚类算法虽然收敛速度快,但由于过度依赖初始聚类中心,算法的鲁棒性较差。为此,提出了一种改进人工蜂群算法与K-均值相结合的混合聚类方法,将改进人工蜂群算法能调节全局寻优能力与局部寻优能力的优点与K-均值算法收敛速度... 传统的K-均值聚类算法虽然收敛速度快,但由于过度依赖初始聚类中心,算法的鲁棒性较差。为此,提出了一种改进人工蜂群算法与K-均值相结合的混合聚类方法,将改进人工蜂群算法能调节全局寻优能力与局部寻优能力的优点与K-均值算法收敛速度快的优点相结合,来提高算法的鲁棒性。实验表明,该算法不仅克服了传统K-均值聚类算法稳定性差的缺点,而且聚类效果也有了明显改善。 展开更多
关键词 人工蜂群 算法 k-均值
下载PDF
基于改进K-均值聚类的欠定混合矩阵盲估计 被引量:10
8
作者 付卫红 马丽芬 李爱丽 《系统工程与电子技术》 EI CSCD 北大核心 2014年第11期2143-2148,共6页
在源信号个数未知条件下,提出一种基于改进K-均值聚类的欠定混合矩阵盲估计方法。该方法首先计算观测信号在单位半超球面上投影点的密度参数,然后去掉低密度投影点,并从高密度投影点中选取初始聚类中心,最后对剩余投影点进行聚类,根据Da... 在源信号个数未知条件下,提出一种基于改进K-均值聚类的欠定混合矩阵盲估计方法。该方法首先计算观测信号在单位半超球面上投影点的密度参数,然后去掉低密度投影点,并从高密度投影点中选取初始聚类中心,最后对剩余投影点进行聚类,根据Davies-Bouldin指标估计源信号个数,并估计出混合矩阵。仿真结果表明,该方法的复杂度低,其运行时间仅为拉普拉斯势函数法的1%-3%;该方法的源信号个数估计正确率远高于鲁棒竞争聚类算法,当信噪比高于13dB时,该方法源信号个数估计正确率大于96.6%,且混合矩阵估计误差较小。该方法在信噪比较高时,可降低对源信号稀疏度的要求。 展开更多
关键词 混合矩阵估计 Davies-Bouldin指标 密度参数 改进k-均值
下载PDF
融合K-调和均值的混沌粒子群聚类算法 被引量:6
9
作者 沈明明 毛力 《计算机工程与应用》 CSCD 北大核心 2011年第27期144-146,151,共4页
针对K-调和均值和混沌粒子群聚类算法的优缺点,提出了一种融合K-调和均值的混沌粒子群聚类算法。首先通过K-调和均值方法把粒子群分成若干个子群体,每个粒子根据其个体极值和所在子种群的全局极值来更新位置。其次,算法中引入变尺度混... 针对K-调和均值和混沌粒子群聚类算法的优缺点,提出了一种融合K-调和均值的混沌粒子群聚类算法。首先通过K-调和均值方法把粒子群分成若干个子群体,每个粒子根据其个体极值和所在子种群的全局极值来更新位置。其次,算法中引入变尺度混沌变异,抑制了早熟收敛,提高了计算精度。实验证明,该算法可以有效地避免算法陷入局部最优,在保证收敛速度的同时增强了算法的全局搜索能力,明显改善了聚类效果。 展开更多
关键词 k-调和均值 混沌粒子群
下载PDF
基于改进K-均值聚类算法的汽车用户行为分析方法研究
10
作者 王健 毋丽丽 +2 位作者 裴春琴 郝耀军 刘文远 《燕山大学学报》 CAS 北大核心 2023年第3期229-235,245,共8页
汽车用户的驾驶行为和操作习惯等决定着驾驶是否存在风险,对于道路交通安全具有重要的意义,针对这种情况,提出一种用于预测汽车用户驾驶行为风险等级的模型。该模型为了提高模型的分类效率,在自组织映射神经网络算法中采用遗忘第二名的... 汽车用户的驾驶行为和操作习惯等决定着驾驶是否存在风险,对于道路交通安全具有重要的意义,针对这种情况,提出一种用于预测汽车用户驾驶行为风险等级的模型。该模型为了提高模型的分类效率,在自组织映射神经网络算法中采用遗忘第二名的策略,然后结合自组织映射神经网络改进K-均值聚类分析方法,实现对于车辆驾驶人员的风险行为等级进行划分,通过聚类分析得到风险标签后,利用XGBoost算法实现对于用户风险行为的辨识。实验结果表明,改进算法的聚类精确度和运行效率都得到了提高,预测准确率为98%,召回率为98%,F1值98%,kappa系数高达0.97,远远超过其他集成辨识模型,表明本文模型在汽车用户行为的分辨准确率上得到有效提高。 展开更多
关键词 汽车用户 驾驶行为 k-均值算法 行为分析
下载PDF
一种结合灰狼优化和K-均值的混合聚类算法 被引量:17
11
作者 杨红光 刘建生 《江西理工大学学报》 CAS 2015年第5期85-89,共5页
针对传统K-均值聚类算法对初始中心选择敏感和全局搜索能力不足的缺点,提出一种结合灰狼优化和K-均值的混合聚类算法(GWO-KM).将灰狼优化智能算法首次应用到聚类分析领域,利用灰狼算法良好的勘探能力去寻找使聚类结果最佳的一组聚类中心... 针对传统K-均值聚类算法对初始中心选择敏感和全局搜索能力不足的缺点,提出一种结合灰狼优化和K-均值的混合聚类算法(GWO-KM).将灰狼优化智能算法首次应用到聚类分析领域,利用灰狼算法良好的勘探能力去寻找使聚类结果最佳的一组聚类中心,克服了原始聚类算法对初始中心点的过度依赖.通过在UCI标准数据集上的仿真实验表明,该混合聚类算法相对于传统的K-均值聚类算法和其他改进算法,在收敛速度、聚类质量和稳定性上都表现更佳. 展开更多
关键词 分析 k-均值算法 灰狼优化算法
下载PDF
基于模糊C均值聚类的混合动力汽车典型运行工况构建
12
作者 王宝森 杨建军 +1 位作者 高继东 付雪青 《机械设计与制造》 北大核心 2023年第1期74-79,共6页
为了优化某款混合动力汽车在实际道路工况下的燃油经济性,采用模糊C均值聚类算法构建了其在目标城市下的典型运行工况。与运行工况实测数据相比,其特征参数平均误差为4.22%;速度-加速度联合概率分布吻合较好;试验车型的Cruise仿真模型... 为了优化某款混合动力汽车在实际道路工况下的燃油经济性,采用模糊C均值聚类算法构建了其在目标城市下的典型运行工况。与运行工况实测数据相比,其特征参数平均误差为4.22%;速度-加速度联合概率分布吻合较好;试验车型的Cruise仿真模型在典型运行工况下的百公里油耗相对误差为1.89%。此外,将典型运行工况与NEDC、WLTC进行对比。可知,典型运行工况具有平均车速低的特点,体现了目标城市道路工况与现行法规工况之间的差异。 展开更多
关键词 混合动力汽车 运行工况 模糊C均值 短行程
下载PDF
基于K-均值与蚁群混合聚类的图像分割 被引量:4
13
作者 江新姿 高尚 《计算机与数字工程》 2011年第6期138-141,共4页
针对单一聚类算法在图像分割中容易陷入局部最优或有过分割现象,造成分割精确度低等问题,文章提出了基于K-均值聚类和蚁群聚类相结合的新算法。新算法先将K-均值算法作快速分类,根据K-均值分类结果更新蚂蚁各路径上的信息素,指导其他蚂... 针对单一聚类算法在图像分割中容易陷入局部最优或有过分割现象,造成分割精确度低等问题,文章提出了基于K-均值聚类和蚁群聚类相结合的新算法。新算法先将K-均值算法作快速分类,根据K-均值分类结果更新蚂蚁各路径上的信息素,指导其他蚂蚁选择,以提高蚁群聚类算法的运行效率。实验结果证明,新算法在图像分割处理的精确度上较单一的K均值和蚁群聚类算法有很大提高。所以进一步表明该方法对于图像分割具有很好的通用性和有效性,是一种实用的、有前途的图像分割方法。 展开更多
关键词 蚁群 k-均值 图像分割
下载PDF
基于K-均值聚类电网基建工程造价中前期费用整合方法 被引量:1
14
作者 张锦元 《中国管理信息化》 2023年第23期88-91,共4页
为了优化电网基建工程造价中前期费用整合效果,减小费用整合结果与实际造价费用的偏差,引入K-均值聚类,开展了基于K-均值聚类电网基建工程造价中前期费用整合方法研究。首先,构建了电网基建工程造价数据库,明确工程造价中前期费用指标... 为了优化电网基建工程造价中前期费用整合效果,减小费用整合结果与实际造价费用的偏差,引入K-均值聚类,开展了基于K-均值聚类电网基建工程造价中前期费用整合方法研究。首先,构建了电网基建工程造价数据库,明确工程造价中前期费用指标。其次,利用K-均值聚类算法,提取基建工程造价中前期费用特征量之间的相似关系与工程数据特征量,对基建工程造价中前期费用进行全方位的整合。应用分析结果表明,费用整合方法得以应用后,电网基建工程造价中前期费用整合正确率均达到了98%,费用整合结果与基建工程实际费用情况更加接近,有效地缩小了费用整合偏差。 展开更多
关键词 k-均值 造价 基建工程 中前期 电网 费用 整合
下载PDF
基于改进K-均值聚类的数字化档案智能分类方法研究
15
作者 李嘉 《软件》 2023年第11期103-105,共3页
针对现有分类方法在对数字化档案分类时存在分类结果轮廓系数和CH指数过低的问题,本文引入改进K-均值聚类,开展数字化档案智能分类方法的设计研究。通过提取数字化档案特征,并对特征主分量分析,利用改进K-均值聚类,完成对档案特征相似... 针对现有分类方法在对数字化档案分类时存在分类结果轮廓系数和CH指数过低的问题,本文引入改进K-均值聚类,开展数字化档案智能分类方法的设计研究。通过提取数字化档案特征,并对特征主分量分析,利用改进K-均值聚类,完成对档案特征相似度的计算,结合相似度计算结果,对数字化档案关键词自动聚类,并实现智能分类。通过实验证明:新的分类方法应用后,数字化档案分类结果的轮廓系数和CH指数均显著提高,该分类方法具备较高的分类精度,同时也可广泛应用于类似资源分类当中。 展开更多
关键词 改进k-均值 档案 智能 数字化
下载PDF
融合并行混沌萤火虫算法的K-调和均值聚类 被引量:8
16
作者 朱书伟 周治平 张道文 《智能系统学报》 CSCD 北大核心 2015年第6期872-880,共9页
针对K-调和均值算法易陷于局部最优的缺点,提出一种基于改进萤火虫算法(firefly algorithm,FA)的K-调和均值聚类算法。将基于FA的粗搜索与基于并行混沌优化FA的精细搜索相结合,其中精细搜索部分首先通过FA搜索到当前最优解及次优解,然... 针对K-调和均值算法易陷于局部最优的缺点,提出一种基于改进萤火虫算法(firefly algorithm,FA)的K-调和均值聚类算法。将基于FA的粗搜索与基于并行混沌优化FA的精细搜索相结合,其中精细搜索部分首先通过FA搜索到当前最优解及次优解,然后通过改进的logistic映射与并行混沌优化策略产生混沌序列在其附近直接搜索,以增强算法的寻优性能。最终,将这种改进的FA用于K-调和均值算法聚类中心的优化。实验结果表明:该算法不但对几种测试函数具有更高的搜索精度,而且对6种数据集的聚类结果均有一定的改善,有效地抑制了K-调和均值算法陷于局部最优的问题,提高了聚类准确性和稳定性。 展开更多
关键词 k-调和均值 局部最优 萤火虫算法 并行混沌优化 混沌局部搜索 映射模型 种群多样性
下载PDF
基于PCA与K-均值聚类的学习者特征识别研究
17
作者 李铮铮 贾金娜 +1 位作者 刘蓓蕾 马静 《现代信息科技》 2023年第22期142-145,149,共5页
学习者特征识别是在线教育决策的重要支撑。深入分析了学习者特征分析的内涵、阶段划分和主要作用,构建了由人口学特征、支持性特征、动力特征、信息能力特征和策略性特征构成的在线教育学习者特征五元模型,设计了基于PCA和K-均值聚类... 学习者特征识别是在线教育决策的重要支撑。深入分析了学习者特征分析的内涵、阶段划分和主要作用,构建了由人口学特征、支持性特征、动力特征、信息能力特征和策略性特征构成的在线教育学习者特征五元模型,设计了基于PCA和K-均值聚类的学习者特征数据分析思路与方法,并进行了实例分析,能够为学习者特征及差异识别分析提供方法支撑。 展开更多
关键词 主成分分析 k-均值 特征数据 数据分析
下载PDF
模糊K-Harmonic-Kohonen网络的FTIR光谱数据聚类分析 被引量:4
18
作者 陈勇 郭云柱 +3 位作者 王威 武小红 贾红雯 武斌 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2023年第1期268-272,共5页
食品的品种不同则其含有营养成分和功效存在差异,得到的傅里叶变换红外光谱也存在差异。为了准确的实现品种分类,设计了一种将傅里叶变换红外光谱与模糊聚类分析方法相结合的品种鉴别方法。在模糊Kohonen聚类网络(FKCN)基础上将模糊K调... 食品的品种不同则其含有营养成分和功效存在差异,得到的傅里叶变换红外光谱也存在差异。为了准确的实现品种分类,设计了一种将傅里叶变换红外光谱与模糊聚类分析方法相结合的品种鉴别方法。在模糊Kohonen聚类网络(FKCN)基础上将模糊K调和聚类(FKHM)引入到Kohonen聚类网络的学习速率和更新策略中,提出了模糊K-Harmonic-Kohonen网络(FKHKCN)算法。FKHKCN利用模糊C均值(FCM)聚类的模糊隶属度计算其学习速率,以FKHM的聚类中心为基础通过推导计算得到FKHKCN的聚类中心,可以解决模糊Kohonen聚类网络方法对于初始类中心敏感而导致聚类结果不稳定的问题。FKHKCN作为一种模糊聚类算法,可实现傅里叶变换红外光谱数据的聚类分析。采用三种数据集:(1)采集产自四川的三种茶叶(优质和劣质的乐山竹叶青以及峨眉山毛峰)作为实验样本,样本总数为96。(2)两个品种(robusta和arabica)的咖啡样本。(3)三个品种(鸡肉、猪肉和火鸡)的肉类样本。首先对三个光谱数据集进行预处理,利用多元散射校正降低茶叶样本原始光谱数据集的散射影响,使用Savitzky-Golay减少噪声对肉类和咖啡这两个光谱数据集的影响。再利用主成分分析将高维的三种光谱数据集压缩至低维。然后采用线性判别分析进行特征提取,将光谱数据投影到求得的鉴别向量上。最后分别采用FCM,FKCN和FKHKCN对茶叶、肉类和咖啡进行判别。最终结果如下:FCM,FKCN和FKHKCN对茶叶品种的聚类准确率分别为90.91%,90.91%和93.94%;对肉类品种的聚类准确率分别为90.83%,0.00%和92.50%;对咖啡品种的聚类准确率分别为89.17%,89.17%和90.83%。以上实验结果表明:采用傅里叶红外光谱技术结合主成分分析、线性判别分析和FKHKCN的方法能够较有效地对食品的品种进行鉴别,且鉴别准确率比FCM和FKCN更高,聚类结果更稳定。 展开更多
关键词 傅里叶变换红外光谱 模糊K调和均值 多元散射校正 模糊KOHONEN网络 分析
下载PDF
自动属性加权的K-调和均值聚类算法 被引量:1
19
作者 范桂明 张桂珠 《计算机应用与软件》 CSCD 2016年第11期234-239,共6页
针对K-调和均值算法中距离度量将所有属性视为相等重要而存在的不足,提出一种利用自动属性加权的改进聚类算法。在算法的目标函数中,用加权欧氏距离替代传统的欧氏距离,并证明了使得算法能够收敛的属性权重更新机制。为进一步提高聚类性... 针对K-调和均值算法中距离度量将所有属性视为相等重要而存在的不足,提出一种利用自动属性加权的改进聚类算法。在算法的目标函数中,用加权欧氏距离替代传统的欧氏距离,并证明了使得算法能够收敛的属性权重更新机制。为进一步提高聚类性能,将粒子群算法融入到改进的属性加权聚类算法中以抑制其陷于局部最优,其中采用聚类中心和属性权重的值同时表示粒子的位置进行寻优。在UCI数据集的测试结果表明,该算法的聚类指标平均提高了约9个百分点,具有更高的聚类准确性和稳定性。 展开更多
关键词 k-调和均值 属性加权 粒子群
下载PDF
融合密度和划分的文本聚类算法
20
作者 刘龙 刘新 +1 位作者 蔡林杰 唐朝 《计算机与数字工程》 2024年第1期178-183,共6页
文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中... 文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中的K-均值算法可以有效地聚类文档,但是算法的性能非常依赖于初始中心点的选择。论文提出了一种新的融合密度和划分的文本聚类算法。首先,通过密度选择适当的聚类中心点集合,然后使用最远距离的想法逐渐选择初始类中心点,最后使用划分方法对数据集进行聚类。实验表明,该算法的聚类效果稳定,聚类效果良好。 展开更多
关键词 文档 BERT k-均值算法 密度 最远距离
下载PDF
上一页 1 2 48 下一页 到第
使用帮助 返回顶部