期刊文献+
共找到345篇文章
< 1 2 18 >
每页显示 20 50 100
基于改进K-均值聚类算法的汽车用户行为分析方法研究
1
作者 王健 毋丽丽 +2 位作者 裴春琴 郝耀军 刘文远 《燕山大学学报》 CAS 北大核心 2023年第3期229-235,245,共8页
汽车用户的驾驶行为和操作习惯等决定着驾驶是否存在风险,对于道路交通安全具有重要的意义,针对这种情况,提出一种用于预测汽车用户驾驶行为风险等级的模型。该模型为了提高模型的分类效率,在自组织映射神经网络算法中采用遗忘第二名的... 汽车用户的驾驶行为和操作习惯等决定着驾驶是否存在风险,对于道路交通安全具有重要的意义,针对这种情况,提出一种用于预测汽车用户驾驶行为风险等级的模型。该模型为了提高模型的分类效率,在自组织映射神经网络算法中采用遗忘第二名的策略,然后结合自组织映射神经网络改进K-均值聚类分析方法,实现对于车辆驾驶人员的风险行为等级进行划分,通过聚类分析得到风险标签后,利用XGBoost算法实现对于用户风险行为的辨识。实验结果表明,改进算法的聚类精确度和运行效率都得到了提高,预测准确率为98%,召回率为98%,F1值98%,kappa系数高达0.97,远远超过其他集成辨识模型,表明本文模型在汽车用户行为的分辨准确率上得到有效提高。 展开更多
关键词 汽车用户 驾驶行为 k-均值算法 行为分析
下载PDF
融合密度和划分的文本聚类算法
2
作者 刘龙 刘新 +1 位作者 蔡林杰 唐朝 《计算机与数字工程》 2024年第1期178-183,共6页
文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中... 文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中的K-均值算法可以有效地聚类文档,但是算法的性能非常依赖于初始中心点的选择。论文提出了一种新的融合密度和划分的文本聚类算法。首先,通过密度选择适当的聚类中心点集合,然后使用最远距离的想法逐渐选择初始类中心点,最后使用划分方法对数据集进行聚类。实验表明,该算法的聚类效果稳定,聚类效果良好。 展开更多
关键词 文档 BERT k-均值算法 密度 最远距离
下载PDF
基于微粒群优化聚类数目的K-均值算法 被引量:18
3
作者 巩敦卫 蒋余庆 +1 位作者 张勇 周勇 《控制理论与应用》 EI CAS CSCD 北大核心 2009年第10期1175-1179,共5页
K-均值算法是广泛使用的聚类算法,但该算法的聚类数目难以确定,且聚类结果对初始聚类中心比较敏感.本文提出一种基于微粒群优化聚类数目的K-均值算法,该算法采用聚类中心的坐标和通配符表示微粒位置,通过定义微粒更新公式中新的加减运算... K-均值算法是广泛使用的聚类算法,但该算法的聚类数目难以确定,且聚类结果对初始聚类中心比较敏感.本文提出一种基于微粒群优化聚类数目的K-均值算法,该算法采用聚类中心的坐标和通配符表示微粒位置,通过定义微粒更新公式中新的加减运算符,动态调整聚类中心的数目及坐标,此外,以改进的聚类有效性指标Davies-Bouldin准则作为适应度函数.5个人工和真实数据集的聚类结果验证了所提算法的优越性. 展开更多
关键词 k-均值算法 微粒群优化 微粒更新
下载PDF
一个用于空间聚类分析的遗传K-均值算法 被引量:19
4
作者 王家耀 张雪萍 周海燕 《计算机工程》 CAS CSCD 北大核心 2006年第3期188-190,共3页
空间数据挖掘是数据挖掘的一个新的分支,空间聚类分析是空间数据挖掘中的一个重要研究课题。本文在分析遗传算法及K–均值算法的优越性和不足的基础上,设计了一种遗传K-均值空间聚类分析算法,该算法兼顾了局部收敛和全局收敛性能。实验... 空间数据挖掘是数据挖掘的一个新的分支,空间聚类分析是空间数据挖掘中的一个重要研究课题。本文在分析遗传算法及K–均值算法的优越性和不足的基础上,设计了一种遗传K-均值空间聚类分析算法,该算法兼顾了局部收敛和全局收敛性能。实验表明,其结果优于传统K-均值聚类方法及单纯的遗传算法聚类。 展开更多
关键词 空间数据挖掘 空间 遗传算法 k-均值算法 遗传k-均值算法
下载PDF
动态的K-均值聚类算法在图像检索中的应用 被引量:12
5
作者 张白妮 骆嘉伟 汤德佑 《计算机工程与设计》 CSCD 2004年第10期1843-1846,共4页
聚类分析技术已经广泛应用于基于内容的图像信息挖掘领域,该技术提高了图像检索的速度和质量。K-均值算法和自适应算法是两个典型的聚类分析算法,但K-均值算法严重依赖于经验参数和阙值的设定;自适应算法得到的聚类个数太多,相应的就是... 聚类分析技术已经广泛应用于基于内容的图像信息挖掘领域,该技术提高了图像检索的速度和质量。K-均值算法和自适应算法是两个典型的聚类分析算法,但K-均值算法严重依赖于经验参数和阙值的设定;自适应算法得到的聚类个数太多,相应的就是类内的图像个数过少,效率不是很高。从选取初始聚类点是否具有确定性、迭代次数是否过多和聚类个数是否适当等方面考虑,提出了一种新的聚类算法,即动态的K-均值法。模拟实验的结果表明,该算法具有较好的准确性和效率,使检索的质量和速度都得到了很大的提高。 展开更多
关键词 k-均值 图像检索 k-均值算法 基于内容 算法 自适应算法 图像信息 个数 速度 技术
下载PDF
基于K-均值聚类算法的西安市汽车行驶工况合成技术研究 被引量:23
6
作者 蔡锷 李阳阳 +2 位作者 李春明 谭晓伟 刘东民 《汽车技术》 北大核心 2015年第8期33-36,共4页
为提供排放试验所需的车速曲线,基于划分的短行程数据,采用K-均值聚类算法构建了西安市汽车行驶合成工况。首先对采集的原始数据进行短行程划分并进行特征提取,针对提取的高维特征向量之间的冗余性和非线性关系,采用核主分量分析法进行... 为提供排放试验所需的车速曲线,基于划分的短行程数据,采用K-均值聚类算法构建了西安市汽车行驶合成工况。首先对采集的原始数据进行短行程划分并进行特征提取,针对提取的高维特征向量之间的冗余性和非线性关系,采用核主分量分析法进行降维。然后基于K-均值的聚类算法,对降维后特征向量进行划分,按照离聚类中心最近的原则选择各聚类的短行程样本,将其合成为平均速度为21.51 km/h、持续时间为1 166 s、距离为6.9 km的西安市汽车行驶工况。对比表明,西安市汽车行驶工况接近于日本J10-15标准,但加速度参数要高很多。 展开更多
关键词 汽车 行驶工况合成 k-均值算法 西安市
下载PDF
基于节点生长k-均值聚类算法的强化学习方法 被引量:13
7
作者 陈宗海 文锋 +1 位作者 聂建斌 吴晓曙 《计算机研究与发展》 EI CSCD 北大核心 2006年第4期661-666,共6页
处理连续状态强化学习问题,主要方法有两类:参数化的函数逼近和自适应离散划分.在分析了现有对连续状态空间进行自适应划分方法的优缺点的基础上,提出了一种基于节点生长k均值聚类算法的划分方法,分别给出了在离散动作和连续动作两种情... 处理连续状态强化学习问题,主要方法有两类:参数化的函数逼近和自适应离散划分.在分析了现有对连续状态空间进行自适应划分方法的优缺点的基础上,提出了一种基于节点生长k均值聚类算法的划分方法,分别给出了在离散动作和连续动作两种情况下该强化学习方法的算法步骤.在离散动作的MountainCar问题和连续动作的双积分问题上进行仿真实验.实验结果表明,该方法能够根据状态在连续空间的分布,自动调整划分的精度,实现对于连续状态空间的自适应划分,并学习到最佳策略. 展开更多
关键词 强化学习 k-均值算法 Sarsa学习 连续状态表示
下载PDF
云计算中基于K-均值聚类的虚拟机调度算法研究 被引量:17
8
作者 黄纬 温志萍 程初 《南京理工大学学报》 EI CAS CSCD 北大核心 2013年第6期807-812,共6页
为了提高云计算数据中心的资源利用率,动态优化部署虚拟机,提出基于K-均值聚类的虚拟机调度算法。使用虚拟机资源配置的相关性作为聚类的衡量标准,将虚拟机放置于与其资源互补的物理节点上,从而充分利用其资源,并具有高效稳定的特点。... 为了提高云计算数据中心的资源利用率,动态优化部署虚拟机,提出基于K-均值聚类的虚拟机调度算法。使用虚拟机资源配置的相关性作为聚类的衡量标准,将虚拟机放置于与其资源互补的物理节点上,从而充分利用其资源,并具有高效稳定的特点。进一步设计了在线调度算法处理新到达虚拟机的请求。提出了贪婪算法,并给出了其与最优离线算法竞争比的上界。基于真实数据集的实验结果证实了算法的正确性。 展开更多
关键词 云计算 k-均值 虚拟机 调度 贪婪算法
下载PDF
基于密度加权的粗糙K-均值聚类改进算法 被引量:25
9
作者 郑超 苗夺谦 王睿智 《计算机科学》 CSCD 北大核心 2009年第3期220-222,共3页
针对粗糙K-均值聚类算法中类均值计算式的特点,提出了一种改进的粗糙K-均值算法。改进后的算法基于数据对象所在区域的密度,在类的均值计算过程中对每个对象赋以不同的权重。不同测试数据集的实验结果表明,改进后的粗糙K-均值算法提高... 针对粗糙K-均值聚类算法中类均值计算式的特点,提出了一种改进的粗糙K-均值算法。改进后的算法基于数据对象所在区域的密度,在类的均值计算过程中对每个对象赋以不同的权重。不同测试数据集的实验结果表明,改进后的粗糙K-均值算法提高了聚类的准确性,降低了迭代次数,并且可以有效地减小孤立点对聚类的影响。 展开更多
关键词 算法 粗糙k-均值 密度 孤立点
下载PDF
基于初始聚类中心优化的K-均值算法 被引量:24
10
作者 王赛芳 戴芳 +1 位作者 王万斌 张晓宇 《计算机工程与科学》 CSCD 北大核心 2010年第10期105-107,116,共4页
针对传统的K-均值算法对初始聚类中心的选取和孤立点敏感的问题,本文提出了一种基于点密度的初始聚类中心选取方法。利用该方法选出初始聚类中心,再应用K-均值算法进行聚类,同时对孤立点进行特殊处理。实验表明,该方法能够产生高质量的... 针对传统的K-均值算法对初始聚类中心的选取和孤立点敏感的问题,本文提出了一种基于点密度的初始聚类中心选取方法。利用该方法选出初始聚类中心,再应用K-均值算法进行聚类,同时对孤立点进行特殊处理。实验表明,该方法能够产生高质量的聚类结果。 展开更多
关键词 k-均值算法 点密度
下载PDF
基于赤平极射投影和K-均值聚类算法的优势结构面分析 被引量:13
11
作者 王俊杰 冯登 +1 位作者 柴贺军 刘云飞 《岩土工程学报》 EI CAS CSCD 北大核心 2018年第1期74-81,共8页
对于结构面多而复杂的岩质边坡,其优势结构面的选取与分析是极其重要的工作。传统的结构面组数划分方法比较粗糙,分析结果有很大的主观因素,无法准确地给出结构面的优势产状,使得其结果在实际工程中使用不便。以结构面交线的筛选和分析... 对于结构面多而复杂的岩质边坡,其优势结构面的选取与分析是极其重要的工作。传统的结构面组数划分方法比较粗糙,分析结果有很大的主观因素,无法准确地给出结构面的优势产状,使得其结果在实际工程中使用不便。以结构面交线的筛选和分析为突入点,借助于赤平极射投影法,在楔形体滑移分析中首先确定可能的滑移区域,筛选出可能滑移的结构面交线,缩小计算范围,采用K-均值聚类算法和有效性检验,根据赤平极射投影分析得到滑移区域的对称轴中心作为初始凝聚点,通过多次迭代计算得到滑移区域内的优势结构面交线。将该方法用于重庆万盛黑山谷的岩质滑坡中,结果表明,将赤平极射投影与K-均值聚类算法相结合,计算得到的优势结构面交线分类合理,结果可靠,可以准确地确定结构面交线的优势产状。 展开更多
关键词 岩质边坡 优势结构面交线 赤平极射投影 k-均值算法
下载PDF
面向立木识别的有效K-均值聚类算法研究 被引量:5
12
作者 王亚雄 康峰 +2 位作者 李文彬 文剑 郑永军 《农业机械学报》 EI CAS CSCD 北大核心 2017年第3期230-237,共8页
针对林区自动对靶施药过程中,当立木生长密集时,获取的点云数据聚类准确率低、效率低的问题,提出优化后的K-均值聚类算法,数据获取方式基于2D激光扫描。针对立木点云信息聚类前需对相关数据进行滤波,提出窗口滤波算法,选取产生混合像素... 针对林区自动对靶施药过程中,当立木生长密集时,获取的点云数据聚类准确率低、效率低的问题,提出优化后的K-均值聚类算法,数据获取方式基于2D激光扫描。针对立木点云信息聚类前需对相关数据进行滤波,提出窗口滤波算法,选取产生混合像素点的树干边缘,提取3次连续扫描的混合像素及其近邻点组成滤波窗口,进行最大阈值滤波,结果显示50次试验中仅有2个混合像素点未被滤除,混合噪声的滤除率高。在K-均值算法优化方面,针对算法需预先确定聚类数和初始聚类中心的不足,提出利用斜率变化确定聚类数的方法,试验对5个不同距离下5组立木分别进行100次测量,结果显示错误测量次数仅为3次,并可在试验前期通过人工方式去除,算法合理有效;对哈夫曼树法确定立木扫描点聚类中心的性能进行了试验分析,3种不同树干分布类型下分别运用随机抽样法和哈夫曼树法进行K-均值聚类,前者平均正确率仅为76.4%,后者则为95.5%;同时分析了Ⅰ型分布下2种算法聚类的迭代次数和耗时,5个不同距离下,随机抽样法的平均迭代次数明显高于哈夫曼树法,平均运行耗时上,哈夫曼树法则高于随机抽样法,前者变化范围为120~220 ms,后者为50~85 ms,该范围为林区测绘的可接受范围。试验证明,基于斜率变化确定聚类数和基于哈夫曼树法确定聚类中心的K-均值算法是林区立木点云聚类的有效算法,可应用于林区的立木检测。 展开更多
关键词 立木识别 点云数据 k-均值算法 窗口滤波算法 哈夫曼树法
下载PDF
基于K-均值聚类算法RBF神经网络交通流预测 被引量:21
13
作者 管硕 高军伟 +2 位作者 张彬 刘新 冷子文 《青岛大学学报(工程技术版)》 CAS 2014年第2期20-23,共4页
针对目前道路拥堵等交通问题,本文采用K-均值聚类算法对径向基函数(radial basis function,RBF)网络进行优化,通过K-均值聚类算法把所有的输入样本进行统一聚类,求得所有隐含层节点的RBF中心值Ci,并用最小二乘法(LMS)进行RBF网络的权值... 针对目前道路拥堵等交通问题,本文采用K-均值聚类算法对径向基函数(radial basis function,RBF)网络进行优化,通过K-均值聚类算法把所有的输入样本进行统一聚类,求得所有隐含层节点的RBF中心值Ci,并用最小二乘法(LMS)进行RBF网络的权值调整,同时在一定的时间和路段内对车流量进行数据采集,通过建立RBF神经网络模型,运用Matlab软件把采集的数据、图像进行计算机仿真,仿真结果表明,未加入K-均值聚类的RBF神经网络,其预测输出曲线大致可以和实际输出曲线拟合,但在数据波动较大的时刻,预测曲线的收敛速度偏慢且效率偏低;而采用K-均值聚类算法的RBF神经网络,在实际输出波动较大时,预测输出的曲线收敛速度和准确度都较高,因此,本研究相对于普通的BP神经网络,有更高的预测精度和较好的收敛性。该研究适用于市区内的交通流预测。 展开更多
关键词 RBF神经网络 交通流 预测模型 k-均值算法
下载PDF
一种结合人工蜂群和K-均值的混合聚类算法 被引量:15
14
作者 毕晓君 宫汝江 《计算机应用研究》 CSCD 北大核心 2012年第6期2040-2042,2046,共4页
传统的K-均值聚类算法虽然收敛速度快,但由于过度依赖初始聚类中心,算法的鲁棒性较差。为此,提出了一种改进人工蜂群算法与K-均值相结合的混合聚类方法,将改进人工蜂群算法能调节全局寻优能力与局部寻优能力的优点与K-均值算法收敛速度... 传统的K-均值聚类算法虽然收敛速度快,但由于过度依赖初始聚类中心,算法的鲁棒性较差。为此,提出了一种改进人工蜂群算法与K-均值相结合的混合聚类方法,将改进人工蜂群算法能调节全局寻优能力与局部寻优能力的优点与K-均值算法收敛速度快的优点相结合,来提高算法的鲁棒性。实验表明,该算法不仅克服了传统K-均值聚类算法稳定性差的缺点,而且聚类效果也有了明显改善。 展开更多
关键词 人工蜂群 算法 k-均值
下载PDF
大矢量空间聚类的遗传k-均值算法 被引量:6
15
作者 王磊 戚飞虎 《上海交通大学学报》 EI CAS CSCD 北大核心 1999年第9期1154-1156,共3页
基于遗传算法与k均值算法,提出了一种遗传k均值算法.该算法通过改进标准遗传操作和使用可变变异率,使其在大矢量空间聚类问题中表现良好的性能,克服了k均值聚类算法易于陷入局部最值和标准遗传交叉操作对聚类应用的不适应.
关键词 遗传算法 k-均值算法 矢量空间
下载PDF
基于改进k-均值聚类算法的风机振动分析 被引量:4
16
作者 周云龙 王锁斌 赵鹏 《振动.测试与诊断》 EI CSCD 北大核心 2012年第3期437-440,516,共4页
针对风机振动信号的非平稳和非线性特征,提出了一种基于时域信号分析和改进的k-均值聚类算法的故障识别方法。对离心式风机运行中产生的几种非稳态振动故障信号,提取其时域信号的峰峰值、Hurst指数和近似熵参数作为特征向量,采用改进的k... 针对风机振动信号的非平稳和非线性特征,提出了一种基于时域信号分析和改进的k-均值聚类算法的故障识别方法。对离心式风机运行中产生的几种非稳态振动故障信号,提取其时域信号的峰峰值、Hurst指数和近似熵参数作为特征向量,采用改进的k-均值聚类算法作为故障分类器,设置转子不平衡、联轴器不对中、风机基座松动、转轴径向摩擦和轴承内圈损坏5种故障。对离心式风机试验的结果表明,3种时域特征能较好地反映各故障之间的差异,改进的k-均值聚类算法与原始的k-均值算法相比分类性能更好,稳定性更强,平均识别率达到88.67%。 展开更多
关键词 故障诊断 离心式风机 时域特征 改进k-均值算法
下载PDF
基于半监督学习的K-均值聚类算法研究 被引量:12
17
作者 刘涛 尹红健 《计算机应用研究》 CSCD 北大核心 2010年第3期913-916,共4页
定义了一个欧氏距离和监督信息相混合的新的最近邻计算函数,从而将K-均值算法很好地应用于半监督聚类问题。针对K-均值算法初始质心敏感的缺陷,用粒子群算法的搜索空间模拟聚类的欧氏空间,迭代搜索找到较优的聚类质心,同时提出动态管理... 定义了一个欧氏距离和监督信息相混合的新的最近邻计算函数,从而将K-均值算法很好地应用于半监督聚类问题。针对K-均值算法初始质心敏感的缺陷,用粒子群算法的搜索空间模拟聚类的欧氏空间,迭代搜索找到较优的聚类质心,同时提出动态管理种群的策略以提高粒子群算法搜索效率。算法在UCI的多个数据集上测试都得到了较好的聚类准确率。 展开更多
关键词 半监督 改进的k-均值算法 动态管理种群的粒子群算法
下载PDF
数据挖掘中K-均值聚类算法的缺陷及工作效率改进的实验研究 被引量:6
18
作者 陈晓勇 顾晖 彭志娟 《科学技术与工程》 北大核心 2013年第34期10359-10363,10368,共6页
K-均值聚类算法在当前提取数据挖掘的聚类分析方法中已经取得了一定的成就,为了进一步改进其在数据预处理及神经网络结构中的应用,文中对算法进行了缺陷研究,主要做了以下几个方面的工作:对K-均值算法进行了思路及算法主要流程分析;得... K-均值聚类算法在当前提取数据挖掘的聚类分析方法中已经取得了一定的成就,为了进一步改进其在数据预处理及神经网络结构中的应用,文中对算法进行了缺陷研究,主要做了以下几个方面的工作:对K-均值算法进行了思路及算法主要流程分析;得出K-均值聚类算法存在简单、迅速、结果簇密集、簇与簇之间区别较为明显等优点;分析得出算法存在与处理符号属性的数据不太适应、必须事先给出k值(想要生成的簇的个数)、对"噪声数据"以及孤立的点数据有较大影响、需要不断计算更新调整后的新聚类中心等缺点。在实验验证中结果得出:聚类结果可知,选取不同的值初始值对聚类结果的影响很小;如果聚类数据集迭代次数较多时,可以尝试着改变其数据的输入顺序;变动数据集的输入顺序,会直接影响聚类结果。实验结果对于K-均值算法的工作效率提高了,具有明显的参考价值,这一研究对于数据挖掘技术的改进具有一定的意义。 展开更多
关键词 k-均值 算法 噪声数据 迭代 工作效率
下载PDF
K-均值算法聚类分析及其在人力资源管理中的应用 被引量:5
19
作者 刘艳丽 刘希玉 +1 位作者 孟岩 祖伟 《山东科学》 CAS 2008年第2期33-38,共6页
本文提出了一种改进的K-均值聚类算法,在基本K-均值算法的基础上运用基于密度选择初始中心点并且通过学习特征权值改进聚类效果,克服了基本K-均值算法初始中心点难以确定、聚类结果不稳定的缺点;然后建立了一种基于改进的K-均值算法的... 本文提出了一种改进的K-均值聚类算法,在基本K-均值算法的基础上运用基于密度选择初始中心点并且通过学习特征权值改进聚类效果,克服了基本K-均值算法初始中心点难以确定、聚类结果不稳定的缺点;然后建立了一种基于改进的K-均值算法的人事管理系统聚类分析模型,本模型采用SQL Server 2000数据库实现并成功运用于国内一家知名软件企业的人力资源管理系统中,为该企业选聘人才和用好人才提供了有益的参考。 展开更多
关键词 k-均值算法 密度 中心 特征权值 人力资源管理
下载PDF
基于遗传算法的一种改进的K-均值聚类算法 被引量:5
20
作者 张春凯 王丽君 《计算机工程与应用》 CSCD 2012年第26期144-147,共4页
传统K-均值算法对初始聚类中心敏感大,易陷入局部最优值。将遗传算法与K均值算法结合起来进行探讨并提出一种改进的基于K-均值聚类算法的遗传算法,改进后的算法是基于可变长度的聚类中心的实际数目来实现的。同时分别设计出新的交叉算... 传统K-均值算法对初始聚类中心敏感大,易陷入局部最优值。将遗传算法与K均值算法结合起来进行探讨并提出一种改进的基于K-均值聚类算法的遗传算法,改进后的算法是基于可变长度的聚类中心的实际数目来实现的。同时分别设计出新的交叉算子和变异算子,并且使用的聚类有效性指标DB-Index作为目标函数,该算法很好地解决了聚类中心优化问题,与之前的两种算法相比,改进后的算法改善了聚类的质量,提高了全局的收敛速度。 展开更多
关键词 遗传算法 数据挖掘 k-均值 DB-Index
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部