期刊文献+
共找到302篇文章
< 1 2 16 >
每页显示 20 50 100
基于K—means算法的电子政务用户细分模型研究 被引量:2
1
作者 张向宏 唐冉 《商场现代化》 2009年第5期372-374,共3页
在系统阐释电子政务发展阶段的基础上,将CRM及其客户细分理念引入电子政务领域,构建用户细分模型,并进行实证分析,结果表明,细分结果能够为个性化服务的实现创造条件。
关键词 电子政务 CRM 客户细分 k—means算法
下载PDF
K—means聚类算法分析应用研究 被引量:2
2
作者 李曼 赵松林 《魅力中国》 2011年第7期243-243,共1页
本文浅谈了数字图像处理的发展概况、研究背景并对彩色图像K—means算法进行分析.主要详细谈论了是对K-means算法的一些认识,并且介绍K-means聚类的算法思想、工作原理、聚类算法流程、以及对算法结果进行分析,得出其特点及实际使用... 本文浅谈了数字图像处理的发展概况、研究背景并对彩色图像K—means算法进行分析.主要详细谈论了是对K-means算法的一些认识,并且介绍K-means聚类的算法思想、工作原理、聚类算法流程、以及对算法结果进行分析,得出其特点及实际使用情况. 展开更多
关键词 数字图像处理 k—means算法 聚类
下载PDF
一种基于距离-期望密度参数的K—means算法
3
作者 郑丹 王名扬 陈广胜 《山东师范大学学报(自然科学版)》 CAS 2015年第4期55-58,63,共5页
针对K-均值聚类算法随机生成初始聚类中心使得算法容易陷入局部最优的局限性,笔者在综合考虑数据集中数据对象之间的相似性和数据对象密度分布特性的基础上,提出了一种基于距离-期望密度参数K-均值初始聚类中心优化方法.该方法将k个... 针对K-均值聚类算法随机生成初始聚类中心使得算法容易陷入局部最优的局限性,笔者在综合考虑数据集中数据对象之间的相似性和数据对象密度分布特性的基础上,提出了一种基于距离-期望密度参数K-均值初始聚类中心优化方法.该方法将k个相互距离最远并且能够代表样本对象分布的数据对象作为初始的聚类中心,从而使聚类结果更接近于全局最优解.在UCI数据集上对改进算法进行的仿真实验表明,该方法的聚类结果稳定性和准确率均得到了优化. 展开更多
关键词 聚类 k—means 初始聚类中心 密度分布 期望密度参数
下载PDF
一种改进的K—means算法在入侵检测中的应用 被引量:3
4
作者 王彦涛 张凤斌 《电脑知识与技术》 2009年第12期9824-9827,共4页
传统的聚类算法存在很多缺点,因此需要做进一步的研究。通过对传统的K-means算法和加权熵措施的K—means算法的研究,提出了一种改进的加权熵措施的K—means算法,且该算法采用了一种新的计算对象间距离的方法,不仅能使在同一个簇中... 传统的聚类算法存在很多缺点,因此需要做进一步的研究。通过对传统的K-means算法和加权熵措施的K—means算法的研究,提出了一种改进的加权熵措施的K—means算法,且该算法采用了一种新的计算对象间距离的方法,不仅能使在同一个簇中任意对象之间的距离尽可能的小,更能使得不同簇中的任意对象之间的距离尽可能的大。通过在KDD Cup99数据集上实验仿真,表明该算法具有较强的实用性和自适应功能。 展开更多
关键词 网络安全 数据挖掘 入侵检测 加权熵 k—means算法
下载PDF
遗传模拟退火算法在k—means聚类中的应用 被引量:1
5
作者 张济强 高玉良 《电脑知识与技术》 2012年第3期1611-1613,1617,共4页
针对传统的k-means算法执行的结果过度依赖与初始聚类中心的选择,容易陷入局部最优解,全局搜索能力不强等缺点,该文提出将遗传算法(GA)与模拟退火算法(SA)相结合的混合遗传算法,此方法比传统的遗传算法具有更好的全局收敛性,... 针对传统的k-means算法执行的结果过度依赖与初始聚类中心的选择,容易陷入局部最优解,全局搜索能力不强等缺点,该文提出将遗传算法(GA)与模拟退火算法(SA)相结合的混合遗传算法,此方法比传统的遗传算法具有更好的全局收敛性,避免了早熟的问题。将此算法应用到k-means聚类领域中,可以有效的克服k-means算法的缺陷,同时优化聚类的结果。实验表明该方法是一种高效精确的聚类方法。 展开更多
关键词 k—means算法 聚类 遗传模拟退火算法 混合遗传算法
下载PDF
基于最优划分的K-Means初始聚类中心选取算法 被引量:62
6
作者 张健沛 杨悦 +1 位作者 杨静 张泽宝 《系统仿真学报》 CAS CSCD 北大核心 2009年第9期2586-2590,共5页
针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自... 针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自身分布特点确定K-Means算法的初始聚类中心,无需预设k值,减少了算法结果对参数的依赖,提高算法运算效率及准确率。实验结果表明,利用该算法改进的K-Means算法,运算时间明显减少,其聚类结果准确率以及算法效率均得到显著提高。 展开更多
关键词 k—means算法 初始聚类中心 直方图 最优划分方法
下载PDF
K-means算法初始聚类中心选择的优化 被引量:50
7
作者 冯波 郝文宁 +1 位作者 陈刚 占栋辉 《计算机工程与应用》 CSCD 2013年第14期182-185,192,共5页
针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得... 针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。 展开更多
关键词 k—means算法 聚类 初始聚类中心 TDkM算法
下载PDF
一种K-means改进算法的并行化实现与应用 被引量:50
8
作者 李晓瑜 俞丽颖 +1 位作者 雷航 唐雪飞 《电子科技大学学报》 EI CAS CSCD 北大核心 2017年第1期61-68,共8页
随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因... 随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因初始中心点的不确定性,易陷入局部最优解的问题。本算法在Canopy(罩盖)中完成K-means聚类,并在Canopy间完成簇的合并,聚类效果稳定,迭代次数少。同时,结合MapReduce分布式计算模型,给出改进后算法的并行化设计方法和策略,进一步通过改进相似度度量方法,将该方法用于文本聚类中。实验结果证明该算法具有良好的准确率和扩展性。 展开更多
关键词 canopy算法 HADOOP MAPREDUCE 并行k—means 文本聚类
下载PDF
初始中心优化的K-Means聚类算法 被引量:47
9
作者 李飞 薛彬 黄亚楼 《计算机科学》 CSCD 北大核心 2002年第7期94-96,共3页
1.引言 聚类分析(clustering)是人工智能研究的重要领域.聚类方法被广泛研究并应用于机器学习、统计分析、模式识别以及数据库数据挖掘与知识发现等不同的领域.
关键词 遗传算法 随机全局优化搜索算法 k—means聚类算法 初始聚类中心 优化
下载PDF
初始化K-means的谱方法 被引量:32
10
作者 钱线 黄萱菁 吴立德 《自动化学报》 EI CSCD 北大核心 2007年第4期342-346,共5页
众所周知,K-means(以下简称KM)对初始点十分敏感.本文提出了一种新的初始化KM的方法,它先估计出k个类的特征中心的位置,然后用估计出的特征中心来初始化KM.在人工数据集和真实数据集上的实验表明,本文的方法所得到的结果要好于其他一... 众所周知,K-means(以下简称KM)对初始点十分敏感.本文提出了一种新的初始化KM的方法,它先估计出k个类的特征中心的位置,然后用估计出的特征中心来初始化KM.在人工数据集和真实数据集上的实验表明,本文的方法所得到的结果要好于其他一些初始化KM的方法. 展开更多
关键词 聚类 k—means算法 特征中心
下载PDF
基于改进K-means聚类的在线新闻评论主题抽取 被引量:15
11
作者 夏火松 李保国 杨培 《情报学报》 CSSCI 北大核心 2016年第1期55-65,共11页
新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K-means聚类的主题挖掘算法应用到新闻评论中时,在欧氏距离下,如果使用最大距离法选初始点则会聚成一大类。为解决这个问题,论文首先... 新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K-means聚类的主题挖掘算法应用到新闻评论中时,在欧氏距离下,如果使用最大距离法选初始点则会聚成一大类。为解决这个问题,论文首先在预处理阶段增加同义词替换和自动构建领域词典的部分,改善了数据稀疏性和高维性。其次,提出了K-means改进算法,用隐藏长评论-最大距离法选初始点,解决了初始点多为离群点的问题,用方差拐点确定K值,解决了预先设定聚类个数的问题,实验发现了先用BW权重选初始点,再用新提出的BW-DF权重聚类的效果最好。最后,将改进算法与原算法的聚类效果比较,实验结果表明,改进算法准确率高,抽取新闻评论主题的效果明显。 展开更多
关键词 在线新闻评论 k—means聚类改进 主题抽取 同义词替换 分词领域词典
下载PDF
一种分层自适应快速K-means算法 被引量:7
12
作者 张晓琳 崔宁宁 +1 位作者 杨涛 李洁 《计算机应用研究》 CSCD 北大核心 2016年第2期421-423,427,共4页
提出一种分层自适应快速K-means(hierarchical adaptive fast K-means,HAFKM)算法对图像数据库分类聚簇。HAFKM根据提出的分层策略构建一棵非平衡聚类树,通过自适应的方法 CEC(cluster evaluation criterion)确定了除根节点外的每棵子... 提出一种分层自适应快速K-means(hierarchical adaptive fast K-means,HAFKM)算法对图像数据库分类聚簇。HAFKM根据提出的分层策略构建一棵非平衡聚类树,通过自适应的方法 CEC(cluster evaluation criterion)确定了除根节点外的每棵子树的分支数目,而在聚类树的每一层聚类中使用一种提出的判别函数(cost-function)在颜色直方图上根据颜色等级直接聚类,从而可以在整棵树上快速聚类。实验表明,HAFKM算法通过在非平衡树上逐层聚类,并且通过CEC准确判断聚类数目,可以快速、高效地实现数据库的分类聚簇。 展开更多
关键词 HAFkM k—means算法 分层聚类 自适应 大数据库 聚类树
下载PDF
基于微博舆情监测的K-Means算法改进研究 被引量:17
13
作者 朱晓峰 陈楚楚 尹婵娟 《情报理论与实践》 CSSCI 北大核心 2014年第1期136-140,共5页
在分析传统K-Means算法局限性的基础上,提出了一种基于文本平均相似度的K-Means算法,通过对每个文本的平均相似度计算和排序,以文本平均相似度值为标准来选择初始聚类中心点。实验证明,改进后的算法,更适合微博文本的特点,聚类精度和聚... 在分析传统K-Means算法局限性的基础上,提出了一种基于文本平均相似度的K-Means算法,通过对每个文本的平均相似度计算和排序,以文本平均相似度值为标准来选择初始聚类中心点。实验证明,改进后的算法,更适合微博文本的特点,聚类精度和聚类稳定性均明显改善,微博舆情监测的质量大幅度提高。 展开更多
关键词 微博 网络舆情 k—means算法
下载PDF
基于小波变换和K-means的非结构化道路检测 被引量:11
14
作者 熊思 李磊民 黄玉清 《计算机工程》 CAS CSCD 2014年第2期158-161,共4页
道路检测是智能交通视觉系统的一个重要组成部分,为提高复杂环境下非结构化道路检测的实时性、准确性和鲁棒性,提出一种新的道路检测方法。该方法利用高斯金字塔对图像进行降采样,压缩图像数据信息,对图像进行双边滤波,抑制噪声,采用基... 道路检测是智能交通视觉系统的一个重要组成部分,为提高复杂环境下非结构化道路检测的实时性、准确性和鲁棒性,提出一种新的道路检测方法。该方法利用高斯金字塔对图像进行降采样,压缩图像数据信息,对图像进行双边滤波,抑制噪声,采用基于小波变换求模极大值的方法对滤波后的图像提取边缘,通过阈值法去除非道路边缘点,给出基于斜率和截距的K-means聚类算法,实现道路方程拟合。实验结果表明,与传统最小二乘法相比,该方法能在道路场景较为复杂的情况下更准确地实现非结构化道路检测,并提高实时性。 展开更多
关键词 道路检测 高斯金字塔 双边滤波 小波变换 模极大值 k—means聚类
下载PDF
改进K-means算法的MapReduce并行化研究 被引量:7
15
作者 李兰英 董义明 +1 位作者 孔银 周秋丽 《哈尔滨理工大学学报》 CAS 北大核心 2016年第1期31-35,共5页
针对K-means在处理海量数据时,因初始聚类中心的选取不确定,从而导致收敛速度过慢的问题,本文提出了改进的K-means算法,首先用模糊聚类的思想对数据集进行模糊分类,其次采用动态计算聚类中心的方式对数据集进行二次分类,最后将算法在Map... 针对K-means在处理海量数据时,因初始聚类中心的选取不确定,从而导致收敛速度过慢的问题,本文提出了改进的K-means算法,首先用模糊聚类的思想对数据集进行模糊分类,其次采用动态计算聚类中心的方式对数据集进行二次分类,最后将算法在MapReduce模型上进行了实现.实验结果表明,改进后的算法不仅提高了加速比,而且算法的收敛速度更快. 展开更多
关键词 聚类 MAPREDUCE k—means 加速比
下载PDF
基于学术文献同被引分析的K-means算法改进研究 被引量:4
16
作者 吴夙慧 成颖 +1 位作者 郑彦宁 潘云涛 《情报学报》 CSSCI 北大核心 2012年第1期82-94,共13页
K—means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题。本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K—means改进算法。该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被... K—means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题。本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K—means改进算法。该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被引矩阵,然后基于同被引矩阵进行层次聚类。算法记录每次迭代过程中被聚为一类的学术文献间的距离以及两次迭代间的距离差,当两次迭代的距离差取得最大值时取其聚类数作为第二步K-means算法的K值,并且将此时的类中心作为第二步K—means算法的初始聚类中心。第二步聚类则依据文献内容实现K-means算法。实验通过与经典K—means算法和基于凝聚层次聚类算法的改进K—means算法的对比,证明了本文提出的改进的K—means算法具备更优的聚类效果。 展开更多
关键词 k—means算法 k 初始聚类中心 同被引 文献聚类
下载PDF
改进的k-means聚类算法在客户细分中的应用研究 被引量:8
17
作者 杜巍 赵春荣 黄伟建 《河北经贸大学学报》 CSSCI 北大核心 2014年第1期118-121,共4页
聚类分析是数据挖掘的一种重要方法,将它应用在客户细分中,可以识别出不同的客户群,从而针对不同的客户群制定相应的营销政策,使企业效益最大化。针对聚类分析中k-means算法的不足,运用改进的聚类算法对旅游业客户进行细分,从而使企业... 聚类分析是数据挖掘的一种重要方法,将它应用在客户细分中,可以识别出不同的客户群,从而针对不同的客户群制定相应的营销政策,使企业效益最大化。针对聚类分析中k-means算法的不足,运用改进的聚类算法对旅游业客户进行细分,从而使企业能够更合理地细分、规划客户群组,针对不同需求的客户群体进行区别对待,得到了较好的效果,验证了改进算法的可行性和高效性。 展开更多
关键词 聚类分析 客户细分 数据挖掘 改进的k—means算法 客户群
下载PDF
一种基于蚁群算法的K-means算法——在公路运输枢纽宏观布局规划中的应用 被引量:8
18
作者 孟岩 刘希玉 刘艳丽 《计算机工程与应用》 CSCD 北大核心 2008年第1期179-182,共4页
公路运输的发展有效促进了我国经济持续、快速的发展,但公路建设和运输枢纽建设呈现出不平衡性。因此需采用聚类分析对公路主枢纽城市进行聚类,划分层次来进行功能分析。K-means算法是聚类分析中使用最为广泛的算法之一,但算法具有初始... 公路运输的发展有效促进了我国经济持续、快速的发展,但公路建设和运输枢纽建设呈现出不平衡性。因此需采用聚类分析对公路主枢纽城市进行聚类,划分层次来进行功能分析。K-means算法是聚类分析中使用最为广泛的算法之一,但算法具有初始中心点和聚类个数不确定等方面的缺点。针对其缺点,提出将基于蚁群算法的K-means算法应用于在公路运输枢纽布局规划中。实验结果表明,与单独使用两种算法相比,该算法更能有效地解决公路主枢纽城市的聚类问题。 展开更多
关键词 k—means算法 蚁群聚类算法 公路运输 主枢纽城市
下载PDF
K-means聚类与SVDD结合的新的分类算法 被引量:7
19
作者 刘艳红 薛安荣 史习云 《计算机应用研究》 CSCD 北大核心 2010年第3期883-886,共4页
为了提高支持向量数据描述(SVDD)的分类精度,引入局部疏密度提出了改进的SVDD算法。该算法提高了分类精度,但增加了计算复杂度。为此,先用K-means聚类将整个数据集划分为k个簇,再用改进的SVDD算法并行训练k个簇,最后再对获得的k个局部... 为了提高支持向量数据描述(SVDD)的分类精度,引入局部疏密度提出了改进的SVDD算法。该算法提高了分类精度,但增加了计算复杂度。为此,先用K-means聚类将整个数据集划分为k个簇,再用改进的SVDD算法并行训练k个簇,最后再对获得的k个局部支持向量集训练,即得到最终的全局决策边界。由于采用了分而治之并行计算的方法,提高了算法的效率。对合成数据(200个)和实际数据的实验结果表明,所提算法较SVDD算法,训练时间降低为原来的10%,分类错误率较原来的降低了近一半。因此,所提算法提高了分类精度和算法效率。 展开更多
关键词 单值分类 支持向量数据描述 k—means聚类 局部疏密度
下载PDF
K-means聚类算法的研究 被引量:46
20
作者 韩晓红 胡彧 《太原理工大学学报》 CAS 北大核心 2009年第3期236-239,共4页
为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初... 为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初始聚类中心后,对初值进行数据标准化处理。将改进的K-means算法应用于销售行业,结果显示,改进后的算法比原始的算法在效率上得到了提高。 展开更多
关键词 数据挖掘 k—means算法 初始聚类中心 聚类分析
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部