期刊文献+
共找到367篇文章
< 1 2 19 >
每页显示 20 50 100
基于空间约束K⁃means模型的长三角地区生态系统服务时空格局及功能分区研究
1
作者 汪勇政 余浩然 陆林 《生态学报》 CAS CSCD 北大核心 2024年第16期7087-7104,共18页
科学认知生态服务功能的时空演变规律以及合理划分生态系统服务簇的空间分类对于生态系统管理和政策制定至关重要。旨在揭示长三角城市群2000—2020年间生物多样性维护、产水量、碳储存、土壤保持、植被净初级生产力、粮食产量的时空演... 科学认知生态服务功能的时空演变规律以及合理划分生态系统服务簇的空间分类对于生态系统管理和政策制定至关重要。旨在揭示长三角城市群2000—2020年间生物多样性维护、产水量、碳储存、土壤保持、植被净初级生产力、粮食产量的时空演变特征、权衡关系,并利用空间约束K⁃means模型(SC K⁃means)聚类识别生态系统服务簇,划分生态系统服务功能管理区。研究结果表明:(1)生物多样性维护、产水量、碳储存、土壤保持、植被净初级生产力整体呈“西南山地高,东北平原低”空间格局,粮食产量与之相反;(2)六类生态系统服务空间变化差异体现出明显人类活动与自然气候主导,且粮食产量与其他生态系统服务表现为权衡关系;(3)基于SC K⁃means识别生态系统服务簇的结果将研究区划分为为粮食主产区、人类活动密集区、皖浙生态保护区、大别山生态保护区、皖江生态过渡带、长三角核心保护区六类生态功能区,针对各分区提出差异化生态管控建议。研究可为国土空间规划分区引导提供理论依据与实践参考。 展开更多
关键词 生态系统服务 权衡关系 时空特征 生态系统服务簇 空间约束kmeans模型(SC kmeans)
下载PDF
基于Tukey规则与初始中心点优化的K⁃means聚类改进算法 被引量:2
2
作者 柳菁 邱紫滢 +1 位作者 郭茂祖 余冬华 《数据采集与处理》 CSCD 北大核心 2023年第3期643-651,共9页
针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,... 针对K⁃means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K⁃means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,在核心子集上执行中心点逐个递增优化选择策略,选出初始中心点。在来自UCI的20个数据集上聚类结果表明,本文提出的算法优于K⁃means++聚类算法,有效地提升了聚类性能。 展开更多
关键词 数据挖掘 kmeans聚类算法 Tukey规则 中心点优化
下载PDF
面向大型数据集的局部敏感哈希K−means算法 被引量:2
3
作者 魏峰 马龙 《工矿自动化》 CSCD 北大核心 2023年第3期53-62,共10页
大型数据集高效处理策略是煤矿安全监测智能化、采掘智能化等煤矿智能化建设的关键支撑。针对K−means算法面对大型数据集时聚类高效性及准确性不足的问题,提出了一种基于局部敏感哈希(LSH)的高效K−means聚类算法。基于LSH对抽样过程进... 大型数据集高效处理策略是煤矿安全监测智能化、采掘智能化等煤矿智能化建设的关键支撑。针对K−means算法面对大型数据集时聚类高效性及准确性不足的问题,提出了一种基于局部敏感哈希(LSH)的高效K−means聚类算法。基于LSH对抽样过程进行优化,提出了数据组构建算法LSH−G,将大型数据集合理划分为子数据组,并对数据集中的噪声点进行有效删除;基于LSH−G算法优化密度偏差抽样(DBS)算法中的子数据组划分过程,提出了数据组抽样算法LSH−GD,使样本集能更真实地反映原始数据集的分布规律;在此基础上,通过K−means算法对生成的样本集进行聚类,实现较低时间复杂度情况下从大型数据集中高效挖掘有效数据。实验结果表明:由10个AND操作与8个OR操作组成的级联组合为最优级联组合,得到的类中心误差平方和(SSEC)最小;在人工数据集上,与基于多层随机抽样(M−SRS)的K−means算法、基于DBS的K−means算法及基于网格密度偏差抽样(G−DBS)的K−means算法相比,基于LSH−GD的K−means算法在聚类准确性方面的平均提升幅度分别为56.63%、54.59%及25.34%,在聚类高效性方面的平均提升幅度分别为27.26%、16.81%及7.07%;在UCI标准数据集上,基于LSH−GD的K−means聚类算法获得的SSEC与CPU消耗时间(CPU−C)均为最优。 展开更多
关键词 智慧矿山 大型数据集 kmeans聚类 局部敏感哈希 噪声点筛选 密度偏差抽样
下载PDF
基于K⁃means的个性化视频推荐方法研究
4
作者 吴珂彤 贾双英 李恒博 《现代计算机》 2023年第17期95-99,共5页
视频网站以吸引用户观看自己的视频为营销手段,有效推荐视频给用户,有利于提高用户粘性,成为各大视频网站竞争的手段。通过深入研究,提出一种视频推荐方法,它基于电影和用户之间的相似度,利用K⁃means聚类对数据进行深度挖掘分析,并结合... 视频网站以吸引用户观看自己的视频为营销手段,有效推荐视频给用户,有利于提高用户粘性,成为各大视频网站竞争的手段。通过深入研究,提出一种视频推荐方法,它基于电影和用户之间的相似度,利用K⁃means聚类对数据进行深度挖掘分析,并结合用户的个性化需求,实现更加精准的推荐。通过验证,证明了该方法的可行性。 展开更多
关键词 视频推荐 kmeans 个性化 聚类算法
下载PDF
基于最优划分的K-Means初始聚类中心选取算法 被引量:62
5
作者 张健沛 杨悦 +1 位作者 杨静 张泽宝 《系统仿真学报》 CAS CSCD 北大核心 2009年第9期2586-2590,共5页
针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自... 针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自身分布特点确定K-Means算法的初始聚类中心,无需预设k值,减少了算法结果对参数的依赖,提高算法运算效率及准确率。实验结果表明,利用该算法改进的K-Means算法,运算时间明显减少,其聚类结果准确率以及算法效率均得到显著提高。 展开更多
关键词 kmeans算法 初始聚类中心 直方图 最优划分方法
下载PDF
K-means算法初始聚类中心选择的优化 被引量:50
6
作者 冯波 郝文宁 +1 位作者 陈刚 占栋辉 《计算机工程与应用》 CSCD 2013年第14期182-185,192,共5页
针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得... 针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。 展开更多
关键词 kmeans算法 聚类 初始聚类中心 TDkM算法
下载PDF
一种K-means改进算法的并行化实现与应用 被引量:50
7
作者 李晓瑜 俞丽颖 +1 位作者 雷航 唐雪飞 《电子科技大学学报》 EI CAS CSCD 北大核心 2017年第1期61-68,共8页
随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因... 随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因初始中心点的不确定性,易陷入局部最优解的问题。本算法在Canopy(罩盖)中完成K-means聚类,并在Canopy间完成簇的合并,聚类效果稳定,迭代次数少。同时,结合MapReduce分布式计算模型,给出改进后算法的并行化设计方法和策略,进一步通过改进相似度度量方法,将该方法用于文本聚类中。实验结果证明该算法具有良好的准确率和扩展性。 展开更多
关键词 canopy算法 HADOOP MAPREDUCE 并行kmeans 文本聚类
下载PDF
初始化K-means的谱方法 被引量:32
8
作者 钱线 黄萱菁 吴立德 《自动化学报》 EI CSCD 北大核心 2007年第4期342-346,共5页
众所周知,K-means(以下简称KM)对初始点十分敏感.本文提出了一种新的初始化KM的方法,它先估计出k个类的特征中心的位置,然后用估计出的特征中心来初始化KM.在人工数据集和真实数据集上的实验表明,本文的方法所得到的结果要好于其他一... 众所周知,K-means(以下简称KM)对初始点十分敏感.本文提出了一种新的初始化KM的方法,它先估计出k个类的特征中心的位置,然后用估计出的特征中心来初始化KM.在人工数据集和真实数据集上的实验表明,本文的方法所得到的结果要好于其他一些初始化KM的方法. 展开更多
关键词 聚类 kmeans算法 特征中心
下载PDF
初始中心优化的K-Means聚类算法 被引量:47
9
作者 李飞 薛彬 黄亚楼 《计算机科学》 CSCD 北大核心 2002年第7期94-96,共3页
1.引言 聚类分析(clustering)是人工智能研究的重要领域.聚类方法被广泛研究并应用于机器学习、统计分析、模式识别以及数据库数据挖掘与知识发现等不同的领域.
关键词 遗传算法 随机全局优化搜索算法 kmeans聚类算法 初始聚类中心 优化
下载PDF
基于微博舆情监测的K-Means算法改进研究 被引量:17
10
作者 朱晓峰 陈楚楚 尹婵娟 《情报理论与实践》 CSSCI 北大核心 2014年第1期136-140,共5页
在分析传统K-Means算法局限性的基础上,提出了一种基于文本平均相似度的K-Means算法,通过对每个文本的平均相似度计算和排序,以文本平均相似度值为标准来选择初始聚类中心点。实验证明,改进后的算法,更适合微博文本的特点,聚类精度和聚... 在分析传统K-Means算法局限性的基础上,提出了一种基于文本平均相似度的K-Means算法,通过对每个文本的平均相似度计算和排序,以文本平均相似度值为标准来选择初始聚类中心点。实验证明,改进后的算法,更适合微博文本的特点,聚类精度和聚类稳定性均明显改善,微博舆情监测的质量大幅度提高。 展开更多
关键词 微博 网络舆情 kmeans算法
下载PDF
基于改进K-means聚类的在线新闻评论主题抽取 被引量:15
11
作者 夏火松 李保国 杨培 《情报学报》 CSSCI 北大核心 2016年第1期55-65,共11页
新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K-means聚类的主题挖掘算法应用到新闻评论中时,在欧氏距离下,如果使用最大距离法选初始点则会聚成一大类。为解决这个问题,论文首先... 新闻评论反映民众对新闻事件的观点,抽取评论主题,对用户、企业、政府都具有很高的情报分析价值。基于K-means聚类的主题挖掘算法应用到新闻评论中时,在欧氏距离下,如果使用最大距离法选初始点则会聚成一大类。为解决这个问题,论文首先在预处理阶段增加同义词替换和自动构建领域词典的部分,改善了数据稀疏性和高维性。其次,提出了K-means改进算法,用隐藏长评论-最大距离法选初始点,解决了初始点多为离群点的问题,用方差拐点确定K值,解决了预先设定聚类个数的问题,实验发现了先用BW权重选初始点,再用新提出的BW-DF权重聚类的效果最好。最后,将改进算法与原算法的聚类效果比较,实验结果表明,改进算法准确率高,抽取新闻评论主题的效果明显。 展开更多
关键词 在线新闻评论 kmeans聚类改进 主题抽取 同义词替换 分词领域词典
下载PDF
一种分层自适应快速K-means算法 被引量:7
12
作者 张晓琳 崔宁宁 +1 位作者 杨涛 李洁 《计算机应用研究》 CSCD 北大核心 2016年第2期421-423,427,共4页
提出一种分层自适应快速K-means(hierarchical adaptive fast K-means,HAFKM)算法对图像数据库分类聚簇。HAFKM根据提出的分层策略构建一棵非平衡聚类树,通过自适应的方法 CEC(cluster evaluation criterion)确定了除根节点外的每棵子... 提出一种分层自适应快速K-means(hierarchical adaptive fast K-means,HAFKM)算法对图像数据库分类聚簇。HAFKM根据提出的分层策略构建一棵非平衡聚类树,通过自适应的方法 CEC(cluster evaluation criterion)确定了除根节点外的每棵子树的分支数目,而在聚类树的每一层聚类中使用一种提出的判别函数(cost-function)在颜色直方图上根据颜色等级直接聚类,从而可以在整棵树上快速聚类。实验表明,HAFKM算法通过在非平衡树上逐层聚类,并且通过CEC准确判断聚类数目,可以快速、高效地实现数据库的分类聚簇。 展开更多
关键词 HAFkM kmeans算法 分层聚类 自适应 大数据库 聚类树
下载PDF
改进K-means算法的MapReduce并行化研究 被引量:7
13
作者 李兰英 董义明 +1 位作者 孔银 周秋丽 《哈尔滨理工大学学报》 CAS 北大核心 2016年第1期31-35,共5页
针对K-means在处理海量数据时,因初始聚类中心的选取不确定,从而导致收敛速度过慢的问题,本文提出了改进的K-means算法,首先用模糊聚类的思想对数据集进行模糊分类,其次采用动态计算聚类中心的方式对数据集进行二次分类,最后将算法在Map... 针对K-means在处理海量数据时,因初始聚类中心的选取不确定,从而导致收敛速度过慢的问题,本文提出了改进的K-means算法,首先用模糊聚类的思想对数据集进行模糊分类,其次采用动态计算聚类中心的方式对数据集进行二次分类,最后将算法在MapReduce模型上进行了实现.实验结果表明,改进后的算法不仅提高了加速比,而且算法的收敛速度更快. 展开更多
关键词 聚类 MAPREDUCE kmeans 加速比
下载PDF
基于小波变换和K-means的非结构化道路检测 被引量:11
14
作者 熊思 李磊民 黄玉清 《计算机工程》 CAS CSCD 2014年第2期158-161,共4页
道路检测是智能交通视觉系统的一个重要组成部分,为提高复杂环境下非结构化道路检测的实时性、准确性和鲁棒性,提出一种新的道路检测方法。该方法利用高斯金字塔对图像进行降采样,压缩图像数据信息,对图像进行双边滤波,抑制噪声,采用基... 道路检测是智能交通视觉系统的一个重要组成部分,为提高复杂环境下非结构化道路检测的实时性、准确性和鲁棒性,提出一种新的道路检测方法。该方法利用高斯金字塔对图像进行降采样,压缩图像数据信息,对图像进行双边滤波,抑制噪声,采用基于小波变换求模极大值的方法对滤波后的图像提取边缘,通过阈值法去除非道路边缘点,给出基于斜率和截距的K-means聚类算法,实现道路方程拟合。实验结果表明,与传统最小二乘法相比,该方法能在道路场景较为复杂的情况下更准确地实现非结构化道路检测,并提高实时性。 展开更多
关键词 道路检测 高斯金字塔 双边滤波 小波变换 模极大值 kmeans聚类
下载PDF
K-means聚类算法的研究 被引量:46
15
作者 韩晓红 胡彧 《太原理工大学学报》 CAS 北大核心 2009年第3期236-239,共4页
为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初... 为解决原始K-means算法随机选取初始聚类中心对聚类结果的影响较大的不足,提出了改进算法。采取基于采样选取聚类中心距离的规则,进行多次选择决定最终的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响达到最小;同时,在选取初始聚类中心后,对初值进行数据标准化处理。将改进的K-means算法应用于销售行业,结果显示,改进后的算法比原始的算法在效率上得到了提高。 展开更多
关键词 数据挖掘 kmeans算法 初始聚类中心 聚类分析
下载PDF
基于学术文献同被引分析的K-means算法改进研究 被引量:4
16
作者 吴夙慧 成颖 +1 位作者 郑彦宁 潘云涛 《情报学报》 CSSCI 北大核心 2012年第1期82-94,共13页
K—means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题。本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K—means改进算法。该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被... K—means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题。本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K—means改进算法。该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被引矩阵,然后基于同被引矩阵进行层次聚类。算法记录每次迭代过程中被聚为一类的学术文献间的距离以及两次迭代间的距离差,当两次迭代的距离差取得最大值时取其聚类数作为第二步K-means算法的K值,并且将此时的类中心作为第二步K—means算法的初始聚类中心。第二步聚类则依据文献内容实现K-means算法。实验通过与经典K—means算法和基于凝聚层次聚类算法的改进K—means算法的对比,证明了本文提出的改进的K—means算法具备更优的聚类效果。 展开更多
关键词 kmeans算法 k 初始聚类中心 同被引 文献聚类
下载PDF
改进的k-means聚类算法在客户细分中的应用研究 被引量:8
17
作者 杜巍 赵春荣 黄伟建 《河北经贸大学学报》 CSSCI 北大核心 2014年第1期118-121,共4页
聚类分析是数据挖掘的一种重要方法,将它应用在客户细分中,可以识别出不同的客户群,从而针对不同的客户群制定相应的营销政策,使企业效益最大化。针对聚类分析中k-means算法的不足,运用改进的聚类算法对旅游业客户进行细分,从而使企业... 聚类分析是数据挖掘的一种重要方法,将它应用在客户细分中,可以识别出不同的客户群,从而针对不同的客户群制定相应的营销政策,使企业效益最大化。针对聚类分析中k-means算法的不足,运用改进的聚类算法对旅游业客户进行细分,从而使企业能够更合理地细分、规划客户群组,针对不同需求的客户群体进行区别对待,得到了较好的效果,验证了改进算法的可行性和高效性。 展开更多
关键词 聚类分析 客户细分 数据挖掘 改进的kmeans算法 客户群
下载PDF
一种基于蚁群算法的K-means算法——在公路运输枢纽宏观布局规划中的应用 被引量:8
18
作者 孟岩 刘希玉 刘艳丽 《计算机工程与应用》 CSCD 北大核心 2008年第1期179-182,共4页
公路运输的发展有效促进了我国经济持续、快速的发展,但公路建设和运输枢纽建设呈现出不平衡性。因此需采用聚类分析对公路主枢纽城市进行聚类,划分层次来进行功能分析。K-means算法是聚类分析中使用最为广泛的算法之一,但算法具有初始... 公路运输的发展有效促进了我国经济持续、快速的发展,但公路建设和运输枢纽建设呈现出不平衡性。因此需采用聚类分析对公路主枢纽城市进行聚类,划分层次来进行功能分析。K-means算法是聚类分析中使用最为广泛的算法之一,但算法具有初始中心点和聚类个数不确定等方面的缺点。针对其缺点,提出将基于蚁群算法的K-means算法应用于在公路运输枢纽布局规划中。实验结果表明,与单独使用两种算法相比,该算法更能有效地解决公路主枢纽城市的聚类问题。 展开更多
关键词 kmeans算法 蚁群聚类算法 公路运输 主枢纽城市
下载PDF
K-means聚类与SVDD结合的新的分类算法 被引量:7
19
作者 刘艳红 薛安荣 史习云 《计算机应用研究》 CSCD 北大核心 2010年第3期883-886,共4页
为了提高支持向量数据描述(SVDD)的分类精度,引入局部疏密度提出了改进的SVDD算法。该算法提高了分类精度,但增加了计算复杂度。为此,先用K-means聚类将整个数据集划分为k个簇,再用改进的SVDD算法并行训练k个簇,最后再对获得的k个局部... 为了提高支持向量数据描述(SVDD)的分类精度,引入局部疏密度提出了改进的SVDD算法。该算法提高了分类精度,但增加了计算复杂度。为此,先用K-means聚类将整个数据集划分为k个簇,再用改进的SVDD算法并行训练k个簇,最后再对获得的k个局部支持向量集训练,即得到最终的全局决策边界。由于采用了分而治之并行计算的方法,提高了算法的效率。对合成数据(200个)和实际数据的实验结果表明,所提算法较SVDD算法,训练时间降低为原来的10%,分类错误率较原来的降低了近一半。因此,所提算法提高了分类精度和算法效率。 展开更多
关键词 单值分类 支持向量数据描述 kmeans聚类 局部疏密度
下载PDF
基于密度的K-Means算法及在客户细分中的应用研究 被引量:11
20
作者 向坚持 刘相滨 资武成 《计算机工程与应用》 CSCD 北大核心 2008年第35期246-248,共3页
针对K-Means算法所存在的问题进行了深入研究,提出了基于密度的K-Means算法(KMAD算法)。该算法采用聚类对象区域空间的密度分布方法来确定聚类个数K的值,然后用高密度区域的质心作为K-Means算法的初始聚类中心。理论分析与实验结果表明... 针对K-Means算法所存在的问题进行了深入研究,提出了基于密度的K-Means算法(KMAD算法)。该算法采用聚类对象区域空间的密度分布方法来确定聚类个数K的值,然后用高密度区域的质心作为K-Means算法的初始聚类中心。理论分析与实验结果表明了改进算法的有效性和稳定性,并将改进的算法应用于客户细分研究中。 展开更多
关键词 kmeans算法 kMAD算法 密度 客户细分
下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部