期刊文献+
共找到774篇文章
< 1 2 39 >
每页显示 20 50 100
一种修正评分偏差并精细聚类中心的协同过滤推荐算法 被引量:1
1
作者 马鑫 段刚龙 《统计与决策》 CSSCI 北大核心 2024年第4期23-27,共5页
协同过滤作为国内外学者普遍关注的推荐算法之一,受评分失真、数据稀疏等问题影响,算法推荐效果不尽如人意。为解决上述问题,文章提出了一种改进的聚类协同过滤推荐算法。首先,该算法利用无监督情感挖掘技术将评论情感映射为一个固定区... 协同过滤作为国内外学者普遍关注的推荐算法之一,受评分失真、数据稀疏等问题影响,算法推荐效果不尽如人意。为解决上述问题,文章提出了一种改进的聚类协同过滤推荐算法。首先,该算法利用无监督情感挖掘技术将评论情感映射为一个固定区间中的值,通过加权修正用户评分偏差;然后,构建修正后用户-产品评分矩阵的数据场,利用启发式寻优算法计算最佳聚类数和最优初始聚类中心,进而对用户进行划分聚类,结合最近邻用户相似性与评分产生推荐结果;最后,基于三个自建真实数据集对所提算法性能和有效性进行全面评估。实验结果表明,改进算法在精度Precision、召回率Recall和F1-Score评价指标上的表现均优于其他算法,能够有效应对数据稀疏的问题,提升推荐系统的推荐效果。 展开更多
关键词 评分偏差 随机初始聚类中心 协同过滤 评论情感挖掘 数据场
下载PDF
基于聚类中心的浅层特征融合伪造语音检测
2
作者 吴敦志 陈为真 《计算机工程与设计》 北大核心 2024年第10期2922-2928,共7页
针对现有检测系统在使用wav2vec2.0模型提取特征导致高计算资源消耗和传统打分方法限制泛化性能的问题,提出一种基于聚类中心的浅层特征融合伪造语音检测算法。裁剪wav2vec2.0模型的深层,将浅层特征通过注意力池化以缩短时序长度,用线... 针对现有检测系统在使用wav2vec2.0模型提取特征导致高计算资源消耗和传统打分方法限制泛化性能的问题,提出一种基于聚类中心的浅层特征融合伪造语音检测算法。裁剪wav2vec2.0模型的深层,将浅层特征通过注意力池化以缩短时序长度,用线性层确定融合权重;通过K-means++得到聚类中心,利用当前样本和相应类中心的表示余弦相似度进行训练和打分以判别真伪。实验采用ASVspoof2019和ASVspoof2021挑战赛的逻辑轨道数据集,wav2vec2.0模型参数量减少了60%,等错误率分别达到0.34%和3.67%,在模型精简和泛化性能方面明显优于同类wav2vec2.0模型和传统打分方法。 展开更多
关键词 伪造语音检测 模型压缩 预训练模型 注意力池化 特征融合 聚类中心 余弦相似度
下载PDF
自定义聚类中心点的快速K-means聚类点云精简算法
3
作者 王世刚 关红利 《工业控制计算机》 2024年第8期123-125,共3页
针对传统K-means算法在随机选取聚类中心点出现聚类失败及点云数据重建时在相对平坦的区域出现孔洞的问题,提出一种GK-means的改进聚类算法对点云数据进行精简。该算法首先规定数值K作为最终聚类个数的限定,然后对选点策略进行改进,采... 针对传统K-means算法在随机选取聚类中心点出现聚类失败及点云数据重建时在相对平坦的区域出现孔洞的问题,提出一种GK-means的改进聚类算法对点云数据进行精简。该算法首先规定数值K作为最终聚类个数的限定,然后对选点策略进行改进,采用最远点采样选取聚类中心,对簇进行细分,计算所有点到聚类中心的欧氏距离,获取最小值所在的位置,放进最小距离所在的簇。实验结果表明:改进后的K-means算法能够使算法成功的概率提高且运行速度较快,对点云进行精简时,特征区域完整地保留了点云模型的细节特征,重建结果具有较高的光顺性。 展开更多
关键词 聚类中心 迭代 GK-means算法 点云精简
下载PDF
基于结构系数的K-means初始聚类中心选择算法
4
作者 李汉波 魏福义 +3 位作者 张嘉龙 刘志伟 黄杰 方月宜 《计算机与数字工程》 2023年第5期993-996,1107,共5页
传统的K-means算法选取初始聚类中心时的不确定性会导致聚类结果不稳定。论文提出了基于相异度的邻域及其结构系数的概念,从最小的结构系数开始,按照其递增顺序寻找初始聚类中心;随后采用依次缩小邻域的技巧逐步探索,直到找到K个初始聚... 传统的K-means算法选取初始聚类中心时的不确定性会导致聚类结果不稳定。论文提出了基于相异度的邻域及其结构系数的概念,从最小的结构系数开始,按照其递增顺序寻找初始聚类中心;随后采用依次缩小邻域的技巧逐步探索,直到找到K个初始聚类中心。该方法同时得到li(i=0,1,2,…,q)个初始聚类中心及其对应的数据分类结果。实验证明,对比于以往的算法,新算法具有更高的分类准确率以及更少的迭代次数。 展开更多
关键词 K-MEANS 相异度 初始聚类中心 结构系数
下载PDF
一种改进的k-means初始聚类中心选取算法 被引量:93
5
作者 韩凌波 王强 +1 位作者 蒋正锋 郝志强 《计算机工程与应用》 CSCD 北大核心 2010年第17期150-152,共3页
在传统的k-means聚类算法中,聚类结果会随着初始聚类中心点的不同而波动,针对这个缺点,提出一种优化初始聚类中心的算法。该算法通过计算每个数据对象的密度参数,然后选取k个处于高密度分布的点作为初始聚类中心。实验表明,在聚类类别... 在传统的k-means聚类算法中,聚类结果会随着初始聚类中心点的不同而波动,针对这个缺点,提出一种优化初始聚类中心的算法。该算法通过计算每个数据对象的密度参数,然后选取k个处于高密度分布的点作为初始聚类中心。实验表明,在聚类类别数给定的情况下,通过用标准的UCI数据库进行实验比较,发现采用改进后方法选取的初始类中心的k-means算法比随机选取初始聚类中心算法有相对较高的准确率和稳定性。 展开更多
关键词 K-MEANS算法 聚类中心 密度参数
下载PDF
初始聚类中心优化的k-means算法 被引量:153
6
作者 袁方 周志勇 宋鑫 《计算机工程》 CAS CSCD 北大核心 2007年第3期65-66,共2页
传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表... 传统的k-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动。为消除这种敏感性,提出一种优化初始聚类中心的方法,此方法计算每个数据对象所在区域的密度,选择相互距离最远的k个处于高密度区域的点作为初始聚类中心。实验表明改进后的k-means算法能产生质量较高的聚类结果,并且消除了对初始输入的敏感性。 展开更多
关键词 数据挖掘 K-MEANS算法 聚类中心
下载PDF
基于最优划分的K-Means初始聚类中心选取算法 被引量:62
7
作者 张健沛 杨悦 +1 位作者 杨静 张泽宝 《系统仿真学报》 CAS CSCD 北大核心 2009年第9期2586-2590,共5页
针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自... 针对传统K-Means算法聚类过程中,聚类数目k值难以准确预设和随机选取初始聚类中心造成聚类精度及效率降低等问题,提出一种基于最优划分的K-Means初始聚类中心选取算法,该算法利用直方图方法将数据样本空间进行最优划分,依据数据样本自身分布特点确定K-Means算法的初始聚类中心,无需预设k值,减少了算法结果对参数的依赖,提高算法运算效率及准确率。实验结果表明,利用该算法改进的K-Means算法,运算时间明显减少,其聚类结果准确率以及算法效率均得到显著提高。 展开更多
关键词 K—Means算法 初始聚类中心 直方图 最优划分方法
下载PDF
K-means算法初始聚类中心选择的优化 被引量:50
8
作者 冯波 郝文宁 +1 位作者 陈刚 占栋辉 《计算机工程与应用》 CSCD 2013年第14期182-185,192,共5页
针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得... 针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。 展开更多
关键词 K—means算法 初始聚类中心 TDKM算法
下载PDF
基于特征关联度的K-means初始聚类中心优化算法 被引量:29
9
作者 陈兴蜀 吴小松 +1 位作者 王文贤 王海舟 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2015年第1期13-19,共7页
针对K-means算法在进行文本聚类时对初始聚类中心敏感的问题,提出基于特征关联度的初始聚类中心选择算法。由于在原始文本集中不易找到类别代表性都较强的多个独立文本作为初始聚类中心,因此先从降维后的文本特征集合中,选取关联度大的... 针对K-means算法在进行文本聚类时对初始聚类中心敏感的问题,提出基于特征关联度的初始聚类中心选择算法。由于在原始文本集中不易找到类别代表性都较强的多个独立文本作为初始聚类中心,因此先从降维后的文本特征集合中,选取关联度大的特征构造新的文本集,再利用"或运算"合并其中的相似文本得到初始聚类中心候选集,最后通过计算文本密度并结合"最小最大"原则从候选集中选取最优的初始中心。在5个数据集上进行对比实验,该算法在多数聚类结果中的F-score值都高于90%,熵值低于0.5,明显优于Mahout提供的K-means算法,表明该算法可选出高质量的初始聚类中心,得到更好的聚类结果。 展开更多
关键词 K-MEANS 特征关联度 初始聚类中心 文本
下载PDF
优化初始聚类中心的改进K-means算法 被引量:33
10
作者 唐东凯 王红梅 +1 位作者 胡明 刘钢 《小型微型计算机系统》 CSCD 北大核心 2018年第8期1819-1823,共5页
针对K-means算法对初始聚类中心和离群点敏感的缺点,提出了一种优化初始聚类中心的改进K-means算法.该算法首先计算出数据集中每个数据对象的离群因子,并根据离群因子的值对数据集进行升序排列,使得中心点的位置靠前.然后在升序排列的... 针对K-means算法对初始聚类中心和离群点敏感的缺点,提出了一种优化初始聚类中心的改进K-means算法.该算法首先计算出数据集中每个数据对象的离群因子,并根据离群因子的值对数据集进行升序排列,使得中心点的位置靠前.然后在升序排列的数据集上,引入取样因子α,得到候选初始中心点集.最后,根据最大最小距离的思想,在候选初始中心点集上选取k个数据对象作为初始聚类中心.实验结果表明,在时间基本相同的情况下,提出的改进算法相对K-means、K-means++算法具有较好的稳定性和较高的聚类准确率,并且聚类的平均迭代次数也相对较小. 展开更多
关键词 K-MEANS算法 初始聚类中心 离群因子 取样因子 最大最小距离
下载PDF
一种有效的K-means聚类中心初始化方法 被引量:86
11
作者 熊忠阳 陈若田 张玉芳 《计算机应用研究》 CSCD 北大核心 2011年第11期4188-4190,共3页
传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上... 传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上,选取到所有已初始化聚类中心距离乘积最大的高密度点作为当前聚类中心。理论分析与对比实验结果表明,此方法相对于传统K-means算法和最大最小距离法有更快的收敛速度、更高的准确率和更强的稳定性。 展开更多
关键词 K-均值算法 基于密度 初始聚类中心 最大最小距离 最大距离积
下载PDF
一种新的k-means聚类中心选取算法 被引量:20
12
作者 黄敏 何中市 +1 位作者 邢欣来 陈英 《计算机工程与应用》 CSCD 北大核心 2011年第35期132-134,共3页
在2010年提出已有的k-means聚类中心选取算法的基础上进行改进。通过计算样本间的距离求出每个样本的密度参数,选取最大密度参数值所对应的样本作为初始聚类中心。当最大密度参数值不惟一时,提出合理选取最大密度参数值的解决方案,依次... 在2010年提出已有的k-means聚类中心选取算法的基础上进行改进。通过计算样本间的距离求出每个样本的密度参数,选取最大密度参数值所对应的样本作为初始聚类中心。当最大密度参数值不惟一时,提出合理选取最大密度参数值的解决方案,依次求出k个初始聚类中心点,由此提出了一种新的k-means聚类中心选取算法。实验证明,提出的算法与对比算法相比具有更高的准确率。 展开更多
关键词 K-MEANS算法 聚类中心 密度参数
下载PDF
对k-means初始聚类中心的优化 被引量:29
13
作者 仝雪姣 孟凡荣 王志晓 《计算机工程与设计》 CSCD 北大核心 2011年第8期2721-2723,2788,共4页
针对传统k-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布选取初始聚类中心的改进k-means算法。该算法利用贪心思想构建K个数据集合,集合的大小与数据的实际分布密切相关,集合中的数据彼此间相互靠近。取集合中数据的平均... 针对传统k-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布选取初始聚类中心的改进k-means算法。该算法利用贪心思想构建K个数据集合,集合的大小与数据的实际分布密切相关,集合中的数据彼此间相互靠近。取集合中数据的平均值作为初始聚类中心,由此得到的初始聚类中心非常接近迭代聚类算法期待的聚类中心。理论分析和实验结果表明,改进算法能改善其聚类性能,并能得到稳定的聚类结果,取得较高的分类准确率。 展开更多
关键词 K-MEANS算法 数据分布 初始聚类中心 改进算法
下载PDF
最小方差优化初始聚类中心的K-means算法 被引量:86
14
作者 谢娟英 王艳娥 《计算机工程》 CAS CSCD 2014年第8期205-211,223,共8页
传统K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定,而优化初始聚类中心的K-means算法需要一定的参数选择,也会使聚类结果缺乏客观性。为此,根据样本空间分布紧密度信息,提出利用最小方差优化初始聚类中心的K-means算法。该... 传统K-means算法随机选取初始聚类中心,容易导致聚类结果不稳定,而优化初始聚类中心的K-means算法需要一定的参数选择,也会使聚类结果缺乏客观性。为此,根据样本空间分布紧密度信息,提出利用最小方差优化初始聚类中心的K-means算法。该算法运用样本空间分布信息,通过计算样本空间分布的方差得到样本紧密度信息,选择方差最小(即紧密度最高)且相距一定距离的样本作为初始聚类中心,实现优化的K-means聚类。在UCI机器学习数据库数据集和含有噪音的人工模拟数据集上的实验结果表明,该算法不仅能得到较好的聚类结果,且聚类结果稳定,对噪音具有较强的免疫性能。 展开更多
关键词 K-MEANS算法 方差 紧密度 初始聚类中心
下载PDF
融合网格密度的聚类中心初始化方案 被引量:16
15
作者 牛琨 张舒博 陈俊亮 《北京邮电大学学报》 EI CAS CSCD 北大核心 2007年第2期6-10,共5页
提出了一种采用密度指针的聚类中心初始化方法——density pointer(DP)算法.DP算法以网格单元的几何中心为对称中心,连接该中心与网格单元各顶点,以此对称分割传统的类矩形网格单元,形成超三角形子空间;进而根据各个超三角形子空间与邻... 提出了一种采用密度指针的聚类中心初始化方法——density pointer(DP)算法.DP算法以网格单元的几何中心为对称中心,连接该中心与网格单元各顶点,以此对称分割传统的类矩形网格单元,形成超三角形子空间;进而根据各个超三角形子空间与邻居单元相邻的超三角形子空间的密度差异确定密度指针的方向,并根据密度指针计算出每个密集网格单元的聚集因子;最后将具有较大局部聚集因子的网格单元族的重心作为初始聚类中心.在公开数据集和人工数据集上的实验结果表明,DP算法能快速高效地找到接近于真实聚类中心的数据点作为初始聚类中心.针对算法的效率实验表明,DP算法的时间开销与数据集实例数、维度以及网格单元数量均呈一阶线性关系. 展开更多
关键词 密度指针 集因子 聚类中心 初始化
下载PDF
粒计算优化初始聚类中心的K-medoids聚类算法 被引量:13
16
作者 谢娟英 鲁肖肖 +1 位作者 屈亚楠 高红超 《计算机科学与探索》 CSCD 北大核心 2015年第5期611-620,共10页
针对快速K-medoids聚类算法所选初始聚类中心可能位于同一类簇的缺陷,以及基于粒计算的K-medoids算法构造样本去模糊相似矩阵时需要主观给定阈值的缺陷,提出了粒计算优化初始聚类中心的K-medoids聚类算法。该算法结合粒计算与最大最小... 针对快速K-medoids聚类算法所选初始聚类中心可能位于同一类簇的缺陷,以及基于粒计算的K-medoids算法构造样本去模糊相似矩阵时需要主观给定阈值的缺陷,提出了粒计算优化初始聚类中心的K-medoids聚类算法。该算法结合粒计算与最大最小距离法,优化K-medoids算法初始聚类中心的选取,选择处于样本分布密集区域且相距较远的K个样本作为初始聚类中心;使用所有样本的相似度均值作为其构造去模糊相似矩阵的阈值。人工模拟数据集和UCI机器学习数据库数据集的实验测试表明,新K-medoids聚类算法具有更稳定的聚类效果,其准确率和Adjusted Rand Index等聚类结果评价指标值优于传统K-medoids聚类算法、快速K-medoids聚类算法和基于粒计算的K-medoids聚类算法。 展开更多
关键词 粒计算 初始聚类中心 最大最小距离法 K-me doids算法
下载PDF
K-means算法的初始聚类中心的优化 被引量:75
17
作者 赖玉霞 刘建平 《计算机工程与应用》 CSCD 北大核心 2008年第10期147-149,共3页
传统的K-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动,针对K-means算法存在的问题,提出了基于密度的改进的K-means算法,该算法采取聚类对象分布密度方法来确定初始聚类中心,选择相互距离最远的K个处于高密度区域的点... 传统的K-means算法对初始聚类中心敏感,聚类结果随不同的初始输入而波动,针对K-means算法存在的问题,提出了基于密度的改进的K-means算法,该算法采取聚类对象分布密度方法来确定初始聚类中心,选择相互距离最远的K个处于高密度区域的点作为初始聚类中心,理论分析与实验结果表明,改进的算法能取得更好的聚类结果。 展开更多
关键词 K-MEANS算法 密度 聚类中心 高密度区域
下载PDF
基于密度的K-means聚类中心选取的优化算法 被引量:48
18
作者 周炜奔 石跃祥 《计算机应用研究》 CSCD 北大核心 2012年第5期1726-1728,共3页
针对传统的K-means算法对于初始聚类中心点和聚类数的敏感问题,提出了一种优化初始聚类中心选取的算法。该算法针对数据对象的分布密度以及计算最近两点的垂直中点方法来确定k个初始聚类中心,再结合均衡化函数对聚类个数进行优化,以获... 针对传统的K-means算法对于初始聚类中心点和聚类数的敏感问题,提出了一种优化初始聚类中心选取的算法。该算法针对数据对象的分布密度以及计算最近两点的垂直中点方法来确定k个初始聚类中心,再结合均衡化函数对聚类个数进行优化,以获得最优聚类。采用标准的UCI数据集进行实验对比,发现改进后的算法相比传统的算法有较高的准确率和稳定性。 展开更多
关键词 K-均值 数据挖掘 聚类中心 垂直中点 密度
下载PDF
最优聚类个数和初始聚类中心点选取算法研究 被引量:82
19
作者 张素洁 赵怀慈 《计算机应用研究》 CSCD 北大核心 2017年第6期1617-1620,共4页
传统K-means算法的聚类数k值事先无法确定,而且算法是随机性地选取初始聚类中心点,这样容易造成聚类结果不稳定且准确率较低。基于SSE来选取聚类个数k值,基于聚类中心点所在的周围区域相对比较密集、聚类中心点之间距离相对较远的选取... 传统K-means算法的聚类数k值事先无法确定,而且算法是随机性地选取初始聚类中心点,这样容易造成聚类结果不稳定且准确率较低。基于SSE来选取聚类个数k值,基于聚类中心点所在的周围区域相对比较密集、聚类中心点之间距离相对较远的选取原则来选取初始聚类中心点,避免初始聚类中心点集中在一个小的范围,防止陷入局部最优。实验证明,该算法能选取最优的k值,通过用标准的UCI数据库进行实验,采用的算法能选择出唯一的初始中心点,聚类准确率较高、误差平方和较小。 展开更多
关键词 K-MEANS算法 聚类中心 准确率 误差平方和
下载PDF
基于初始聚类中心选取的改进FCM聚类算法 被引量:68
20
作者 张慧哲 王坚 《计算机科学》 CSCD 北大核心 2009年第6期206-209,共4页
针对模糊C-均值(Fuzzy C-Means,FCM)算法聚类效果往往受到初始聚类中心影响,收敛结果易陷入局部极小的问题,提出了一种改进的模糊C均值聚类算法。算法给出了一种简洁快速的初始聚类中心的选取规则,并根据聚类中心的分离特性改进了目标函... 针对模糊C-均值(Fuzzy C-Means,FCM)算法聚类效果往往受到初始聚类中心影响,收敛结果易陷入局部极小的问题,提出了一种改进的模糊C均值聚类算法。算法给出了一种简洁快速的初始聚类中心的选取规则,并根据聚类中心的分离特性改进了目标函数,从而使获得的聚类结果为全局最优。仿真结果证明新算法与传统FCM方法相比,迭代次数少,准确率高,同时也更加适用于样本数据分类不均衡的聚类问题。 展开更多
关键词 FCM 目标函数 初始聚类中心 分离度
下载PDF
上一页 1 2 39 下一页 到第
使用帮助 返回顶部