期刊文献+
共找到622篇文章
< 1 2 32 >
每页显示 20 50 100
基于改进SOM+K-means算法的客户价值研究
1
作者 王朋亮 单剑锋 《软件》 2024年第3期4-7,65,共5页
为提高多特征参数聚类相似度,针对多特征参数相关性和分布不等问题,提出一种改进的聚类算法,并以此算法研究RFM客户价值模型。此改进算法,通过矩阵旋转和压缩变换以及协方差矩阵处理,构造一种聚类相似度目标的距离函数,以此距离函数结合... 为提高多特征参数聚类相似度,针对多特征参数相关性和分布不等问题,提出一种改进的聚类算法,并以此算法研究RFM客户价值模型。此改进算法,通过矩阵旋转和压缩变换以及协方差矩阵处理,构造一种聚类相似度目标的距离函数,以此距离函数结合SOM算法和K-means算法各自优点,设计改进SOM+K-means组合聚类算法。应用该算法创建RFM客户价值模型,并实验验证。通过轮廓系数法评估,该算法聚类的轮廓系数相比原K-means和SOM算法聚类的轮廓系数,分别提高约0.129和0.126。该聚类算法提高了RFM客户价值聚类效果,为客户价值研究提供了一种新的聚类方法。 展开更多
关键词 协方差矩阵 自组织神经网络 K均值 聚类算法 RFM客户价值
下载PDF
Similarity matrix-based K-means algorithm for text clustering
2
作者 曹奇敏 郭巧 吴向华 《Journal of Beijing Institute of Technology》 EI CAS 2015年第4期566-572,共7页
K-means algorithm is one of the most widely used algorithms in the clustering analysis. To deal with the problem caused by the random selection of initial center points in the traditional al- gorithm, this paper propo... K-means algorithm is one of the most widely used algorithms in the clustering analysis. To deal with the problem caused by the random selection of initial center points in the traditional al- gorithm, this paper proposes an improved K-means algorithm based on the similarity matrix. The im- proved algorithm can effectively avoid the random selection of initial center points, therefore it can provide effective initial points for clustering process, and reduce the fluctuation of clustering results which are resulted from initial points selections, thus a better clustering quality can be obtained. The experimental results also show that the F-measure of the improved K-means algorithm has been greatly improved and the clustering results are more stable. 展开更多
关键词 text clustering K-means algorithm similarity matrix F-MEASURE
下载PDF
融合标签文本的k-means聚类和矩阵分解算法
3
作者 居晓媛 汪明艳 《软件工程》 2023年第6期30-35,共6页
针对推荐系统中依赖用户对项目的评分信息带来的稀疏性问题,提出一种融合标签文本的k-means聚类和矩阵分解的推荐算法。该模型首先对项目信息构建项目特征画像,利用k-means聚类提取项目的潜在特征数量,然后利用隐语义模型LFM进行矩阵分... 针对推荐系统中依赖用户对项目的评分信息带来的稀疏性问题,提出一种融合标签文本的k-means聚类和矩阵分解的推荐算法。该模型首先对项目信息构建项目特征画像,利用k-means聚类提取项目的潜在特征数量,然后利用隐语义模型LFM进行矩阵分解,将用户-评分矩阵进行分解重构得到预测评级,并根据排序推荐。将算法在MovieLens数据集上进行实验,结果表明该推荐算法的均方根误差(RMSE)和绝对平均误差(MAE)表现较好,在ml-latest-small数据集中的准确率(precision)和召回率(recall)较次优算法分别提升了14.5%和20.7%。通过将k-means聚类应用到用户的潜在兴趣和项目的潜在特征提取中,提升了推荐算法的有效性。 展开更多
关键词 推荐算法 矩阵分解 K-meanS LFM
下载PDF
Research on Mean-Variance Portfolio Model with singular Covariance Matrix
4
作者 Xinmeng Wang Haiyue Jin +1 位作者 Junjie Bai Yicheng Hong 《经济管理学刊(中英文版)》 2017年第2期60-66,共7页
关键词 协变性 矩阵解 模型 发现方法 模拟试验 非退化
下载PDF
基于改进K-means聚类的医疗信息系统信息安全检测方法 被引量:2
5
作者 姚远 庞震 《信息技术》 2023年第1期154-157,162,共5页
医疗信息系统中的信息数据在实际更新过程中容易产生振荡,导致实际安全检测时产生的检测时延数值过大,为此设计基于改进K-means聚类的医疗信息系统信息安全检测方法。划分医疗信息系统信息场景,获取医疗信息系统信息数据,随机选定一个... 医疗信息系统中的信息数据在实际更新过程中容易产生振荡,导致实际安全检测时产生的检测时延数值过大,为此设计基于改进K-means聚类的医疗信息系统信息安全检测方法。划分医疗信息系统信息场景,获取医疗信息系统信息数据,随机选定一个信息数据作为聚类初始位置,划定信息数据的判断方向,形成一个基于改进K-means聚类算法判断信息数据安全状态的过程,构建不同层次信息的安全状态判断矩阵,完成安全检测方法的构建。结果表明:设计的检测方法误报率较低,产生的时延在0.1s左右,与两种文献中的检测方法相比,文中设计的安全检测方法产生的时延时间较短,实际检测过程所需的检测时间最短。 展开更多
关键词 改进K-means聚类 医疗信息系统 信息安全 安全状态判断矩阵
下载PDF
基于K-means聚类与PLS回归模型的交通速度短时预测 被引量:1
6
作者 贾秀燕 孙秋霞 李勍 《青岛大学学报(自然科学版)》 CAS 2023年第1期42-48,53,共8页
为实现对交通流局部特征的有效提取,提高交通速度预测模型的可解释性,提出基于K-means聚类与偏最小二乘(Partial Least Squares,PLS)回归的交通速度短时预测模型。模型采用时空相关矩阵挖掘路网中相邻路段交通速度之间的关联性,利用K-me... 为实现对交通流局部特征的有效提取,提高交通速度预测模型的可解释性,提出基于K-means聚类与偏最小二乘(Partial Least Squares,PLS)回归的交通速度短时预测模型。模型采用时空相关矩阵挖掘路网中相邻路段交通速度之间的关联性,利用K-means聚类算法划分历史数据集,并选取实测出租车GPS数据验证模型对交通速度短时预测的准确性。实验结果表明,与ARIMA、PLS回归和LSTM模型相比,该模型的预测误差减少了约30%。 展开更多
关键词 城市交通 速度短时预测 K-meanS聚类 偏最小二乘回归 时空相关矩阵
下载PDF
矩阵初等变换的几何意义
7
作者 雍龙泉 《高师理科学刊》 2024年第1期85-88,共4页
矩阵的初等变换在线性代数中应用十分广泛,以初等行变换为例,分别给出了非退化的初等变换、退化的初等变换的实例与对应的几何图形,在此基础上给出了任意角度的旋转.在教学过程中,通过挖掘初等变换的几何意义,可以使学生建立代数与几何... 矩阵的初等变换在线性代数中应用十分广泛,以初等行变换为例,分别给出了非退化的初等变换、退化的初等变换的实例与对应的几何图形,在此基础上给出了任意角度的旋转.在教学过程中,通过挖掘初等变换的几何意义,可以使学生建立代数与几何的统一观,促进学生抽象思维与形象思维协调发展. 展开更多
关键词 矩阵 初等变换 几何意义 旋转
下载PDF
求解大规模谱聚类的近似加权核k-means算法 被引量:31
8
作者 贾洪杰 丁世飞 史忠植 《软件学报》 EI CSCD 北大核心 2015年第11期2836-2846,共11页
谱聚类将聚类问题转化成图划分问题,是一种基于代数图论的聚类方法.在求解图划分目标函数时,一般利用Rayleigh熵的性质,通过计算Laplacian矩阵的特征向量将原始数据点映射到一个低维的特征空间中,再进行聚类.然而在谱聚类过程中,存储相... 谱聚类将聚类问题转化成图划分问题,是一种基于代数图论的聚类方法.在求解图划分目标函数时,一般利用Rayleigh熵的性质,通过计算Laplacian矩阵的特征向量将原始数据点映射到一个低维的特征空间中,再进行聚类.然而在谱聚类过程中,存储相似矩阵的空间复杂度是O(n2),对Laplacian矩阵特征分解的时间复杂度一般为O(n3),这样的复杂度在处理大规模数据时是无法接受的.理论证明,Normalized Cut图聚类与加权核k-means都等价于矩阵迹的最大化问题.因此,可以用加权核k-means算法来优化Normalized Cut的目标函数,这就避免了对Laplacian矩阵特征分解.不过,加权核k-means算法需要计算核矩阵,其空间复杂度依然是O(n2).为了应对这一挑战,提出近似加权核k-means算法,仅使用核矩阵的一部分来求解大数据的谱聚类问题.理论分析和实验对比表明,近似加权核k-means的聚类表现与加权核k-means算法是相似的,但是极大地减小了时间和空间复杂性. 展开更多
关键词 谱聚类 迹最大化 加权核k-means 近似核矩阵 大数据
下载PDF
一种改进的k-means文档聚类初值选择算法 被引量:23
9
作者 刘远超 王晓龙 刘秉权 《高技术通讯》 CAS CSCD 北大核心 2006年第1期11-15,共5页
提出了一种改进的基于最小最大原则的k-means文档聚类初始值选择算法。该方法首先构造相似度矩阵,然后利用最小最大原则对相似度矩阵进行分析,从而选择初始聚点并自动确定聚类k值。实验结果表明利用该方法找到的k值比较接近真实值。
关键词 文档聚类 K-meanS 最小最大原则 相似度矩阵
下载PDF
一种基于空间邻接关系的k-means聚类改进算法 被引量:15
10
作者 王海起 王劲峰 《计算机工程》 CAS CSCD 北大核心 2006年第21期50-51,75,共3页
空间对象不仅具有非空间的属性特征,而且具有与空间位置、拓扑结构相关的空间特征。利用传统的聚类方法对空间对象进行聚类时,由于没有考虑空间关系,同一类的对象可能出现在空间不相邻的位置。基于空间邻接关系的k-means改进算法将相邻... 空间对象不仅具有非空间的属性特征,而且具有与空间位置、拓扑结构相关的空间特征。利用传统的聚类方法对空间对象进行聚类时,由于没有考虑空间关系,同一类的对象可能出现在空间不相邻的位置。基于空间邻接关系的k-means改进算法将相邻对象的空间邻接关系作为约束条件加以考虑,使聚类结果既反映了属性特征的相似程度,又反映了对象的空间相邻状态,从而可以揭示不同类别对象的空间分布格局,因此其比传统的k-means方法更适合于空间对象的聚类分析。 展开更多
关键词 空间对象 空间邻接关系 邻接矩阵 K-meanS聚类算法
下载PDF
基于MapReduce的K-means聚类集成 被引量:8
11
作者 冀素琴 石洪波 《计算机工程》 CAS CSCD 2013年第9期84-87,共4页
针对传统聚类算法难以高效进行海量数据聚类分析的问题,提出一种基于MapReduce框架的K-means聚类集成算法。利用K-means算法生成不同聚簇数目的基聚类结果,改进共协关系矩阵,依据数据点对出现次数进行集成,自动得出最终聚类结果。实验... 针对传统聚类算法难以高效进行海量数据聚类分析的问题,提出一种基于MapReduce框架的K-means聚类集成算法。利用K-means算法生成不同聚簇数目的基聚类结果,改进共协关系矩阵,依据数据点对出现次数进行集成,自动得出最终聚类结果。实验结果表明,该算法能够有效地改善聚类质量,具有良好的扩展性,适用于海量数据的聚类分析。 展开更多
关键词 海量数据 聚类 MAPREDUCE框架 K—means算法 共协关系矩阵 聚类集成
下载PDF
基于异常值检测矩阵分解的服务质量预测
12
作者 张园园 朵琳 韦贵香 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期255-264,共10页
基于Qo S感知的Web服务推荐是帮助用户找到高质量服务的解决方案之一.为了准确预测候选服务的QoS值,通常需要收集用户的历史QoS数据.然而,现有的方法大多忽略了历史数据中的异常值会导致预测准确度降低.为了解决这一问题,提出一种基于... 基于Qo S感知的Web服务推荐是帮助用户找到高质量服务的解决方案之一.为了准确预测候选服务的QoS值,通常需要收集用户的历史QoS数据.然而,现有的方法大多忽略了历史数据中的异常值会导致预测准确度降低.为了解决这一问题,提出一种基于异常值检测矩阵分解的服务质量预测方法.首先,使用基于K-means的隔离森林算法先对历史QoS数据进行聚类,将历史数据中的异常值剔除;然后,将其用于改进的矩阵分解模型中对未知值进行预测;最后,利用柯西损失来评估观察值与预测值之间的差异.实验采用WSDream数据集进行测试,结果表明,提出的异常值检测模型的响应时间的MAE与RMSE指标平均提高了19.11%和39.59%,吞吐量的MAE与RMSE指标平均提高了9.82%和29.89%,证明所提模型有效改进了预测准确度. 展开更多
关键词 K-meanS聚类 异常值检测 矩阵分解 柯西损失 服务质量
下载PDF
一种基于抽样改进加权核K-means的大数据谱聚类算法 被引量:7
13
作者 金海 张劲松 吴睿 《测绘通报》 CSCD 北大核心 2018年第11期78-82,共5页
经典谱聚类将数据聚类转化为加权图划分问题,在分析Normalized Cut目标函数与加权核K-means函数等价基础上,设计了一种基于抽样改进加权核K-means算法的大规模数据谱聚类算法。算法通过Leaders进行初始聚类预处理,以控制后续随机抽样的... 经典谱聚类将数据聚类转化为加权图划分问题,在分析Normalized Cut目标函数与加权核K-means函数等价基础上,设计了一种基于抽样改进加权核K-means算法的大规模数据谱聚类算法。算法通过Leaders进行初始聚类预处理,以控制后续随机抽样的数据规模及对原始数据类别的覆盖,通过抽样子集内加权核K-means迭代优化,避免Laplacian矩阵特征分解的大量资源占用,从而以部分核矩阵的使用避免全部核矩的时间、空间复杂度。试验结果表明,改进算法在保持与经典算法相近聚类精度基础上,大幅提高了聚类效率。 展开更多
关键词 大规模数据集谱聚类 加权核K-means算法 数据抽样 核矩阵
下载PDF
基于k-means算法的微博用户推荐功能研究 被引量:16
14
作者 杨尊琦 张倩楠 《情报杂志》 CSSCI 北大核心 2013年第8期142-144,131,共4页
将微博中的兴趣关注根据现有的类别进行再次分类。以新浪微博达人为研究对象,提取他们关注的名人以及机构,并将这些名人、机构根据主页描述和标签进行归类。基于共链关系统计同时关注每两个类别之间的用户人数。最后将统计结果制成相关... 将微博中的兴趣关注根据现有的类别进行再次分类。以新浪微博达人为研究对象,提取他们关注的名人以及机构,并将这些名人、机构根据主页描述和标签进行归类。基于共链关系统计同时关注每两个类别之间的用户人数。最后将统计结果制成相关性矩阵,导入SPSS软件中进行k-means聚类,结果为具有相似性的兴趣可以聚为一组。最后根据聚类结果结合现实情况分析各类别之间的相似性与区别。挖掘用户关注兴趣的隐性信息,并对微博用户推荐兴趣提出建议。 展开更多
关键词 微博关注兴趣共同关注矩阵k-means聚类新浪微博微博用户 用户推荐
下载PDF
基于K-means的矩阵分解推荐算法 被引量:5
15
作者 张荣梅 陈彬 张琦 《智能计算机与应用》 2020年第1期56-60,66,共6页
传统矩阵分解算法和基于用户画像的算法存在数据稀疏性和冷启动等问题,且多数情况下只注重于用户项目交互数据,而对用户本身的属性信息缺少借鉴,从而导致推荐准确性不高。将K-means与矩阵分解相结合,提出了一种基于K-means的矩阵分解推... 传统矩阵分解算法和基于用户画像的算法存在数据稀疏性和冷启动等问题,且多数情况下只注重于用户项目交互数据,而对用户本身的属性信息缺少借鉴,从而导致推荐准确性不高。将K-means与矩阵分解相结合,提出了一种基于K-means的矩阵分解推荐算法(Matrix Decomposition Based on K-means,KMMD)。该算法融合用户属性和用户项目交互评级数据作为输入,先将用户进行K-means聚类,得到近邻用户集,再将近邻用户-项目评级矩阵进行分解和重构,得到预测评级并排序推荐。将算法在MovieLens公开数据集上进行仿真实验,结果表明KMMD推荐算法在召回率和精确度上有了进一步的提高,并且对用户冷启动问题做出了很大的改善。 展开更多
关键词 智能推荐 K-meanS 矩阵分解
下载PDF
基于Spark的改进K-means快速聚类算法 被引量:16
16
作者 徐健锐 詹永照 《江苏大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第3期316-323,共8页
针对大数据环境下聚类算法所处理数据规模越来越大、对算法时效性要求越来越高的问题,提出一种基于分布式计算框架Spark的改进K-means快速聚类算法Spark-KM.首先针对K-means算法因初始聚类点选择不当导致局部最优、迭代次数增加而无法... 针对大数据环境下聚类算法所处理数据规模越来越大、对算法时效性要求越来越高的问题,提出一种基于分布式计算框架Spark的改进K-means快速聚类算法Spark-KM.首先针对K-means算法因初始聚类点选择不当导致局部最优、迭代次数增加而无法适应大规模数据聚类的问题,通过预抽样和最大最小距离相结合对K-means算法进行改进;然后对原始数据进行矩阵分割,并存储在不同的Spark计算框架的结点当中;最后根据改进的K-means算法,结合分布式矩阵计算和Spark平台进行大数据快速聚类.结果表明,文中算法可以有效减少结点间的数据移动次数,并具有良好的可扩展性.通过该算法在单机环境和集群环境的对比测试,说明该算法适用于大规模数据环境,且算法性能与数据规模成正比,集群环境较单机环境也具有很大的性能提高. 展开更多
关键词 改进K-meanS 预抽样 最大最小距离 矩阵分割 矩阵计算
下载PDF
一种有效的k-means聚类初始中心选取方法 被引量:11
17
作者 任景彪 尹绍宏 《计算机与现代化》 2010年第7期84-86,92,共4页
针对传统k-means聚类算法中对初始聚类中心随意选取和人为指定的缺陷,提出一种改进的初始聚类中心的选取方法,利用差异矩阵将新的聚类初始中心计算方法用在传统的k-means算法思想中,对传统的k-means算法进行改进。降低k-means算法的复... 针对传统k-means聚类算法中对初始聚类中心随意选取和人为指定的缺陷,提出一种改进的初始聚类中心的选取方法,利用差异矩阵将新的聚类初始中心计算方法用在传统的k-means算法思想中,对传统的k-means算法进行改进。降低k-means算法的复杂度和对异常点的敏感度,提高算法的可伸缩性。 展开更多
关键词 K-meanS 聚类 初始化中心 差异矩阵
下载PDF
基于NKL和K-means聚类的协同过滤推荐算法 被引量:6
18
作者 李顺勇 张钰嘉 张海玉 《河南科学》 2020年第1期6-12,共7页
针对传统协同过滤推荐算法(CF)存在用户-项目矩阵稀疏以及推荐准确率较低等问题,提出了一种基于NKL和K-means聚类的协同过滤推荐算法(NKL-KM).首先,NKL-KM算法定义了一种新的相似性度量方法,该方法在进行相似性度量时考虑了各项目评分... 针对传统协同过滤推荐算法(CF)存在用户-项目矩阵稀疏以及推荐准确率较低等问题,提出了一种基于NKL和K-means聚类的协同过滤推荐算法(NKL-KM).首先,NKL-KM算法定义了一种新的相似性度量方法,该方法在进行相似性度量时考虑了各项目评分的分布以及评分值差异.其次,NKL-KM算法将K-means算法与CF算法结合,提高了推荐算法精度.最后,在MovieLens和Netflix数据集上进行算法对比实验,实验结果表明NKL-KM算法有较高的推荐精度. 展开更多
关键词 协同过滤 推荐算法 矩阵稀疏 K-meanS 相似性度量
下载PDF
基于局部优化奇异值分解和K-means聚类的协同过滤算法 被引量:15
19
作者 尹芳 宋垚 李骜 《南京理工大学学报》 EI CAS CSCD 北大核心 2019年第6期720-726,共7页
为了克服传统协同过滤(CF)推荐方法数据稀疏和可扩展性差的不足,该文提出1种基于局部优化降维和聚类的协同过滤算法。采用局部优化的奇异值分解(SVD)降维技术和K-均值(K-means)聚类技术对用户-项目评分矩阵中的相似用户进行聚类并降低... 为了克服传统协同过滤(CF)推荐方法数据稀疏和可扩展性差的不足,该文提出1种基于局部优化降维和聚类的协同过滤算法。采用局部优化的奇异值分解(SVD)降维技术和K-均值(K-means)聚类技术对用户-项目评分矩阵中的相似用户进行聚类并降低维度。利用近似差分矩阵表示评分矩阵的局部结构,实现局部优化。局部优化的SVD降维技术可以利用更少的迭代次数缓解CF中数据稀疏和算法可扩展性差的问题。K-means聚类技术可以缩小邻居集查找范围,提高推荐速度。将该文算法与基于Pearson相关系数的协同过滤算法、基于SVD的协同过滤算法、基于K-means聚类的协同过滤算法相比较。在MovieLens数据集上的实验结果表明,该算法的平均绝对误差(MAE)较其他算法降低了大约12%,准确性(Precision)提高了7%。 展开更多
关键词 局部优化 奇异值分解 K-均值聚类 协同过滤 近似差分矩阵
下载PDF
自适应特征权重的K-means聚类算法 被引量:10
20
作者 李四海 满自斌 《计算机技术与发展》 2013年第6期98-101,105,共5页
为提高传统K-means聚类算法在医学数据聚类中的准确率和稳定性,提出了一种自适应特征权重的K-means聚类算法AFW-K-means。该算法首先通过计算属性的均方差选取初始聚类中心,然后根据当前的迭代结果,按照类内紧密、类间远离的原则调整属... 为提高传统K-means聚类算法在医学数据聚类中的准确率和稳定性,提出了一种自适应特征权重的K-means聚类算法AFW-K-means。该算法首先通过计算属性的均方差选取初始聚类中心,然后根据当前的迭代结果,按照类内紧密、类间远离的原则调整属性在距离公式中的特征权重,以便更准确地反映数据点在欧氏空间中的真实距离,最后选取UCI上的BCW乳腺肿瘤等数据集对算法的有效性进行验证。结果表明:算法的准确率和稳定性均明显好于传统K-means算法。 展开更多
关键词 K—means 医学数据聚类 自适应特征权重 聚类评价 混淆矩阵
下载PDF
上一页 1 2 32 下一页 到第
使用帮助 返回顶部