期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
基于K-prototypes的混合属性数据聚类算法改进
1
作者 倪丹 李泽文 《科技创新与应用》 2024年第28期31-34,38,共5页
属性数据分为数值型数据和分类型数据,一般情况下对于数值型数据运算前要进行标准化处理,但是对于数值型数据差异大的数据,由于大数掩盖小数的影响,按照K-prototypes聚类算法,数值型数据标准化后而且不对相应的分类数据有任何预处理或... 属性数据分为数值型数据和分类型数据,一般情况下对于数值型数据运算前要进行标准化处理,但是对于数值型数据差异大的数据,由于大数掩盖小数的影响,按照K-prototypes聚类算法,数值型数据标准化后而且不对相应的分类数据有任何预处理或者在计算时没有进行任何改变,很可能提高分类数据在聚类中的影响,并且分类型数据并未进一步地细分,不能满足不同要求的混合属性聚类。该文在将数值型数据标准化的基础上,将分类数据细分为二元数据和类型数据,并用相异度系数距离计算分类数据之间的距离,并且赋予二元和类型数据相应的权重,来改进K-prototypes聚类算法,使该算法满足不同要求的混合属性数据聚类,最后通过C#语言,在ArcEngine2010版本上实现。 展开更多
关键词 k-prototypes算法 混合属性 类型数据 相异度系数 加权属性
下载PDF
数值型和分类型混合数据的模糊K-Prototypes聚类算法(英文) 被引量:47
2
作者 陈宁 陈安 周龙骧 《软件学报》 EI CSCD 北大核心 2001年第8期1107-1119,共13页
由于数据库经常同时包含数值型和分类型的属性 ,因此研究能够处理混合型数据的聚类算法无疑是很重要的 .讨论了混合型数据的聚类问题 ,提出了一种模糊 K- prototypes算法 .该算法融合了 K- means和 K- modes对数值型和分类型数据的处理... 由于数据库经常同时包含数值型和分类型的属性 ,因此研究能够处理混合型数据的聚类算法无疑是很重要的 .讨论了混合型数据的聚类问题 ,提出了一种模糊 K- prototypes算法 .该算法融合了 K- means和 K- modes对数值型和分类型数据的处理方法 ,能够处理混合类型的数据 .模糊技术体现聚类的边界特征 ,更适合处理含有噪声和缺失数据的数据库 .实验结果显示 。 展开更多
关键词 数据库 数值型混合数据 分类型混合数据 模糊k-prototypes聚类算法
下载PDF
基于K-prototypes的混合属性数据聚类算法 被引量:16
3
作者 陈韡 王雷 蒋子云 《计算机应用》 CSCD 北大核心 2010年第8期2003-2005,2110,共4页
通过对基于K-prototypes算法对混合属性数据处理的聚类问题进行研究,改进了K-prototypes算法中分类属性相异度计算公式,使之能更加精确反映样本间的差异;在此基础上提出了一种用于处理混合属性数据的聚类算法,并将改进后的算法应用于英... 通过对基于K-prototypes算法对混合属性数据处理的聚类问题进行研究,改进了K-prototypes算法中分类属性相异度计算公式,使之能更加精确反映样本间的差异;在此基础上提出了一种用于处理混合属性数据的聚类算法,并将改进后的算法应用于英语借词数据的聚类分析中。实验结果表明,与K-prototypes算法相比,改进后的算法具有更好的稳定性和更高的精度。 展开更多
关键词 聚类 k-prototypes算法 混合属性数据 相异度
下载PDF
模糊k-prototypes聚类算法的一种改进算法 被引量:11
4
作者 王宇 杨莉 《大连理工大学学报》 EI CAS CSCD 北大核心 2003年第6期849-852,共4页
模糊k-prototypes算法是当前聚类分析中最有效算法之一.简述了模糊k-prototypes算法的发展进程和主要性质;并在此基础上,指出它在处理数值型和分类型混合数据时的不足,进而提出一种改进算法;最后,将算法应用到英语借词之中,给出计算结果... 模糊k-prototypes算法是当前聚类分析中最有效算法之一.简述了模糊k-prototypes算法的发展进程和主要性质;并在此基础上,指出它在处理数值型和分类型混合数据时的不足,进而提出一种改进算法;最后,将算法应用到英语借词之中,给出计算结果.结果表明,改进算法具有较好的稳定性和较高的精确度. 展开更多
关键词 模糊k-prototypes聚类算法 数值型属性 分类型属性 英语借词 数据挖掘
下载PDF
基于平均差异度的改进k-prototypes聚类算法 被引量:4
5
作者 石鸿雁 徐明明 《沈阳工业大学学报》 EI CAS 北大核心 2019年第5期555-559,共5页
针对k-prototypes聚类算法随机选取初始聚类中心导致聚类结果不稳定,以及现有的大多数混合属性数据聚类算法聚类质量不高等问题,提出了基于平均差异度的改进k-prototypes聚类算法.通过利用平均差异度选取初始聚类中心,避免了初始聚类中... 针对k-prototypes聚类算法随机选取初始聚类中心导致聚类结果不稳定,以及现有的大多数混合属性数据聚类算法聚类质量不高等问题,提出了基于平均差异度的改进k-prototypes聚类算法.通过利用平均差异度选取初始聚类中心,避免了初始聚类中心点选取的随机性,同时利用信息熵确定数值数据的属性权重,并对分类属性度量公式进行改进,给出了一种混合属性数据度量公式.结果表明,改进后的算法具有较高的准确率,能够有效处理混合属性数据. 展开更多
关键词 k-prototypes算法 聚类 初始聚类中心 混合属性数据 平均差异度 信息熵 属性权重 度量公式
下载PDF
量子遗传算法的模糊K-prototypes聚类 被引量:1
6
作者 叶奇明 梁根 《计算机工程与应用》 CSCD 北大核心 2010年第1期112-115,共4页
聚类分析是数据挖掘中应用最多的一种技术,它在许多领域都有重要应用。模糊h-prototypes算法是当前聚类分析中最有效算法之一,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于量子遗传算法和FKP算法的... 聚类分析是数据挖掘中应用最多的一种技术,它在许多领域都有重要应用。模糊h-prototypes算法是当前聚类分析中最有效算法之一,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于量子遗传算法和FKP算法的混合聚类算法,首先利用量子遗传算法确定FKP的初始聚类中心,再将量子遗传算法聚类结果作为后续FKP算法的初始值。实验结果显示,算法具有良好的收敛性和稳定性,聚类效果优于单一使用FKP算法和相关改进的算法。 展开更多
关键词 聚类算法 量子遗传算法 模糊k-prototypes算法 数值型属性 数据挖掘
下载PDF
一种增强的K-prototypes混合数据聚类算法 被引量:4
7
作者 李顺勇 顾嘉成 《陕西科技大学学报》 北大核心 2021年第2期183-188,共6页
针对K-prototypes算法处理混合数据时精度不高等问题,提出了一种增强的K-prototypes混合数据聚类算法(An Enhanced K-prototypes Mixed Data Clustering Algorithm,EKPCA).首先定义了一种新的距离计算公式,扩大了数据之间的差异性,有利... 针对K-prototypes算法处理混合数据时精度不高等问题,提出了一种增强的K-prototypes混合数据聚类算法(An Enhanced K-prototypes Mixed Data Clustering Algorithm,EKPCA).首先定义了一种新的距离计算公式,扩大了数据之间的差异性,有利于对簇边缘数据进行合理划分;其次选取较多初始原型来覆盖数据的整体信息;最后迭代消去多余原型,得到数据集的真实分类.在8个UCI数据集上对算法进行评测,实验结果表明EKPCA算法有较高聚类精度. 展开更多
关键词 k-prototypes 混合数据 距离计算 初始原型 迭代消去
下载PDF
基于信息增益的模糊K-prototypes聚类算法
8
作者 欧阳浩 王智文 +1 位作者 戴喜生 刘智琦 《计算机工程与科学》 CSCD 北大核心 2015年第5期1009-1014,共6页
K-prototypes聚类算法结合了K-means算法和K-modes算法,可用于分析混合属性的数据对象。传统的K-prototypes聚类算法在计算数据对象的相异度时,未考虑各个属性对于最终聚类结果的影响程度,而现实世界中,各属性的重要程度是不同的。使用... K-prototypes聚类算法结合了K-means算法和K-modes算法,可用于分析混合属性的数据对象。传统的K-prototypes聚类算法在计算数据对象的相异度时,未考虑各个属性对于最终聚类结果的影响程度,而现实世界中,各属性的重要程度是不同的。使用了信息论中信息增益的计算方法,来获得各个属性的权值。在计算各属性的差异度时,乘以这些权值,从而可以获得更为准确的聚类结果。为了增加算法处理模糊问题的能力,本算法引用了模糊理论,从而使其具有较好的抗干扰能力和处理不确定性问题的能力。通过对四个UCI数据集的聚类分析实验,表明了本算法的有效性。 展开更多
关键词 聚类 信息增益 模糊k-prototypes算法 混合型数据
下载PDF
改进的k-prototypes算法及应用 被引量:1
9
作者 罗冬梅 《武夷学院学报》 2009年第2期74-77,共4页
文中提出了一种改进的k-prototypes算法,该算法可以解决具有数值和分类混合类型数据的聚类问题,将它应用于对某高校网站的Web服务器日志进行数据分析,发现有意义的信息,建立规则库,并验证了算法的有效性。
关键词 数据挖掘 k-prototypes算法 K-MEANS算法 k-modes算法 WEB日志分析
下载PDF
基于在线梯度下降的Mini Batch K-Prototypes算法
10
作者 贾子琪 万世昌 +2 位作者 张腾飞 吉康毅 常雪瑞 《南阳理工学院学报》 2023年第4期45-49,共5页
K-Prototypes算法每次迭代都需要花费大量时间来计算所有样本与每个簇中心的相异度以将其划分到各个聚类簇中,这导致K-Prototypes算法在处理大型数据集时运行时间急剧增加。根据在线梯度下降算法对K-Prototypes算法的迭代过程进行优化,... K-Prototypes算法每次迭代都需要花费大量时间来计算所有样本与每个簇中心的相异度以将其划分到各个聚类簇中,这导致K-Prototypes算法在处理大型数据集时运行时间急剧增加。根据在线梯度下降算法对K-Prototypes算法的迭代过程进行优化,减少算法每次迭代所需的计算量从而降低算法的时间复杂度,提升算法运行效率。实验结果表明,提出的基于在线梯度下降的K-Prototypes聚类算法,可以在不影响算法收敛性和有效性的前提下降低算法的时间复杂度,提升算法运行效率。 展开更多
关键词 k-prototypes Mini Batch k-prototypes 在线梯度下降
下载PDF
改进的K-prototypes算法在农民工养老参保中的应用研究
11
作者 陆可 李鸣 +1 位作者 邹启鸣 徐浩 《管理观察》 2015年第28期189-192,共4页
农民工养老问题一直备受社会关注。许多学者对该问题展开了调研,并采用Logistic回归模型来分析调研结果。但是,Logistic回归模型要避免变量间的多元共线性。农民工养老保险参保调研数据各变量之间往往存在关联性,而且数据维度高。针对Lo... 农民工养老问题一直备受社会关注。许多学者对该问题展开了调研,并采用Logistic回归模型来分析调研结果。但是,Logistic回归模型要避免变量间的多元共线性。农民工养老保险参保调研数据各变量之间往往存在关联性,而且数据维度高。针对Logistic回归模型的局限性和调研数据维度高的问题,本文改进了K-prototypes聚类算法,并用于分析农民工未购买养老保险的原因。基于该方法得到的分析结果可以为相关部门制定针对性政策提供参考。 展开更多
关键词 聚类 改进的k-prototypes算法 农民工养老保险
下载PDF
一种面向混合型数据聚类的k-prototypes聚类算法 被引量:7
12
作者 贾子琪 宋玲 《小型微型计算机系统》 CSCD 北大核心 2020年第9期1845-1852,共8页
同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和数值型数据之间的占比,γ对聚类结果影响很大.为了避免不同类型数据之间的特征转换和参数调整以及处理高... 同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和数值型数据之间的占比,γ对聚类结果影响很大.为了避免不同类型数据之间的特征转换和参数调整以及处理高维混合型数据聚类中的特征加权问题,提出了基于熵权的分类型相异度系数,量化的数值型相异度系数和适用于混合型数据聚类的混合型相异度系数.提出的相异度系数充分考虑了分类型特征值的重要性和数值型特征值的平均值,并具统一的准则,可以更客观的计算数据对象与簇之间的相异度.此外,将加权的混合型相异度系数应用到经典的k-prototypes算法中,提出了一种面向混合型数据聚类的k-prototypes聚类算法(KPMD).使用UCI真实数据集进行实验,结果验证了KPMD算法的有效性和鲁棒性. 展开更多
关键词 k-prototypes 混合型相异度系数 分类型数据 数值型数据 混合型数据
下载PDF
基于改进k-prototypes算法的Web日志分析系统的设计与实现
13
作者 罗冬梅 《吉林工程技术师范学院学报》 2015年第5期93-96,共4页
设计了一个基于改进k-prototypes算法的Web日志分析系统,结合学校网站采集的数据针对相关技术算法进行了应用及分析。
关键词 数据挖掘 WEB日志 k-prototypes算法
下载PDF
一种与k-prototypes混合的蚁群聚类算法的浅探
14
作者 于妍 《数字技术与应用》 2010年第11期77-77,79,共2页
本文介于k-prototypes和蚁群聚类算法的优、缺点,将两种算法进行改进后,交替使用,相互弥补、扬长避短,形成一种全新的算法,既缩短了聚类时间也能形成高效的聚类结果。
关键词 蚁群聚类算法 k-prototypes算法
下载PDF
基于改进式k-prototypes聚类的坏数据辨识与修正 被引量:7
15
作者 王孝慈 董树锋 +2 位作者 刘育权 王莉 李俊格 《电测与仪表》 北大核心 2022年第2期9-15,共7页
工业领域很多技术的实现都以准确的负荷数据为基础,而工厂现有的负荷数据测量体系常因为通信、存储等故障,导致负荷数据中出现大量坏数据。因此,提出基于改进式k-prototypes聚类的坏数据辨识与修正方法,通过在聚类中引入非负荷数据特征... 工业领域很多技术的实现都以准确的负荷数据为基础,而工厂现有的负荷数据测量体系常因为通信、存储等故障,导致负荷数据中出现大量坏数据。因此,提出基于改进式k-prototypes聚类的坏数据辨识与修正方法,通过在聚类中引入非负荷数据特征,削弱负荷坏数据对聚类结果的影响,使坏数据辨识和修复结果更准确。改进式k-prototypes算法通过随机初始化,并行计算择优,克服了标准k-prototypes容易随初始聚类中心陷入局部最优解的缺陷;并通过聚类数量的自适应处理,解决了主观决定聚类数量的问题。基于聚类结果,根据正态分布原则确定负荷数据可行域,识别坏数据,并利用类中心置换法进行修正。实验表明,该方法较只考虑负荷数据的模糊均值聚类法效果更好,坏数据识别的召回率与修正的准确率显著提高。 展开更多
关键词 k-prototypes聚类 混合数据集聚类 坏数据辨识 类中心置换修正法 工业负荷预处理
下载PDF
一种有效的Gk-prototypes聚类算法 被引量:1
16
作者 郭映江 徐蔚鸿 +1 位作者 陈沅涛 文泽林 《计算机工程与科学》 CSCD 北大核心 2019年第9期1693-1699,共7页
针对传统的聚类算法对初始聚类中心敏感、只能对单一属性聚类且聚类效果有时欠佳等不足,提出了一种能处理数值属性和分类属性的Gk-prototypes聚类算法。在经典的k-prototypes聚类算法的基础上,利用去模糊相似矩阵来构造粗粒子集,结合粒... 针对传统的聚类算法对初始聚类中心敏感、只能对单一属性聚类且聚类效果有时欠佳等不足,提出了一种能处理数值属性和分类属性的Gk-prototypes聚类算法。在经典的k-prototypes聚类算法的基础上,利用去模糊相似矩阵来构造粗粒子集,结合粒计算和最大最小距离法确定初始聚类中心,并改进了目标函数。实验结果和理论分析表明,Gk-prototypes聚类算法与其他基于k-prototypes的改进算法相比,聚类更准确,有效性更好,鲁棒性更强。 展开更多
关键词 k-prototypes聚类 去模糊相似矩阵 粒计算 最大最小距离法
下载PDF
改进的模糊K-Prototypes聚类算法在研究生培养质量评估中的应用 被引量:1
17
作者 乔秀峰 张德珍 +1 位作者 吴迅 张俊 《中国管理信息化》 2018年第7期185-189,共5页
研究生教育在从追求招生数量到重视培养质量的背景下,如何有效而准确地评估研究生培养质量,成为当前各高校面临的重要课题。文章提出一种改进的模糊K-Prototypes聚类算法,可准确分析研究生培养质量情况。该算法首先提取相应的研究生培... 研究生教育在从追求招生数量到重视培养质量的背景下,如何有效而准确地评估研究生培养质量,成为当前各高校面临的重要课题。文章提出一种改进的模糊K-Prototypes聚类算法,可准确分析研究生培养质量情况。该算法首先提取相应的研究生培养质量影响因素属性,构建研究生培养质量评估指标,从而形成分析数据集;其次,为了解决研究生培养数据密度不均的问题,提出改进算法;最后利用改进的聚类算法对分析数据集进行聚类分析。以一所具体高校为例,验证提出算法的有效性和改进后聚类效果,为科学有效的研究生培养质量评估提供辅助决策方法支持。 展开更多
关键词 研究生教育 培养质量评估 模糊k-prototypes聚类
下载PDF
面向本地差分隐私的K-Prototypes聚类方法 被引量:3
18
作者 张国鹏 陈学斌 +2 位作者 王豪石 翟冉 马征 《计算机应用》 CSCD 北大核心 2022年第12期3813-3821,共9页
为了在聚类分析中保护数据隐私的同时确保数据的可用性,提出一种基于本地化差分隐私(LDP)技术的隐私保护聚类方案——LDPK-Prototypes。首先,用户对混合型数据集进行编码;其次,采用随机响应机制对敏感数据进行扰动,而第三方在收集到用... 为了在聚类分析中保护数据隐私的同时确保数据的可用性,提出一种基于本地化差分隐私(LDP)技术的隐私保护聚类方案——LDPK-Prototypes。首先,用户对混合型数据集进行编码;其次,采用随机响应机制对敏感数据进行扰动,而第三方在收集到用户的扰动数据后以最大限度恢复原始数据集;然后,执行K-Prototypes聚类算法,在聚类过程中,使用相异性度量方法确定初始聚类中心,并利用熵权法重新定义新的距离计算公式。理论分析和实验结果表明,所提方案与基于中心化差分隐私(CDP)技术的ODPC算法相比,在Adult和Heart数据集上的平均准确率分别提高了2.95%和12.41%,有效提高了聚类的可用性。同时,LDPK-Prototypes扩大了数据之间的差异性,有效避免了局部最优,提高了聚类算法的稳定性。 展开更多
关键词 本地化差分隐私 k-prototypes 随机响应机制 熵权法 隐私保护
下载PDF
基于Spark框架的大数据K-prototypes聚类算法
19
作者 龚静 《西南师范大学学报(自然科学版)》 CAS 北大核心 2019年第7期63-68,共6页
大数据具有数据量大及混合类型的属性,基于MapReduce的K-prototypes并行大规模混合数据方案的缺点是时间和内存的限制,导致这些方案不适合处理大数据.为了解决这个问题,该文提出一种新的基于Spark的k-prototypes聚类方法,该方法使用了... 大数据具有数据量大及混合类型的属性,基于MapReduce的K-prototypes并行大规模混合数据方案的缺点是时间和内存的限制,导致这些方案不适合处理大数据.为了解决这个问题,该文提出一种新的基于Spark的k-prototypes聚类方法,该方法使用了重新聚集技术,利用Spark框架的内存操作来构建大规模混合数据分组.在模拟和实际数据集上的实验表明,该文方法可行,且提高了现有K-prototypes方法的效率. 展开更多
关键词 大数据 混合数据 k-prototypes Spark框架
下载PDF
基于K-Prototypes聚类算法的股票分析师行为划分
20
作者 张晓妹 胡殿凯 《计算机科学与应用》 2018年第6期894-901,共8页
股票分析师作为信息中介,通过发布研报的形式提供股票内在投资价值的信息,其行为越发受到广大投资者的关注。由于股票分析师数量众多、研报风格迥异、质量良莠不齐,投资者缺乏相关知识经验难以去选择适合自身偏好的分析师研报。本文利用... 股票分析师作为信息中介,通过发布研报的形式提供股票内在投资价值的信息,其行为越发受到广大投资者的关注。由于股票分析师数量众多、研报风格迥异、质量良莠不齐,投资者缺乏相关知识经验难以去选择适合自身偏好的分析师研报。本文利用K-prototypes聚类算法分析具有混合属性的股票分析师行为数据,解决了股票分析师群体数据量大且分散的特性。通过刻画不同股票分析师群体的特征,帮助投资者了解分析师群体获取更多有价值的数据信息,进行理性投资降低投资风险,同时其结果为后续的多元分析提供数据基础。 展开更多
关键词 聚类 k-prototypes算法 股票分析师 研究报告
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部