期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
一种针对分类型数据的熵特征变换FCM聚类算法
1
作者 刘晋胜 周靖 《数字技术与应用》 2024年第1期57-59,共3页
针对分类型数据导致聚类性能下降的问题,本文提出一种新的熵特征变换FCM聚类算法。首先根据熵的数学描述形式,定义分类型数据参数的熵特征值,进而生成熵特征变换模型及其增量模型;接着定义模型的矩阵“痕迹”,获取EFTM模型数据的特征集... 针对分类型数据导致聚类性能下降的问题,本文提出一种新的熵特征变换FCM聚类算法。首先根据熵的数学描述形式,定义分类型数据参数的熵特征值,进而生成熵特征变换模型及其增量模型;接着定义模型的矩阵“痕迹”,获取EFTM模型数据的特征集合;然后融合FCM聚类分析,设计一种以熵为特征提取的主体描述形式的聚类算法;最后实验均表明,该算法具有较高的自适应性。 展开更多
关键词 分类型数据 变换模型 增量模型 描述形式 特征提取 特征集合 FCM聚类算法 定义模型
下载PDF
基于山方法的分类型数据核聚类
2
作者 朱映辉 杨圣云 袁德辉 《计算机工程与设计》 CSCD 北大核心 2008年第11期2915-2917,共3页
为了提高分类型数据集聚类的准确性和对广泛数据集聚类的适应性,引入3种核函数,再利用基于山方法的核K-means作分类型的数据聚类,核函数把分类型数据映射到高维特征空间,从而给缺乏测度的分类型数据引入了数值型数据的测度。改进后用多... 为了提高分类型数据集聚类的准确性和对广泛数据集聚类的适应性,引入3种核函数,再利用基于山方法的核K-means作分类型的数据聚类,核函数把分类型数据映射到高维特征空间,从而给缺乏测度的分类型数据引入了数值型数据的测度。改进后用多个公开数据集对这些方法进行了实验评测,结果显示这些方法对分类型数据的聚类是有效的。 展开更多
关键词 核聚类 分类型数据 核函数 山方法 K均值
下载PDF
结合柯西核的分类型数据密度峰值聚类算法 被引量:4
3
作者 盛锦超 杜明晶 +1 位作者 李宇蕊 孙嘉睿 《计算机工程与应用》 CSCD 北大核心 2022年第18期162-171,共10页
密度峰值聚类算法在处理分类型数据时难以产生较好的聚类效果。针对该现象,详细分析了其产生的原因:距离计算的重叠问题和密度计算的聚集问题。同时为了解决上述问题,提出了一种面向分类型数据的密度峰值聚类算法(Cauchy kernel-based d... 密度峰值聚类算法在处理分类型数据时难以产生较好的聚类效果。针对该现象,详细分析了其产生的原因:距离计算的重叠问题和密度计算的聚集问题。同时为了解决上述问题,提出了一种面向分类型数据的密度峰值聚类算法(Cauchy kernel-based density peaks clustering for categorical data,CDPCD)。算法首先指出分类型数据距离度量过程中有序特性(分类型数据属性值之间的顺序关系)鲜有考虑的现状,进而提出一种基于概率分布的加权有序距离度量来缓解重叠问题。通过结合柯西核函数,在共享最近邻密度峰值聚类算法基础上重新评估数据密度值,改进了密度计算和二次分配方式,增强了密度多样性,降低了聚集问题带来的影响。多个真实数据集上的实验结果表明,相较于传统的基于划分和密度的聚类算法,CDPCD都取得了更好的聚类结果。 展开更多
关键词 分类型数据 有序特性 密度峰值聚类 柯西核函数 数据挖掘
下载PDF
一种有效的分类型数据聚类方法 被引量:3
4
作者 罗可 洪亮亮 童小娇 《控制与决策》 EI CSCD 北大核心 2011年第10期1542-1544,1548,共4页
鉴于传统的K-means聚类算法只限于处理数值型数据,将K-means算法扩展到分类型数据域,提出一种分类型数据聚类方法.根据与每个分类属性的每个值相关的数据分布信息,同时结合数据的纵向与横向分布来评价数据对象与类之间的差异性,定义了... 鉴于传统的K-means聚类算法只限于处理数值型数据,将K-means算法扩展到分类型数据域,提出一种分类型数据聚类方法.根据与每个分类属性的每个值相关的数据分布信息,同时结合数据的纵向与横向分布来评价数据对象与类之间的差异性,定义了一种新的距离度量.该方法能发现同一属性不同值间的内在关系,并能有效地度量对象间的差异性.用UCI中的数据集对所提算法进行验证,实验结果表明了该算法具有较好的聚类效果. 展开更多
关键词 聚类 分类型数据 差异性 域值 共生
原文传递
基于信息熵的高维分类型数据子空间聚类算法 被引量:2
5
作者 孙浩军 杜育林 姜大志 《山东大学学报(工学版)》 CAS 北大核心 2011年第5期37-45,共9页
由于分类型数据相异度度量的局限性以及分类型数据在高维空间中的稀疏性,使得传统的相异度度量在高维分类型数据聚类中失效,针对上述问题,本研究提出了一个基于信息熵的理论高维分类型数据聚类算法。该算法综合考虑对应子空间和噪声空... 由于分类型数据相异度度量的局限性以及分类型数据在高维空间中的稀疏性,使得传统的相异度度量在高维分类型数据聚类中失效,针对上述问题,本研究提出了一个基于信息熵的理论高维分类型数据聚类算法。该算法综合考虑对应子空间和噪声空间的维度信息熵设计了一个高效、无监督的子空间搜索对高维数据进行有效降维,同时提出了基于整体数据的平均信息熵的全局优化方法对聚类结果进行迭代寻优。通过用人工数据和Votes、Mushroom和Soybean 3个典型的真实分类数据集试验,与其他分类型聚类算法相比,新算法在聚类准确性、熵值、CU(category utility)以及类个数等指标上有明显提高。 展开更多
关键词 分类型数据 信息熵 子空间聚类 高维数据
原文传递
数值型和分类型混合数据的模糊K-Prototypes聚类算法(英文) 被引量:45
6
作者 陈宁 陈安 周龙骧 《软件学报》 EI CSCD 北大核心 2001年第8期1107-1119,共13页
由于数据库经常同时包含数值型和分类型的属性 ,因此研究能够处理混合型数据的聚类算法无疑是很重要的 .讨论了混合型数据的聚类问题 ,提出了一种模糊 K- prototypes算法 .该算法融合了 K- means和 K- modes对数值型和分类型数据的处理... 由于数据库经常同时包含数值型和分类型的属性 ,因此研究能够处理混合型数据的聚类算法无疑是很重要的 .讨论了混合型数据的聚类问题 ,提出了一种模糊 K- prototypes算法 .该算法融合了 K- means和 K- modes对数值型和分类型数据的处理方法 ,能够处理混合类型的数据 .模糊技术体现聚类的边界特征 ,更适合处理含有噪声和缺失数据的数据库 .实验结果显示 。 展开更多
关键词 数据 数值型混合数据 类型混合数据 模糊K-Prototypes聚类算法
下载PDF
基于核方法的分类型属性数据集模糊聚类算法 被引量:5
7
作者 伍忠东 高新波 谢维信 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第9期23-28,共6页
针对分类型属性数据的聚类问题 ,将核方法的思想推广到快速、高效率的模糊c -均值算法 ,构造了基于核函数的模糊核c -均值聚类算法 .该算法通过使用经验核矩阵充分利用了数据间的“相异性”信息 ,并且避免了模糊k modes算法中每次迭代... 针对分类型属性数据的聚类问题 ,将核方法的思想推广到快速、高效率的模糊c -均值算法 ,构造了基于核函数的模糊核c -均值聚类算法 .该算法通过使用经验核矩阵充分利用了数据间的“相异性”信息 ,并且避免了模糊k modes算法中每次迭代均要直接计算类中心的缺点 ,提高了聚类的精确度和稳定性 ,同时该算法对模式 (类中心 )的初始值选择不敏感 . 展开更多
关键词 类型属性数据 聚类 数据挖掘 模糊C-均值 核方法
下载PDF
PLDP:收集和分析多维数据的个性化LDP
8
作者 谷香 李艳辉 +2 位作者 袁野 李新玲 王国仁 《计算机科学与探索》 CSCD 北大核心 2023年第4期964-972,共9页
众包应用的普及加速了企业的发展,随之而来的隐私泄露问题已经成为公众关注的焦点。现有的本地化差分隐私(LDP)机制主要关注单个隐私级别的效用优化,这会导致某些用户因提供的隐私保护级别不足拒绝共享数据,而某些用户则获得过多的隐私... 众包应用的普及加速了企业的发展,随之而来的隐私泄露问题已经成为公众关注的焦点。现有的本地化差分隐私(LDP)机制主要关注单个隐私级别的效用优化,这会导致某些用户因提供的隐私保护级别不足拒绝共享数据,而某些用户则获得过多的隐私保护。为满足用户不同的隐私保护需求,针对收集和分析多维混合型数据提出一种个性化本地差分隐私(PLDP)机制,为用户提供多个隐私保护级别。具体来说,提出一个个性化用户数据扰动框架,该框架针对数值型数据和分类型数据分别执行个性化的均值估计算法和频率估计算法,并通过理论分析证明算法的保密性和有效性。另外,提出一个个性化的采样方案,该方案根据服务器端的偏好对属性标签进行预处理,并按照其收集偏好对数据维度进行有偏采样。在两个真实数据集上的实验表明,与传统的LDP机制相比,提出的机制在保证用户数据隐私的同时,降低了收集数值型数据和分类型数据的统计误差,因此在隐私保护和数据可用性之间提供了更好的平衡。 展开更多
关键词 本地化差隐私(LDP) 个性化本地差隐私(PLDP) 数值型数据 分类型数据 众包
下载PDF
面向分类型矩阵数据的无监督孤立点检测算法 被引量:1
9
作者 吴晓林 曹付元 《深圳大学学报(理工版)》 EI CAS CSCD 北大核心 2019年第1期33-42,共10页
孤立点检测是数据挖掘的重要分支之一,旨在发现一个数据集中与多数对象行为明显不同的一些对象.针对分类型矩阵数据,通过给出一种矩阵对象自身的内聚度和该矩阵对象与其他矩阵对象之间的耦合度,定义了矩阵对象的孤立因子,提出一种面向... 孤立点检测是数据挖掘的重要分支之一,旨在发现一个数据集中与多数对象行为明显不同的一些对象.针对分类型矩阵数据,通过给出一种矩阵对象自身的内聚度和该矩阵对象与其他矩阵对象之间的耦合度,定义了矩阵对象的孤立因子,提出一种面向分类型矩阵数据的孤立点检测算法.在Market basket、Microsoft web和MovieLens真实数据集上的实验结果表明,与基于共同近邻(common-neighbor-based,CNB)算法、局部异常因子(local outlier factor,LOF)算法和基于信息熵(information entropy-based,IE-based)的算法相比,本算法能有效检测分类型矩阵数据中的孤立点. 展开更多
关键词 人工智能 孤立点检测 类型矩阵数据 耦合度 内聚度 数据挖掘
下载PDF
面向不完备分类型矩阵数据的集对k-modes聚类算法 被引量:4
10
作者 张春英 高瑞艳 +4 位作者 王佳昊 陈松 刘凤春 任静 冯晓泽 《小型微型计算机系统》 CSCD 北大核心 2021年第9期1837-1844,共8页
为了解决具有不完备、分类型矩阵数据集的聚类问题,同时考虑样本和类簇间的不确定关系,提出了一种面向不完备分类型矩阵数据的集对k-modes聚类算法.首先,基于集对信息粒的相关理论,定义了不完备矩阵样本间的集对距离度量方法;其次,考虑... 为了解决具有不完备、分类型矩阵数据集的聚类问题,同时考虑样本和类簇间的不确定关系,提出了一种面向不完备分类型矩阵数据的集对k-modes聚类算法.首先,基于集对信息粒的相关理论,定义了不完备矩阵样本间的集对距离度量方法;其次,考虑样本和类簇间的不确定关系,给出了类内平均距离的定义和判断样本是否属于多个类簇的阈值计算公式,进而形成包含正同域,边界域和负反域的集对聚类结果;最后,通过选取的3个矩阵数据集与四个对比算法进行实验评价,实验结果表明集对k-modes聚类算法可以有效处理不完备分类型矩阵数据集,并且在准确率、召回率、调整兰德系数和标准化互信息等指标上均有良好的聚类性能. 展开更多
关键词 不完备类型矩阵数据 集对信息粒 k-modes 集对距离 集对k-modes
下载PDF
无人仓系统订单分批问题及K-max聚类算法 被引量:9
11
作者 李珍萍 田宇璇 +1 位作者 卜晓奇 吴凌云 《计算机集成制造系统》 EI CSCD 北大核心 2021年第5期1506-1517,共12页
为了提高订单拣选效率、降低拣选成本,研究了以自动引导小车(AGV)为搬运工具的无人仓库系统订单分批问题。分析了影响订单拣选成本和效率的两种主要因素,建立了以订单分批拣选总成本极小化为目标的整数规划模型。根据K-means聚类算法思... 为了提高订单拣选效率、降低拣选成本,研究了以自动引导小车(AGV)为搬运工具的无人仓库系统订单分批问题。分析了影响订单拣选成本和效率的两种主要因素,建立了以订单分批拣选总成本极小化为目标的整数规划模型。根据K-means聚类算法思想,结合订单分批问题的优化目标,基于每批订单中包含的商品种类和拣选每批订单需要搬运的货架信息,利用取大(max)运算符分别定义了能够反映订单拣选成本的两种类中心,以及订单到两种类中心的距离。进一步以工作人员拣选每种商品的单位成本和AGV搬运一个货架的成本为权重,构造了订单到批次(类中心)的加权距离。在此基础上设计了K-max聚类算法求解订单分批问题。采用具体算例验证了K-max聚类算法的有效性。 展开更多
关键词 无人仓 货到人 订单 分类型数据 取大运算 K-max聚类算法 加权距离
下载PDF
混合属性数据聚类初始点选择的改进 被引量:3
12
作者 赵立江 黄永青 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第4期220-223,共4页
k-prototypes和模糊k-prototypes是处理数值属性和分类属性混合数据主要的聚类算法。但这两种聚类算法不足之处是对初值有明显的依赖。对初值选取方法进行了分析和研究,提出一种新的改进方法,可在一定程度上减少随机性。实际数据集仿真... k-prototypes和模糊k-prototypes是处理数值属性和分类属性混合数据主要的聚类算法。但这两种聚类算法不足之处是对初值有明显的依赖。对初值选取方法进行了分析和研究,提出一种新的改进方法,可在一定程度上减少随机性。实际数据集仿真结果表明改进算法有更高的稳定性和较强的伸缩性。 展开更多
关键词 聚类 k—modes k—prototypes 分类型数据 相异度
下载PDF
基于子空间算法的批量生产过程配方分析
13
作者 刘珊中 郎新科 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第7期866-870,共5页
在批量生产过程中配方的切换会对系统造成阶跃干扰、对固定参数的控制器和软测量仪表带来一定影响,文章针对此问题用配方聚类的方式对配方分类。针对配方数据是由不同数据类型的大规模高维数据组成的特点,提出了一种改进的子空间算法,... 在批量生产过程中配方的切换会对系统造成阶跃干扰、对固定参数的控制器和软测量仪表带来一定影响,文章针对此问题用配方聚类的方式对配方分类。针对配方数据是由不同数据类型的大规模高维数据组成的特点,提出了一种改进的子空间算法,该算法通过对子空间基本聚类的最相似定义,确定了子空间搜索方向,从而达到配方聚类的目的。实验仿真结果表明:对比于传统的高维数据子空间聚类算法,该算法提高了子空间聚类的精度和伸缩性;对比于前人的配方聚类算法,该算法更适合于高维大规模的分类型配方数据。 展开更多
关键词 批量控制 配方聚类 子空间聚类 分类型数据
下载PDF
一种面向混合型数据聚类的k-prototypes聚类算法 被引量:6
14
作者 贾子琪 宋玲 《小型微型计算机系统》 CSCD 北大核心 2020年第9期1845-1852,共8页
同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和数值型数据之间的占比,γ对聚类结果影响很大.为了避免不同类型数据之间的特征转换和参数调整以及处理高... 同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和数值型数据之间的占比,γ对聚类结果影响很大.为了避免不同类型数据之间的特征转换和参数调整以及处理高维混合型数据聚类中的特征加权问题,提出了基于熵权的分类型相异度系数,量化的数值型相异度系数和适用于混合型数据聚类的混合型相异度系数.提出的相异度系数充分考虑了分类型特征值的重要性和数值型特征值的平均值,并具统一的准则,可以更客观的计算数据对象与簇之间的相异度.此外,将加权的混合型相异度系数应用到经典的k-prototypes算法中,提出了一种面向混合型数据聚类的k-prototypes聚类算法(KPMD).使用UCI真实数据集进行实验,结果验证了KPMD算法的有效性和鲁棒性. 展开更多
关键词 k-prototypes 混合型相异度系数 分类型数据 数值型数据 混合型数据
下载PDF
教学评价数据的离群点检测算法研究 被引量:1
15
作者 李慧 王国强 +2 位作者 郭瑞强 高静伟 暴延敏 《软件》 2017年第4期18-25,共8页
教学评价是大学教学活动中不可缺少的环节,可能出现故意抬高或压低评分及虚假评分的现象,应该找出这些离群数据并加以清除,以提高学生评教数据的正确性。离群点检测问题是数据挖掘技术的重要研究领域之一,本文实验所用教学评价数据属于... 教学评价是大学教学活动中不可缺少的环节,可能出现故意抬高或压低评分及虚假评分的现象,应该找出这些离群数据并加以清除,以提高学生评教数据的正确性。离群点检测问题是数据挖掘技术的重要研究领域之一,本文实验所用教学评价数据属于分类型数据,目前针对分类型数据的离群点检测算法常用的有基于信息熵的贪婪算法和基于频率的AVF算法。针对贪婪算法时间复杂度较高,AVF算法不够准确的问题,本文提出一种改进的基于频率的离群点检测算法。本文算法首先采用改进的k-modes算法对教学评价数据进行聚类,并提出应用调整的余弦相似度公式作为相似性度量,筛选出远离簇中心的候选离群点,最后通过基于频率的离群点检测算法对候选集进行检测。在真实数据集上的实验表明算法在精确度和效率方面均具有优势。 展开更多
关键词 离群点检测 k-modes聚类 余弦相似度 分类型数据
下载PDF
基于k-modes聚类的不平衡数据混合采样方法 被引量:1
16
作者 张艳 江峰 +2 位作者 杜军威 刘国柱 眭跃飞 《济南大学学报(自然科学版)》 北大核心 2017年第6期499-505,共7页
针对现有的不平衡数据处理方法存在不能有效处理分类型数据、盲目采样及抗噪声能力差等问题,提出一种基于k-modes聚类的不平衡数据混合采样算法HS_WODKM;首先提出一种基于加权重叠距离的k-modes聚类算法WODKM,然后采用改进的合成少数过... 针对现有的不平衡数据处理方法存在不能有效处理分类型数据、盲目采样及抗噪声能力差等问题,提出一种基于k-modes聚类的不平衡数据混合采样算法HS_WODKM;首先提出一种基于加权重叠距离的k-modes聚类算法WODKM,然后采用改进的合成少数过采样技术(SMOTE)算法与WODKM分别对不平衡数据进行过采样与降采样处理,从而获得一种新的不平衡数据混合采样算法HS_WODKM;HS_WODKM采用增加正类样本并减少负类样本的混合采样策略解决样本类别不平衡问题,用来处理分类型数据,并且能够克服现有方法存在的抗噪能力差、删除重要样本等缺陷;为了验证HS_WODKM的性能,在多个分类型UCI数据集上进行实验。结果表明,采用HS_WODKM算法处理分类型不平衡数据是可行且有效的。 展开更多
关键词 不平衡数据 分类型数据 k-modes聚类 过采样技术 混合采样
下载PDF
SMOTE过采样及其改进算法研究综述 被引量:52
17
作者 石洪波 陈雨文 陈鑫 《智能系统学报》 CSCD 北大核心 2019年第6期1073-1083,共11页
近年来不平衡分类问题受到广泛关注。SMOTE过采样通过添加生成的少数类样本改变不平衡数据集的数据分布,是改善不平衡数据分类模型性能的流行方法之一。本文首先阐述了SMOTE的原理、算法以及存在的问题,针对SMOTE存在的问题,分别介绍了... 近年来不平衡分类问题受到广泛关注。SMOTE过采样通过添加生成的少数类样本改变不平衡数据集的数据分布,是改善不平衡数据分类模型性能的流行方法之一。本文首先阐述了SMOTE的原理、算法以及存在的问题,针对SMOTE存在的问题,分别介绍了其4种扩展方法和3种应用的相关研究,最后分析了SMOTE应用于大数据、流数据、少量标签数据以及其他类型数据的现有研究和面临的问题,旨在为SMOTE的研究和应用提供有价值的借鉴和参考。 展开更多
关键词 不平衡数据 SMOTE 算法 K-NN 过采样 欠采样 高维数据 分类型数据
下载PDF
基于改进RBF神经网络的银行个人信用评级 被引量:11
18
作者 蓝润荣 程希骏 《中国科学院研究生院学报》 CAS CSCD 北大核心 2013年第3期298-303,共6页
研究RBF神经网络在个人信用评级中的应用.针对传统的RBF神经网络无法处理非数值型数据和对初始中心的选取及异常值十分敏感等问题,提出一种基于模糊K-Prototypes算法的RBF神经网络,提高了处理分类型数据及混合型数据的能力,并且改进的模... 研究RBF神经网络在个人信用评级中的应用.针对传统的RBF神经网络无法处理非数值型数据和对初始中心的选取及异常值十分敏感等问题,提出一种基于模糊K-Prototypes算法的RBF神经网络,提高了处理分类型数据及混合型数据的能力,并且改进的模糊K-Prototypes算法有助于降低模型对初始中心选取和异常值的敏感性.将改进前后的模型分别应用于商业银行的个人信贷评级中,结果表明,改进后的模型预测精度和稳健性都优于传统的RBF模型. 展开更多
关键词 RBF神经网络 模糊K-Prototypes算法 分类型数据 信用评级
下载PDF
基于遗传算法的混合属性聚类初始点选择研究 被引量:2
19
作者 赵立江 《广西师范大学学报(自然科学版)》 CAS 北大核心 2008年第3期194-197,共4页
k-prototypes是处理包含数值属性和分类属性混合数据主要的聚类算法,但由于对初始点的随机选择极易使聚类结果陷入局部最优,导致聚类结果的偏差。为改善聚类结果对初始点的依赖,采用遗传算法对初始点进行全局最优搜索。改进后的方法有... k-prototypes是处理包含数值属性和分类属性混合数据主要的聚类算法,但由于对初始点的随机选择极易使聚类结果陷入局部最优,导致聚类结果的偏差。为改善聚类结果对初始点的依赖,采用遗传算法对初始点进行全局最优搜索。改进后的方法有更高的稳定性和对大数据集更快的收敛速度。数据集仿真结果表明改进算法正确、有效。 展开更多
关键词 遗传算法 聚类 K-MEANS k-prototypes 分类型数据 相异度
下载PDF
基于结构相似性的k-modes算法 被引量:2
20
作者 黄苑华 谢峰 +1 位作者 郝志峰 蔡瑞初 《计算机工程与应用》 CSCD 北大核心 2017年第23期102-107,共6页
聚类是数据挖掘中重要的技术之一,它是按照相似原则将数据进行分类。然而分类型数据的聚类是学习算法中重要而又棘手的问题。传统的k-modes算法采用简单的0-1匹配方法定义两个属性值之间的相异度,没有将整个数据集的分布考虑进来,导致... 聚类是数据挖掘中重要的技术之一,它是按照相似原则将数据进行分类。然而分类型数据的聚类是学习算法中重要而又棘手的问题。传统的k-modes算法采用简单的0-1匹配方法定义两个属性值之间的相异度,没有将整个数据集的分布考虑进来,导致差异性度量不够准确。针对这个问题,提出基于结构相似性的k-modes算法。该算法不仅考虑属性值它们本身的异同,而且考虑了它们在其他属性下所处的结构。从集群识别和准确率两个方面进行仿真实验,表明基于结构相似性的k-modes算法在伸缩性和准确率方面更有效。 展开更多
关键词 聚类 分类型数据 相异度度量 结构相似性 k-modes算法
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部