期刊文献+
共找到58篇文章
< 1 2 3 >
每页显示 20 50 100
一种基于粗糙熵的改进K-modes聚类算法
1
作者 刘财辉 曾雄 谢德华 《南京理工大学学报》 CAS CSCD 北大核心 2024年第3期335-341,共7页
K-modes聚类算法被广泛应用于人工智能、数据挖掘等领域。传统的K-modes聚类算法有不错的聚类效果,但是存在迭代次数多、计算量大、容易受到冗余属性的干扰等问题,且仅采用简单的0-1匹配的方法来定义2个样本属性值之间的距离,没有充分... K-modes聚类算法被广泛应用于人工智能、数据挖掘等领域。传统的K-modes聚类算法有不错的聚类效果,但是存在迭代次数多、计算量大、容易受到冗余属性的干扰等问题,且仅采用简单的0-1匹配的方法来定义2个样本属性值之间的距离,没有充分考虑每个属性对聚类结果的影响。针对上述问题,该文将粗糙熵引入K-modes算法。首先利用粗糙集属性约简算法消除冗余属性,确定各属性的重要程度;然后利用粗糙熵确定每个属性的权重,从而定义新的类内距离。将该文所提算法与传统的K-modes聚类算法分别在4组公开数据集上进行对比试验。试验结果表明,该文所提算法聚类准确率比传统的K-modes聚类算法更高。 展开更多
关键词 聚类 k-modes算法 粗糙集 粗糙熵 属性约简 权重
下载PDF
基于K-modes聚类算法的山东省传统村落空间风貌类型及区划研究 被引量:1
2
作者 范勇 李玄 肖文杰 《小城镇建设》 2024年第5期100-107,共8页
传统村落的类型解析及空间区划是开展传统村落整体性保护和区域性发展的基础前提,本文在对山东省传统村落调查的基础上,基于空间基因理论视角,从地景、聚落、建筑、文化4个层次构建起13个指标的传统村落空间风貌分类指标体系,并采用K-mo... 传统村落的类型解析及空间区划是开展传统村落整体性保护和区域性发展的基础前提,本文在对山东省传统村落调查的基础上,基于空间基因理论视角,从地景、聚落、建筑、文化4个层次构建起13个指标的传统村落空间风貌分类指标体系,并采用K-modes聚类算法对山东省177个传统村落进行聚类分析,得到八大空间风貌类型,进一步结合区域文化、地理特点及行政区划,划分出山东省5个传统村落风貌区,从宏观视角分析了山东省传统村落空间风貌特征及其形成与发展的内在逻辑和地理分布规律,为更加整体全面地认识山东省传统村落特点、开展区域性传统村落集中连片保护利用等工作提供科学参考。 展开更多
关键词 传统村落 空间基因 k-modes聚类算法 空间区划 山东省
下载PDF
K-Modes聚类数据收集和发布过程中的混洗差分隐私保护方法 被引量:1
3
作者 蒋伟进 陈艺琳 +3 位作者 韩裕清 吴玉庭 周为 王海娟 《通信学报》 EI CSCD 北大核心 2024年第1期201-213,共13页
针对目前聚类数据收集与发布安全性不足的问题,为保护聚类数据中的用户隐私并提高数据质量,基于混洗差分隐私模型,提出一种去可信第三方的K-Modes聚类数据收集和发布的隐私保护方法。首先,使用K-Modes聚类数据收集算法对用户数据进行采... 针对目前聚类数据收集与发布安全性不足的问题,为保护聚类数据中的用户隐私并提高数据质量,基于混洗差分隐私模型,提出一种去可信第三方的K-Modes聚类数据收集和发布的隐私保护方法。首先,使用K-Modes聚类数据收集算法对用户数据进行采样并加噪,再通过填补取值域随机排列发布算法打乱采样数据的初始顺序,使恶意攻击者不能根据用户与数据之间的关系识别出目标用户。然后,尽可能减小噪声的干扰,利用循环迭代的方式计算出新的质心完成聚类。最后,从理论层面上分析了以上3种方法的隐私性、可行性和复杂度,并利用3个真实数据集和近年来具有权威性的同类算法KM、DPLM、LDPKM等进行准确率、熵值的对比,验证所提方法的有效性。实验结果表明,所提方法的隐私保护和发布数据质量均优于当前同类算法。 展开更多
关键词 混洗差分隐私 k-modes聚类 隐私保护 数据收集 数据发布
下载PDF
改进的k-modes聚类算法在协同过滤就业推荐算法中的应用
4
作者 刘逗逗 王文发 许淳 《延安大学学报(自然科学版)》 2024年第2期96-100,共5页
为了给高校毕业生提供精准的个性化就业推荐服务,将基于动态权重相互依存距离的改进k-modes聚类算法应用于协同过滤推荐算法中。定义不同样本点属性之间的距离等于属性值内部距离和属性间外部距离的加权和,选择初始簇质心时,动态调整样... 为了给高校毕业生提供精准的个性化就业推荐服务,将基于动态权重相互依存距离的改进k-modes聚类算法应用于协同过滤推荐算法中。定义不同样本点属性之间的距离等于属性值内部距离和属性间外部距离的加权和,选择初始簇质心时,动态调整样本点与簇质心的距离以及簇密度的组合权重,动态设置簇密度计算公式的半径,根据样本点的概率值选出初始簇质心;迭代计算和优化得到满足精度的学生簇和职位簇;构建学生-职位矩阵,计算应届生和往届生的相似度、往届生和入职岗位的相似度,选择二者的相似度超过阈值的应届生簇和职位簇组合为匹配对进行匹配,并将匹配信息降序排列形成匹配列表,依据匹配列表进行双向推荐和信息推送,为高校的就业推荐和指导提供信息导向和技术支持。 展开更多
关键词 双边匹配算法 协同过滤算法 聚类分析 k-modes算法 相似性度量
下载PDF
基于k-modes聚类算法的混洗差分隐私方法
5
作者 祁富 陈丽敏 《牡丹江师范学院学报(自然科学版)》 2024年第2期6-13,共8页
首次提出一种基于k-modes聚类算法的混洗差分隐私保护方案(简称SDPk-modes).SDPk-modes根据每个数据之间的距离划分为不同的组,得到足够的细粒度优化效用,采用基于梯度随机扰动技术使计算最优概率耗时更短;在k-modes聚类过程中,通过将... 首次提出一种基于k-modes聚类算法的混洗差分隐私保护方案(简称SDPk-modes).SDPk-modes根据每个数据之间的距离划分为不同的组,得到足够的细粒度优化效用,采用基于梯度随机扰动技术使计算最优概率耗时更短;在k-modes聚类过程中,通过将数据中频繁出现的特征向量作为聚类中心点,基于属性熵的距离度量方法,加快算法收敛至聚类中心的速度,解决原始算法聚类速度慢、易陷入局部最优等问题,显著提高聚类的效果.实验验证表明,本文提出的方案优于当前同类方案. 展开更多
关键词 混洗差分隐私 k-modes 随机响应机制 隐私保护
下载PDF
基于粗糙集的改进K-Modes聚类算法 被引量:15
6
作者 白亮 梁吉业 曹付元 《计算机科学》 CSCD 北大核心 2009年第1期162-164,176,共4页
传统的K-Modes算法采用简单匹配的方法来计算对象之间的距离,并没有充分考虑同一属性下的两个不同值之间的相似性。基于粗糙集中的上、下近似,提出了一种新的距离度量,并重新定义了类中心,对传统K-Modes算法进行了改进。与其他改进K-Mo... 传统的K-Modes算法采用简单匹配的方法来计算对象之间的距离,并没有充分考虑同一属性下的两个不同值之间的相似性。基于粗糙集中的上、下近似,提出了一种新的距离度量,并重新定义了类中心,对传统K-Modes算法进行了改进。与其他改进K-Modes算法进行了比较,实验结果表明,基于粗糙集的改进K-Modes算法有效地提高了聚类精度。 展开更多
关键词 聚类算法 粗糙集 距离度量 k-modes算法
下载PDF
模糊K-Modes聚类精确度分析 被引量:14
7
作者 赵恒 杨万海 《计算机工程》 CAS CSCD 北大核心 2003年第12期27-28,175,共3页
模糊K-Modes聚类算法是对具有分类属性的数据进行聚类的一种有效的算法。为了评价聚类结果,以具有明确分类结构的数据作为输入数据,将模糊K-Modes聚类结果与原始数据的分类结构进行对比,分析了确定它们之间对应关系的方法,在期望聚... 模糊K-Modes聚类算法是对具有分类属性的数据进行聚类的一种有效的算法。为了评价聚类结果,以具有明确分类结构的数据作为输入数据,将模糊K-Modes聚类结果与原始数据的分类结构进行对比,分析了确定它们之间对应关系的方法,在期望聚类结果应该具有的特点的基础上,对现有的精确度定义和计算方法进行修正,在划分相似度的基础上,重新定义模糊K-Modes聚类精确度。 展开更多
关键词 模糊k-modes聚类 精确度 分类属性 相似度
下载PDF
基于本地差分隐私的K-modes聚类数据隐私保护方法 被引量:8
8
作者 张少波 原刘杰 +1 位作者 毛新军 朱更明 《电子学报》 EI CAS CSCD 北大核心 2022年第9期2181-2188,共8页
分类型数据聚类是数据挖掘的重要研究内容,聚类数据中通常包含用户一些敏感信息.为保护聚类数据中的用户隐私,当前主要采用基于可信第三方隐私保护模型,但现实中第三方也存在隐私泄露风险.针对此问题,该文引入本地差分隐私技术,提出一... 分类型数据聚类是数据挖掘的重要研究内容,聚类数据中通常包含用户一些敏感信息.为保护聚类数据中的用户隐私,当前主要采用基于可信第三方隐私保护模型,但现实中第三方也存在隐私泄露风险.针对此问题,该文引入本地差分隐私技术,提出一种去可信第三方的K-modes聚类数据隐私保护方法.该方法首先利用随机采样技术对数据进行采样,然后使用本地差分隐私技术对采样数据进行扰动,最后通过聚类服务端与用户的交互迭代完成聚类.在聚类过程中,无需可信第三方对数据进行隐私预处理,避免了第三方泄露用户隐私的风险.理论分析证明了该方法的隐私性和可行性,实验结果表明该方法在满足本地差分隐私机制的前提下保证了聚类结果的质量. 展开更多
关键词 隐私保护 本地差分隐私 数据挖掘 k-modes聚类 去可信第三方
下载PDF
基于分类型矩阵对象数据的MD fuzzy k-modes聚类算法 被引量:10
9
作者 李顺勇 张苗苗 曹付元 《计算机研究与发展》 EI CSCD 北大核心 2019年第6期1325-1337,共13页
传统的聚类算法一般是对单值属性数据进行聚类.但在许多实际应用中,每个对象通常被多个特征向量所描述.例如,顾客在购物时可能同时购买多个产品.由多个特征向量描述的对象称为矩阵对象,由矩阵对象构成的数据集称为矩阵对象数据集.目前,... 传统的聚类算法一般是对单值属性数据进行聚类.但在许多实际应用中,每个对象通常被多个特征向量所描述.例如,顾客在购物时可能同时购买多个产品.由多个特征向量描述的对象称为矩阵对象,由矩阵对象构成的数据集称为矩阵对象数据集.目前,针对矩阵对象数据聚类算法的研究相对较少,还有很多问题有待解决.利用fuzzy k-modes算法的聚类过程,提出一种基于矩阵对象数据的matrix-object data fuzzy k-modes(MD fuzzy k-modes)聚类算法.该算法结合模糊集的概念引入模糊因子β,重新定义了矩阵对象间的相异性度量,并给出类中心的启发式更新算法.最后,在5个真实数据集上验证了MD fuzzy k-modes算法的有效性,并分析了模糊因子β与隶属度w之间的关系.大数据时代,利用MD fuzzy k-modes算法对多条记录进行聚类,能更易发现顾客的消费偏好,从而做出更有针对性的推荐. 展开更多
关键词 矩阵对象数据 MD FUZZY k-modes算法 相异性度量 类中心 聚类
下载PDF
基于K-modes聚类的半导体封装测试粗日投料控制 被引量:1
10
作者 姚丽丽 史海波 刘昶 《计算机集成制造系统》 EI CSCD 北大核心 2014年第7期1743-1750,共8页
针对半导体封装测试粗日投料控制问题,以降低生产过程中的改机代价为目标,提出一种新的基于品种聚类的综合投料控制策略。提出一种新的改进量限定属性赋权K-modes算法对投产品种进行聚类,以瓶颈工序的产能类型个数作为聚类类别个数,同... 针对半导体封装测试粗日投料控制问题,以降低生产过程中的改机代价为目标,提出一种新的基于品种聚类的综合投料控制策略。提出一种新的改进量限定属性赋权K-modes算法对投产品种进行聚类,以瓶颈工序的产能类型个数作为聚类类别个数,同时对各个类别的聚类数目进行限定,依据影响改机代价的投产品种属性信息对投产品种进行聚类。在聚类的基础上,采用基于品种平均和投产量平均结合的综合投料策略确定日投产品种和数量。通过实验验证了所提策略的有效性和优越性。 展开更多
关键词 半导体封装测试 粗日投料控制策略 改机代价 k-modes聚类算法
下载PDF
基于MapReduce自适应参数的粗糙K-modes算法研究
11
作者 杨阳 张为群 +1 位作者 刘枫 黄仁杰 《计算机科学》 CSCD 北大核心 2012年第11期149-152,164,共5页
粗糙K-modes聚类算法需要根据经验为wl、wu和ε3个参数设定其固定值,聚类效果不稳定,容易受到噪声干扰。提出一种基于MapReduce自适应参数的粗糙K-modes算法,它根据聚类不同阶段的特点自动调整参数值,优化聚类效果。在此基础上,对自适... 粗糙K-modes聚类算法需要根据经验为wl、wu和ε3个参数设定其固定值,聚类效果不稳定,容易受到噪声干扰。提出一种基于MapReduce自适应参数的粗糙K-modes算法,它根据聚类不同阶段的特点自动调整参数值,优化聚类效果。在此基础上,对自适应参数的粗糙K-modes算法进行MapReduce并行化设计,以提高算法的运行效率。实验证明,提出的自适应参数的粗糙K-modes算法聚类效果稳定,通过对算法的并行设计提高了算法对大规模数据的聚类分析性能。 展开更多
关键词 粗糙k-modes 自适应参数 MapReduce并行化
下载PDF
基于距离和密度双度量的模糊k-modes算法
12
作者 刘培奇 胡红光 +1 位作者 张凯 黄苗 《工业控制计算机》 2015年第9期90-91,94,共3页
大多数模糊k-modes的相关改进算法仅关注对象之间的距离,并未关注对象的空间分布对于聚类的影响。将距离和密度双度量的测度方法引入模糊k-modes算法进行改进,该方法将对象的空间分布考虑在内,从而以一种更加合理的方式更新对象的隶属... 大多数模糊k-modes的相关改进算法仅关注对象之间的距离,并未关注对象的空间分布对于聚类的影响。将距离和密度双度量的测度方法引入模糊k-modes算法进行改进,该方法将对象的空间分布考虑在内,从而以一种更加合理的方式更新对象的隶属度。通过来自于UCI机器学习库的数据集测试算法改进前与改进后的性能,算法改进后的聚类正确率高于改进前的,证明算法改进后性能更好。 展开更多
关键词 模糊k-modes 距离 密度 隶属度 UCI机器学习库
下载PDF
基于离散小波变换和模糊K-modes的负荷聚类算法 被引量:24
13
作者 张江林 张亚超 +2 位作者 洪居华 高红均 刘俊勇 《电力自动化设备》 EI CSCD 北大核心 2019年第2期100-106,122,共8页
为了研究智能电网背景下用户的用电模式,考虑到现有聚类算法的不足,提出了一种基于离散小波变换的模糊K-modes聚类算法。利用离散小波变换将时域的负荷曲线转换到频域,从而将负荷曲线的不同特征隔离在不同的频域水平,并利用低阶近似的... 为了研究智能电网背景下用户的用电模式,考虑到现有聚类算法的不足,提出了一种基于离散小波变换的模糊K-modes聚类算法。利用离散小波变换将时域的负荷曲线转换到频域,从而将负荷曲线的不同特征隔离在不同的频域水平,并利用低阶近似的思想选取原始曲线的有效分量曲线;对所选的分量曲线进行趋势编码,将连续负荷数据转化为离散类属性数据;基于平均密度确定初始聚类条件,利用模糊K-modes聚类算法对曲线进行形态聚类,得到负荷曲线模板;将所提算法与传统K-means算法及层次聚类算法进行比较,从而验证了所提算法的有效性。 展开更多
关键词 智能电网 负荷聚类 离散小波变换 模糊k-modes聚类算法 用电模式
下载PDF
基于K-modes聚类算法的辽宁传统村落划分及保护策略
14
作者 张宇 杜晓月 董丽 《住宅产业》 2023年第5期22-26,共5页
本文基于传统村落的自然环境、人文历史、民居建筑等分类特征,使用K-modes聚类算法,对辽宁省30个国家级传统村落进行聚类划分,将其整合为景区依托型、民族特色型、生态文化型、休闲观光型、文化遗产型共五个类别,最后根据归纳的聚类典... 本文基于传统村落的自然环境、人文历史、民居建筑等分类特征,使用K-modes聚类算法,对辽宁省30个国家级传统村落进行聚类划分,将其整合为景区依托型、民族特色型、生态文化型、休闲观光型、文化遗产型共五个类别,最后根据归纳的聚类典型特征,提出有针对性的辽宁省传统村落保护发展策略。 展开更多
关键词 辽宁地区 传统村落 k-modes聚类
下载PDF
基于MapReduce的并行k-modes算法
15
作者 郭涛 丁祥武 《智能计算机与应用》 2015年第1期43-45,共3页
k-modes是一种代表性的分类数据的聚类算法。首先对k-modes聚类算法的实现过程进行了改进:通过在分配数据对象到簇时更新这个簇中各个属性项的次数,使得在遍历一次全部数据对象就能计算出新的簇中心。为了使k-modes能够处理大规模分类数... k-modes是一种代表性的分类数据的聚类算法。首先对k-modes聚类算法的实现过程进行了改进:通过在分配数据对象到簇时更新这个簇中各个属性项的次数,使得在遍历一次全部数据对象就能计算出新的簇中心。为了使k-modes能够处理大规模分类数据,在Hadoop平台上用MapReduce并行计算模型实现了k-modes算法。实验表明:在处理大量数据时,并行k-modes比串行k-modes极大地缩短了聚类时间,取得了较好的加速比。 展开更多
关键词 分类数据 k-modes 并行聚类 MAPREDUCE
下载PDF
基于相互依存冗余度量的k-modes算法 被引量:5
16
作者 黄苑华 郝志峰 +1 位作者 蔡瑞初 谢峰 《小型微型计算机系统》 CSCD 北大核心 2016年第8期1790-1793,共4页
距离度量是聚类算法的基础,它对算法的效果有很大的影响.然而分类型数据的聚类是学习算法中重要而棘手的问题.传统的k-modes算法采用0-1匹配方法定义每两个对象属性值之间的距离,忽视了属性间的相互关系对距离的影响.针对这个问题,本文... 距离度量是聚类算法的基础,它对算法的效果有很大的影响.然而分类型数据的聚类是学习算法中重要而棘手的问题.传统的k-modes算法采用0-1匹配方法定义每两个对象属性值之间的距离,忽视了属性间的相互关系对距离的影响.针对这个问题,本文基于相互依存冗余度量定义了一种新的距离,该距离由内部距离和外部距离两个部分决定.这种度量方法不仅表现出某个属性本身的差异性,而且表现出其他属性对该属性的影响程度.本文与基于其他距离度量的k-modes算法进行实验比较,结果表明基于相互依存冗余度量的k-modes算法能有效地提高算法的聚类精度. 展开更多
关键词 k-modes算法 分类型属性 相互依存冗余度量
下载PDF
基于结构相似性的k-modes算法 被引量:2
17
作者 黄苑华 谢峰 +1 位作者 郝志峰 蔡瑞初 《计算机工程与应用》 CSCD 北大核心 2017年第23期102-107,共6页
聚类是数据挖掘中重要的技术之一,它是按照相似原则将数据进行分类。然而分类型数据的聚类是学习算法中重要而又棘手的问题。传统的k-modes算法采用简单的0-1匹配方法定义两个属性值之间的相异度,没有将整个数据集的分布考虑进来,导致... 聚类是数据挖掘中重要的技术之一,它是按照相似原则将数据进行分类。然而分类型数据的聚类是学习算法中重要而又棘手的问题。传统的k-modes算法采用简单的0-1匹配方法定义两个属性值之间的相异度,没有将整个数据集的分布考虑进来,导致差异性度量不够准确。针对这个问题,提出基于结构相似性的k-modes算法。该算法不仅考虑属性值它们本身的异同,而且考虑了它们在其他属性下所处的结构。从集群识别和准确率两个方面进行仿真实验,表明基于结构相似性的k-modes算法在伸缩性和准确率方面更有效。 展开更多
关键词 聚类分析 分类型数据 相异度度量 结构相似性 k-modes算法
下载PDF
属性赋权的K-Modes算法优化 被引量:3
18
作者 李仁侃 叶东毅 《计算机科学与探索》 CSCD 2012年第1期90-96,共7页
传统K-Modes算法的一个主要问题是属性选择问题。K-Modes算法在聚类过程中对每一个属性都同等看待,而在实际应用中,很多数据集仅有几个重要属性对聚类起作用。为了考虑不同属性对聚类的不同影响,将K-Modes聚类算法与属性权重的最优化结... 传统K-Modes算法的一个主要问题是属性选择问题。K-Modes算法在聚类过程中对每一个属性都同等看待,而在实际应用中,很多数据集仅有几个重要属性对聚类起作用。为了考虑不同属性对聚类的不同影响,将K-Modes聚类算法与属性权重的最优化结合起来,提出一种属性自动赋权的FW-K-Modes算法。该算法不仅可以提高传统K-Modes聚类算法的聚类精度,还能分析各维属性对聚类的贡献程度,实现关键属性的选择。对多个UCI数据集进行了实验,验证了该算法的优良特性。 展开更多
关键词 k-modes聚类 属性选择 自动属性赋权
下载PDF
基于K-modes聚类算法的安徽历史文化名村分类及保护发展策略
19
作者 张泉 薛珊珊 邹成东 《华中建筑》 2023年第1期23-27,共5页
以安徽省44个省级以上历史文化名村为研究对象,分析其空间分布特征与保护管理现状,并探讨影响其类型划分的具体因素。同时,借鉴学者关于历史文化名村和传统村落分类的研究,以地理条件、产业经济、社会生活、历史文化为主要维度,构建形... 以安徽省44个省级以上历史文化名村为研究对象,分析其空间分布特征与保护管理现状,并探讨影响其类型划分的具体因素。同时,借鉴学者关于历史文化名村和传统村落分类的研究,以地理条件、产业经济、社会生活、历史文化为主要维度,构建形成安徽历史文化名村类型划分的指标体系。基于此,运用K-modes聚类算法,将安徽历史文化名村划分为生态宜居型、文旅资源型、特色民俗型、综合发展型四种类型,并总结各类历史文化名村的典型特征,进而提出相应的保护与发展策略。 展开更多
关键词 历史文化名村 k-modes 聚类算法 保护发展策略 安徽
下载PDF
基于K-modes的安全算法抵御SSDF攻击
20
作者 陈玲玲 沈宣 《电脑与电信》 2023年第7期27-30,共4页
为保障频谱感知安全,针对协作频谱感知中频谱感知数据篡改攻击,在集中式认知无线电网络中提出了一种基于K-modes的安全算法抵御此类攻击。利用K-modes算法对在融合中心收集到的次用户感知报告进行分类,在识别并剔除攻击者后,最后通过低... 为保障频谱感知安全,针对协作频谱感知中频谱感知数据篡改攻击,在集中式认知无线电网络中提出了一种基于K-modes的安全算法抵御此类攻击。利用K-modes算法对在融合中心收集到的次用户感知报告进行分类,在识别并剔除攻击者后,最后通过低复杂度的传统投票规则获得更高的网络感知性能。通过Python仿真,分析该算法在不同条件下对攻击者的识别性能,并验证该算法比传统防御算法的检测概率提高了约37%。 展开更多
关键词 认知无线电 集中式协作频谱感知 SSDF k-modes 传统防御算法
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部