期刊文献+
共找到57篇文章
< 1 2 3 >
每页显示 20 50 100
一种基于粗糙熵的改进K-modes聚类算法
1
作者 刘财辉 曾雄 谢德华 《南京理工大学学报》 CAS CSCD 北大核心 2024年第3期335-341,共7页
K-modes聚类算法被广泛应用于人工智能、数据挖掘等领域。传统的K-modes聚类算法有不错的聚类效果,但是存在迭代次数多、计算量大、容易受到冗余属性的干扰等问题,且仅采用简单的0-1匹配的方法来定义2个样本属性值之间的距离,没有充分... K-modes聚类算法被广泛应用于人工智能、数据挖掘等领域。传统的K-modes聚类算法有不错的聚类效果,但是存在迭代次数多、计算量大、容易受到冗余属性的干扰等问题,且仅采用简单的0-1匹配的方法来定义2个样本属性值之间的距离,没有充分考虑每个属性对聚类结果的影响。针对上述问题,该文将粗糙熵引入K-modes算法。首先利用粗糙集属性约简算法消除冗余属性,确定各属性的重要程度;然后利用粗糙熵确定每个属性的权重,从而定义新的类内距离。将该文所提算法与传统的K-modes聚类算法分别在4组公开数据集上进行对比试验。试验结果表明,该文所提算法聚类准确率比传统的K-modes聚类算法更高。 展开更多
关键词 聚类 k-modes算法 粗糙集 粗糙熵 属性约简 权重
下载PDF
基于K-modes聚类算法的山东省传统村落空间风貌类型及区划研究 被引量:1
2
作者 范勇 李玄 肖文杰 《小城镇建设》 2024年第5期100-107,共8页
传统村落的类型解析及空间区划是开展传统村落整体性保护和区域性发展的基础前提,本文在对山东省传统村落调查的基础上,基于空间基因理论视角,从地景、聚落、建筑、文化4个层次构建起13个指标的传统村落空间风貌分类指标体系,并采用K-mo... 传统村落的类型解析及空间区划是开展传统村落整体性保护和区域性发展的基础前提,本文在对山东省传统村落调查的基础上,基于空间基因理论视角,从地景、聚落、建筑、文化4个层次构建起13个指标的传统村落空间风貌分类指标体系,并采用K-modes聚类算法对山东省177个传统村落进行聚类分析,得到八大空间风貌类型,进一步结合区域文化、地理特点及行政区划,划分出山东省5个传统村落风貌区,从宏观视角分析了山东省传统村落空间风貌特征及其形成与发展的内在逻辑和地理分布规律,为更加整体全面地认识山东省传统村落特点、开展区域性传统村落集中连片保护利用等工作提供科学参考。 展开更多
关键词 传统村落 空间基因 k-modes聚类算法 空间区划 山东省
下载PDF
K-Modes聚类数据收集和发布过程中的混洗差分隐私保护方法 被引量:1
3
作者 蒋伟进 陈艺琳 +3 位作者 韩裕清 吴玉庭 周为 王海娟 《通信学报》 EI CSCD 北大核心 2024年第1期201-213,共13页
针对目前聚类数据收集与发布安全性不足的问题,为保护聚类数据中的用户隐私并提高数据质量,基于混洗差分隐私模型,提出一种去可信第三方的K-Modes聚类数据收集和发布的隐私保护方法。首先,使用K-Modes聚类数据收集算法对用户数据进行采... 针对目前聚类数据收集与发布安全性不足的问题,为保护聚类数据中的用户隐私并提高数据质量,基于混洗差分隐私模型,提出一种去可信第三方的K-Modes聚类数据收集和发布的隐私保护方法。首先,使用K-Modes聚类数据收集算法对用户数据进行采样并加噪,再通过填补取值域随机排列发布算法打乱采样数据的初始顺序,使恶意攻击者不能根据用户与数据之间的关系识别出目标用户。然后,尽可能减小噪声的干扰,利用循环迭代的方式计算出新的质心完成聚类。最后,从理论层面上分析了以上3种方法的隐私性、可行性和复杂度,并利用3个真实数据集和近年来具有权威性的同类算法KM、DPLM、LDPKM等进行准确率、熵值的对比,验证所提方法的有效性。实验结果表明,所提方法的隐私保护和发布数据质量均优于当前同类算法。 展开更多
关键词 混洗差分隐私 k-modes聚类 隐私保护 数据收集 数据发布
下载PDF
改进的k-modes聚类算法在协同过滤就业推荐算法中的应用
4
作者 刘逗逗 王文发 许淳 《延安大学学报(自然科学版)》 2024年第2期96-100,共5页
为了给高校毕业生提供精准的个性化就业推荐服务,将基于动态权重相互依存距离的改进k-modes聚类算法应用于协同过滤推荐算法中。定义不同样本点属性之间的距离等于属性值内部距离和属性间外部距离的加权和,选择初始簇质心时,动态调整样... 为了给高校毕业生提供精准的个性化就业推荐服务,将基于动态权重相互依存距离的改进k-modes聚类算法应用于协同过滤推荐算法中。定义不同样本点属性之间的距离等于属性值内部距离和属性间外部距离的加权和,选择初始簇质心时,动态调整样本点与簇质心的距离以及簇密度的组合权重,动态设置簇密度计算公式的半径,根据样本点的概率值选出初始簇质心;迭代计算和优化得到满足精度的学生簇和职位簇;构建学生-职位矩阵,计算应届生和往届生的相似度、往届生和入职岗位的相似度,选择二者的相似度超过阈值的应届生簇和职位簇组合为匹配对进行匹配,并将匹配信息降序排列形成匹配列表,依据匹配列表进行双向推荐和信息推送,为高校的就业推荐和指导提供信息导向和技术支持。 展开更多
关键词 双边匹配算法 协同过滤算法 聚类分析 k-modes算法 相似性度量
下载PDF
基于k-modes聚类算法的混洗差分隐私方法
5
作者 祁富 陈丽敏 《牡丹江师范学院学报(自然科学版)》 2024年第2期6-13,共8页
首次提出一种基于k-modes聚类算法的混洗差分隐私保护方案(简称SDPk-modes).SDPk-modes根据每个数据之间的距离划分为不同的组,得到足够的细粒度优化效用,采用基于梯度随机扰动技术使计算最优概率耗时更短;在k-modes聚类过程中,通过将... 首次提出一种基于k-modes聚类算法的混洗差分隐私保护方案(简称SDPk-modes).SDPk-modes根据每个数据之间的距离划分为不同的组,得到足够的细粒度优化效用,采用基于梯度随机扰动技术使计算最优概率耗时更短;在k-modes聚类过程中,通过将数据中频繁出现的特征向量作为聚类中心点,基于属性熵的距离度量方法,加快算法收敛至聚类中心的速度,解决原始算法聚类速度慢、易陷入局部最优等问题,显著提高聚类的效果.实验验证表明,本文提出的方案优于当前同类方案. 展开更多
关键词 混洗差分隐私 k-modes 随机响应机制 隐私保护
下载PDF
基于K-modes聚类算法的辽宁传统村落划分及保护策略
6
作者 张宇 杜晓月 董丽 《住宅产业》 2023年第5期22-26,共5页
本文基于传统村落的自然环境、人文历史、民居建筑等分类特征,使用K-modes聚类算法,对辽宁省30个国家级传统村落进行聚类划分,将其整合为景区依托型、民族特色型、生态文化型、休闲观光型、文化遗产型共五个类别,最后根据归纳的聚类典... 本文基于传统村落的自然环境、人文历史、民居建筑等分类特征,使用K-modes聚类算法,对辽宁省30个国家级传统村落进行聚类划分,将其整合为景区依托型、民族特色型、生态文化型、休闲观光型、文化遗产型共五个类别,最后根据归纳的聚类典型特征,提出有针对性的辽宁省传统村落保护发展策略。 展开更多
关键词 辽宁地区 传统村落 k-modes聚类
下载PDF
基于K-modes聚类算法的安徽历史文化名村分类及保护发展策略
7
作者 张泉 薛珊珊 邹成东 《华中建筑》 2023年第1期23-27,共5页
以安徽省44个省级以上历史文化名村为研究对象,分析其空间分布特征与保护管理现状,并探讨影响其类型划分的具体因素。同时,借鉴学者关于历史文化名村和传统村落分类的研究,以地理条件、产业经济、社会生活、历史文化为主要维度,构建形... 以安徽省44个省级以上历史文化名村为研究对象,分析其空间分布特征与保护管理现状,并探讨影响其类型划分的具体因素。同时,借鉴学者关于历史文化名村和传统村落分类的研究,以地理条件、产业经济、社会生活、历史文化为主要维度,构建形成安徽历史文化名村类型划分的指标体系。基于此,运用K-modes聚类算法,将安徽历史文化名村划分为生态宜居型、文旅资源型、特色民俗型、综合发展型四种类型,并总结各类历史文化名村的典型特征,进而提出相应的保护与发展策略。 展开更多
关键词 历史文化名村 k-modes 聚类算法 保护发展策略 安徽
下载PDF
基于K-modes的安全算法抵御SSDF攻击
8
作者 陈玲玲 沈宣 《电脑与电信》 2023年第7期27-30,共4页
为保障频谱感知安全,针对协作频谱感知中频谱感知数据篡改攻击,在集中式认知无线电网络中提出了一种基于K-modes的安全算法抵御此类攻击。利用K-modes算法对在融合中心收集到的次用户感知报告进行分类,在识别并剔除攻击者后,最后通过低... 为保障频谱感知安全,针对协作频谱感知中频谱感知数据篡改攻击,在集中式认知无线电网络中提出了一种基于K-modes的安全算法抵御此类攻击。利用K-modes算法对在融合中心收集到的次用户感知报告进行分类,在识别并剔除攻击者后,最后通过低复杂度的传统投票规则获得更高的网络感知性能。通过Python仿真,分析该算法在不同条件下对攻击者的识别性能,并验证该算法比传统防御算法的检测概率提高了约37%。 展开更多
关键词 认知无线电 集中式协作频谱感知 SSDF k-modes 传统防御算法
下载PDF
一种基于属性值权重的k-modes聚类分析算法 被引量:1
9
作者 郝荣丽 胡立华 《计算机与数字工程》 2023年第5期1001-1004,1119,共5页
针对k-modes方法未考虑各属性值在属性空间的分布特征而导致分类变量间差异性度量不准确的问题,提出了一种基于属性值权重的k-modes聚类分析算法。该算法利用属性值之间的差异和属性值的权重,重新定义了相异度度量公式;采用属性值频率... 针对k-modes方法未考虑各属性值在属性空间的分布特征而导致分类变量间差异性度量不准确的问题,提出了一种基于属性值权重的k-modes聚类分析算法。该算法利用属性值之间的差异和属性值的权重,重新定义了相异度度量公式;采用属性值频率和各属性值的权重,给出一种聚类中心更新迭代公式,有效地体现了属性值在属性空间中的分布特征和属性之间的重要性差异;采用UCI数据集,验证了算法的有效性。 展开更多
关键词 聚类分析 k-modes 属性值权重 属性值频率 相异度度量
下载PDF
非独立同分布下的K-Modes算法
10
作者 周慧鑫 姜合 王艳梅 《计算机工程与设计》 北大核心 2023年第1期182-187,共6页
传统的K-Modes算法中,初始聚类中心是随机选取的,聚类结果过分依赖初始聚类中心的选择,影响聚类效果。在很多K-Modes算法的研究中假设数据是独立同分布的,在现实的数据中,数据对象和属性之间是根据某些耦合关系彼此关联的,是非独立同分... 传统的K-Modes算法中,初始聚类中心是随机选取的,聚类结果过分依赖初始聚类中心的选择,影响聚类效果。在很多K-Modes算法的研究中假设数据是独立同分布的,在现实的数据中,数据对象和属性之间是根据某些耦合关系彼此关联的,是非独立同分布的。针对这两方面问题,通过基于层次聚类进行预聚类的方法改进选取初始中心的方法,引入非独立同分布思想计算相异度量,进行实验验证。实验结果表明,通过改进初始中心的选取方法和相异度量的计算方法很好改进了K-Modes算法,提高了算法的聚类精度。 展开更多
关键词 k-modes算法 初始中心 独立同分布 非独立同分布 耦合关系 层次聚类 相异度度量
下载PDF
基于粗糙集的改进K-Modes聚类算法 被引量:15
11
作者 白亮 梁吉业 曹付元 《计算机科学》 CSCD 北大核心 2009年第1期162-164,176,共4页
传统的K-Modes算法采用简单匹配的方法来计算对象之间的距离,并没有充分考虑同一属性下的两个不同值之间的相似性。基于粗糙集中的上、下近似,提出了一种新的距离度量,并重新定义了类中心,对传统K-Modes算法进行了改进。与其他改进K-Mo... 传统的K-Modes算法采用简单匹配的方法来计算对象之间的距离,并没有充分考虑同一属性下的两个不同值之间的相似性。基于粗糙集中的上、下近似,提出了一种新的距离度量,并重新定义了类中心,对传统K-Modes算法进行了改进。与其他改进K-Modes算法进行了比较,实验结果表明,基于粗糙集的改进K-Modes算法有效地提高了聚类精度。 展开更多
关键词 聚类算法 粗糙集 距离度量 k-modes算法
下载PDF
基于本地差分隐私的K-modes聚类数据隐私保护方法 被引量:7
12
作者 张少波 原刘杰 +1 位作者 毛新军 朱更明 《电子学报》 EI CAS CSCD 北大核心 2022年第9期2181-2188,共8页
分类型数据聚类是数据挖掘的重要研究内容,聚类数据中通常包含用户一些敏感信息.为保护聚类数据中的用户隐私,当前主要采用基于可信第三方隐私保护模型,但现实中第三方也存在隐私泄露风险.针对此问题,该文引入本地差分隐私技术,提出一... 分类型数据聚类是数据挖掘的重要研究内容,聚类数据中通常包含用户一些敏感信息.为保护聚类数据中的用户隐私,当前主要采用基于可信第三方隐私保护模型,但现实中第三方也存在隐私泄露风险.针对此问题,该文引入本地差分隐私技术,提出一种去可信第三方的K-modes聚类数据隐私保护方法.该方法首先利用随机采样技术对数据进行采样,然后使用本地差分隐私技术对采样数据进行扰动,最后通过聚类服务端与用户的交互迭代完成聚类.在聚类过程中,无需可信第三方对数据进行隐私预处理,避免了第三方泄露用户隐私的风险.理论分析证明了该方法的隐私性和可行性,实验结果表明该方法在满足本地差分隐私机制的前提下保证了聚类结果的质量. 展开更多
关键词 隐私保护 本地差分隐私 数据挖掘 k-modes聚类 去可信第三方
下载PDF
模糊K-Modes聚类精确度分析 被引量:14
13
作者 赵恒 杨万海 《计算机工程》 CAS CSCD 北大核心 2003年第12期27-28,175,共3页
模糊K-Modes聚类算法是对具有分类属性的数据进行聚类的一种有效的算法。为了评价聚类结果,以具有明确分类结构的数据作为输入数据,将模糊K-Modes聚类结果与原始数据的分类结构进行对比,分析了确定它们之间对应关系的方法,在期望聚... 模糊K-Modes聚类算法是对具有分类属性的数据进行聚类的一种有效的算法。为了评价聚类结果,以具有明确分类结构的数据作为输入数据,将模糊K-Modes聚类结果与原始数据的分类结构进行对比,分析了确定它们之间对应关系的方法,在期望聚类结果应该具有的特点的基础上,对现有的精确度定义和计算方法进行修正,在划分相似度的基础上,重新定义模糊K-Modes聚类精确度。 展开更多
关键词 模糊k-modes聚类 精确度 分类属性 相似度
下载PDF
基于分类型矩阵对象数据的MD fuzzy k-modes聚类算法 被引量:10
14
作者 李顺勇 张苗苗 曹付元 《计算机研究与发展》 EI CSCD 北大核心 2019年第6期1325-1337,共13页
传统的聚类算法一般是对单值属性数据进行聚类.但在许多实际应用中,每个对象通常被多个特征向量所描述.例如,顾客在购物时可能同时购买多个产品.由多个特征向量描述的对象称为矩阵对象,由矩阵对象构成的数据集称为矩阵对象数据集.目前,... 传统的聚类算法一般是对单值属性数据进行聚类.但在许多实际应用中,每个对象通常被多个特征向量所描述.例如,顾客在购物时可能同时购买多个产品.由多个特征向量描述的对象称为矩阵对象,由矩阵对象构成的数据集称为矩阵对象数据集.目前,针对矩阵对象数据聚类算法的研究相对较少,还有很多问题有待解决.利用fuzzy k-modes算法的聚类过程,提出一种基于矩阵对象数据的matrix-object data fuzzy k-modes(MD fuzzy k-modes)聚类算法.该算法结合模糊集的概念引入模糊因子β,重新定义了矩阵对象间的相异性度量,并给出类中心的启发式更新算法.最后,在5个真实数据集上验证了MD fuzzy k-modes算法的有效性,并分析了模糊因子β与隶属度w之间的关系.大数据时代,利用MD fuzzy k-modes算法对多条记录进行聚类,能更易发现顾客的消费偏好,从而做出更有针对性的推荐. 展开更多
关键词 矩阵对象数据 MD FUZZY k-modes算法 相异性度量 类中心 聚类
下载PDF
基于K-modes聚类的半导体封装测试粗日投料控制 被引量:1
15
作者 姚丽丽 史海波 刘昶 《计算机集成制造系统》 EI CSCD 北大核心 2014年第7期1743-1750,共8页
针对半导体封装测试粗日投料控制问题,以降低生产过程中的改机代价为目标,提出一种新的基于品种聚类的综合投料控制策略。提出一种新的改进量限定属性赋权K-modes算法对投产品种进行聚类,以瓶颈工序的产能类型个数作为聚类类别个数,同... 针对半导体封装测试粗日投料控制问题,以降低生产过程中的改机代价为目标,提出一种新的基于品种聚类的综合投料控制策略。提出一种新的改进量限定属性赋权K-modes算法对投产品种进行聚类,以瓶颈工序的产能类型个数作为聚类类别个数,同时对各个类别的聚类数目进行限定,依据影响改机代价的投产品种属性信息对投产品种进行聚类。在聚类的基础上,采用基于品种平均和投产量平均结合的综合投料策略确定日投产品种和数量。通过实验验证了所提策略的有效性和优越性。 展开更多
关键词 半导体封装测试 粗日投料控制策略 改机代价 k-modes聚类算法
下载PDF
基于改进K-modes聚类的KNN分类算法 被引量:23
16
作者 王志华 刘绍廷 罗齐 《计算机工程与设计》 北大核心 2019年第8期2228-2234,共7页
为解决K-modes算法初始化k簇时误差率较高和KNN(K最近邻算法)算法面对大样本数据量时分类不准确的现状,分析传统的K-modes算法从k簇的初始化到簇中心不再变化的全过程和KNN(K最近邻算法)算法在面对大样本数据时执行效率低下的问题,提出... 为解决K-modes算法初始化k簇时误差率较高和KNN(K最近邻算法)算法面对大样本数据量时分类不准确的现状,分析传统的K-modes算法从k簇的初始化到簇中心不再变化的全过程和KNN(K最近邻算法)算法在面对大样本数据时执行效率低下的问题,提出改进的K-modes-KNN算法。使用字符串核函数初始化k簇,字符串核函数迭代计算样本到簇中心的距离来动态改变簇中心,利用改进的K-modes算法将数据集进行分簇处理后,在每个子簇中建立KNN(K最近邻算法)分类模型。通过真实数据验证了所提算法在一定程度上优于同种分类算法。 展开更多
关键词 k-modes算法 KNN算法 分类 簇中心 k-modes-KNN算法 字符串核函数
下载PDF
面向不完备分类型矩阵数据的集对k-modes聚类算法 被引量:4
17
作者 张春英 高瑞艳 +4 位作者 王佳昊 陈松 刘凤春 任静 冯晓泽 《小型微型计算机系统》 CSCD 北大核心 2021年第9期1837-1844,共8页
为了解决具有不完备、分类型矩阵数据集的聚类问题,同时考虑样本和类簇间的不确定关系,提出了一种面向不完备分类型矩阵数据的集对k-modes聚类算法.首先,基于集对信息粒的相关理论,定义了不完备矩阵样本间的集对距离度量方法;其次,考虑... 为了解决具有不完备、分类型矩阵数据集的聚类问题,同时考虑样本和类簇间的不确定关系,提出了一种面向不完备分类型矩阵数据的集对k-modes聚类算法.首先,基于集对信息粒的相关理论,定义了不完备矩阵样本间的集对距离度量方法;其次,考虑样本和类簇间的不确定关系,给出了类内平均距离的定义和判断样本是否属于多个类簇的阈值计算公式,进而形成包含正同域,边界域和负反域的集对聚类结果;最后,通过选取的3个矩阵数据集与四个对比算法进行实验评价,实验结果表明集对k-modes聚类算法可以有效处理不完备分类型矩阵数据集,并且在准确率、召回率、调整兰德系数和标准化互信息等指标上均有良好的聚类性能. 展开更多
关键词 不完备分类型矩阵数据 集对信息粒 k-modes 集对距离 集对k-modes
下载PDF
基于MapReduce自适应参数的粗糙K-modes算法研究
18
作者 杨阳 张为群 +1 位作者 刘枫 黄仁杰 《计算机科学》 CSCD 北大核心 2012年第11期149-152,164,共5页
粗糙K-modes聚类算法需要根据经验为wl、wu和ε3个参数设定其固定值,聚类效果不稳定,容易受到噪声干扰。提出一种基于MapReduce自适应参数的粗糙K-modes算法,它根据聚类不同阶段的特点自动调整参数值,优化聚类效果。在此基础上,对自适... 粗糙K-modes聚类算法需要根据经验为wl、wu和ε3个参数设定其固定值,聚类效果不稳定,容易受到噪声干扰。提出一种基于MapReduce自适应参数的粗糙K-modes算法,它根据聚类不同阶段的特点自动调整参数值,优化聚类效果。在此基础上,对自适应参数的粗糙K-modes算法进行MapReduce并行化设计,以提高算法的运行效率。实验证明,提出的自适应参数的粗糙K-modes算法聚类效果稳定,通过对算法的并行设计提高了算法对大规模数据的聚类分析性能。 展开更多
关键词 粗糙k-modes 自适应参数 MapReduce并行化
下载PDF
基于距离和密度双度量的模糊k-modes算法
19
作者 刘培奇 胡红光 +1 位作者 张凯 黄苗 《工业控制计算机》 2015年第9期90-91,94,共3页
大多数模糊k-modes的相关改进算法仅关注对象之间的距离,并未关注对象的空间分布对于聚类的影响。将距离和密度双度量的测度方法引入模糊k-modes算法进行改进,该方法将对象的空间分布考虑在内,从而以一种更加合理的方式更新对象的隶属... 大多数模糊k-modes的相关改进算法仅关注对象之间的距离,并未关注对象的空间分布对于聚类的影响。将距离和密度双度量的测度方法引入模糊k-modes算法进行改进,该方法将对象的空间分布考虑在内,从而以一种更加合理的方式更新对象的隶属度。通过来自于UCI机器学习库的数据集测试算法改进前与改进后的性能,算法改进后的聚类正确率高于改进前的,证明算法改进后性能更好。 展开更多
关键词 模糊k-modes 距离 密度 隶属度 UCI机器学习库
下载PDF
基于离散小波变换和模糊K-modes的负荷聚类算法 被引量:23
20
作者 张江林 张亚超 +2 位作者 洪居华 高红均 刘俊勇 《电力自动化设备》 EI CSCD 北大核心 2019年第2期100-106,122,共8页
为了研究智能电网背景下用户的用电模式,考虑到现有聚类算法的不足,提出了一种基于离散小波变换的模糊K-modes聚类算法。利用离散小波变换将时域的负荷曲线转换到频域,从而将负荷曲线的不同特征隔离在不同的频域水平,并利用低阶近似的... 为了研究智能电网背景下用户的用电模式,考虑到现有聚类算法的不足,提出了一种基于离散小波变换的模糊K-modes聚类算法。利用离散小波变换将时域的负荷曲线转换到频域,从而将负荷曲线的不同特征隔离在不同的频域水平,并利用低阶近似的思想选取原始曲线的有效分量曲线;对所选的分量曲线进行趋势编码,将连续负荷数据转化为离散类属性数据;基于平均密度确定初始聚类条件,利用模糊K-modes聚类算法对曲线进行形态聚类,得到负荷曲线模板;将所提算法与传统K-means算法及层次聚类算法进行比较,从而验证了所提算法的有效性。 展开更多
关键词 智能电网 负荷聚类 离散小波变换 模糊k-modes聚类算法 用电模式
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部