期刊文献+
共找到8,540篇文章
< 1 2 250 >
每页显示 20 50 100
模糊K-Modes聚类精确度分析 被引量:14
1
作者 赵恒 杨万海 《计算机工程》 CAS CSCD 北大核心 2003年第12期27-28,175,共3页
模糊K-Modes聚类算法是对具有分类属性的数据进行聚类的一种有效的算法。为了评价聚类结果,以具有明确分类结构的数据作为输入数据,将模糊K-Modes聚类结果与原始数据的分类结构进行对比,分析了确定它们之间对应关系的方法,在期望聚... 模糊K-Modes聚类算法是对具有分类属性的数据进行聚类的一种有效的算法。为了评价聚类结果,以具有明确分类结构的数据作为输入数据,将模糊K-Modes聚类结果与原始数据的分类结构进行对比,分析了确定它们之间对应关系的方法,在期望聚类结果应该具有的特点的基础上,对现有的精确度定义和计算方法进行修正,在划分相似度的基础上,重新定义模糊K-Modes聚类精确度。 展开更多
关键词 模糊k-modes聚类 精确度 属性 相似度
下载PDF
基于属性加权的模糊K-Modes聚类算法 被引量:12
2
作者 赵恒 杨万海 《系统工程与电子技术》 EI CSCD 北大核心 2003年第10期1299-1302,共4页
提出了一种基于属性加权的模糊K Modes算法。该算法假定不同属性对聚类结果有不同程度的影响 ,定义新的适应度函数 ,利用进化策略优化加权矩阵 ,以基于划分相似度的聚类精确度作为聚类结果的评价准则。实验表明 ,此算法具有较好的聚类效... 提出了一种基于属性加权的模糊K Modes算法。该算法假定不同属性对聚类结果有不同程度的影响 ,定义新的适应度函数 ,利用进化策略优化加权矩阵 ,以基于划分相似度的聚类精确度作为聚类结果的评价准则。实验表明 ,此算法具有较好的聚类效果 ,且属性加权矩阵反映了数据各个属性的重要程度 ,从而可以进行属性的提取和选择。 展开更多
关键词 模糊 进化策略 属性
下载PDF
基于新的相异度量的模糊K-Modes聚类算法 被引量:5
3
作者 白亮 曹付元 梁吉业 《计算机工程》 CAS CSCD 北大核心 2009年第16期192-194,共3页
传统的模糊K-Modes聚类算法采用简单匹配方法度量对象与Mode之间的相异程度,没有充分考虑Mode对类的代表程度,容易造成信息的丢失,弱化了类内的相似性。针对上述问题,通过对象对类的隶属度反映Mode对类的代表程度,提出一种新的相异度量... 传统的模糊K-Modes聚类算法采用简单匹配方法度量对象与Mode之间的相异程度,没有充分考虑Mode对类的代表程度,容易造成信息的丢失,弱化了类内的相似性。针对上述问题,通过对象对类的隶属度反映Mode对类的代表程度,提出一种新的相异度量,并将它应用于传统的模糊K-Modes聚类算法。与传统的K-Modes和模糊K-Modes聚类算法相比,该相异度量是有效的。 展开更多
关键词 模糊K—Modes算法 相异度量 中心
下载PDF
一种基于粗糙熵的改进K-modes聚类算法
4
作者 刘财辉 曾雄 谢德华 《南京理工大学学报》 CAS CSCD 北大核心 2024年第3期335-341,共7页
K-modes聚类算法被广泛应用于人工智能、数据挖掘等领域。传统的K-modes聚类算法有不错的聚类效果,但是存在迭代次数多、计算量大、容易受到冗余属性的干扰等问题,且仅采用简单的0-1匹配的方法来定义2个样本属性值之间的距离,没有充分... K-modes聚类算法被广泛应用于人工智能、数据挖掘等领域。传统的K-modes聚类算法有不错的聚类效果,但是存在迭代次数多、计算量大、容易受到冗余属性的干扰等问题,且仅采用简单的0-1匹配的方法来定义2个样本属性值之间的距离,没有充分考虑每个属性对聚类结果的影响。针对上述问题,该文将粗糙熵引入K-modes算法。首先利用粗糙集属性约简算法消除冗余属性,确定各属性的重要程度;然后利用粗糙熵确定每个属性的权重,从而定义新的类内距离。将该文所提算法与传统的K-modes聚类算法分别在4组公开数据集上进行对比试验。试验结果表明,该文所提算法聚类准确率比传统的K-modes聚类算法更高。 展开更多
关键词 k-modes算法 粗糙集 粗糙熵 属性约简 权重
下载PDF
基于离散小波变换和模糊K-modes的负荷聚类算法 被引量:24
5
作者 张江林 张亚超 +2 位作者 洪居华 高红均 刘俊勇 《电力自动化设备》 EI CSCD 北大核心 2019年第2期100-106,122,共8页
为了研究智能电网背景下用户的用电模式,考虑到现有聚类算法的不足,提出了一种基于离散小波变换的模糊K-modes聚类算法。利用离散小波变换将时域的负荷曲线转换到频域,从而将负荷曲线的不同特征隔离在不同的频域水平,并利用低阶近似的... 为了研究智能电网背景下用户的用电模式,考虑到现有聚类算法的不足,提出了一种基于离散小波变换的模糊K-modes聚类算法。利用离散小波变换将时域的负荷曲线转换到频域,从而将负荷曲线的不同特征隔离在不同的频域水平,并利用低阶近似的思想选取原始曲线的有效分量曲线;对所选的分量曲线进行趋势编码,将连续负荷数据转化为离散类属性数据;基于平均密度确定初始聚类条件,利用模糊K-modes聚类算法对曲线进行形态聚类,得到负荷曲线模板;将所提算法与传统K-means算法及层次聚类算法进行比较,从而验证了所提算法的有效性。 展开更多
关键词 智能电网 负荷 离散小波变换 模糊k-modes聚类算法 用电模式
下载PDF
考虑模糊聚类特性的电网运营风险自动预警系统
6
作者 孙红燕 王少华 《电子设计工程》 2025年第1期70-73,79,共5页
当前风险自动预警系统通常采用基于经验值的人工方法设置自动预警阈值,给出的是统一阈值,导致系统虚警率较高。因此,提出基于模糊聚类特性的电网运营风险自动预警系统。设计信息采集器和显示器,应用决策级融合原理和神经网络模型,整合... 当前风险自动预警系统通常采用基于经验值的人工方法设置自动预警阈值,给出的是统一阈值,导致系统虚警率较高。因此,提出基于模糊聚类特性的电网运营风险自动预警系统。设计信息采集器和显示器,应用决策级融合原理和神经网络模型,整合实时采集的电网运营多源异构数据。从购电维度、输配电维度和售电维度入手,确定电网运营风险度量指标,得到风险度量结果。依托模糊聚类特性建立动态聚类图,对风险预警对象进行分类,分析电网运营风险的内容,作为自动预警阈值。根据预警阈值定义风险自动预警线,对比风险度量结果生成包含预警等级的自动预警信息。实验结果表明,所提系统的虚警率为2.67%,满足了电网运营风险自动预警要求。 展开更多
关键词 模糊特性 电网运营 风险度量 自动预警
下载PDF
基于K-modes聚类算法的山东省传统村落空间风貌类型及区划研究 被引量:1
7
作者 范勇 李玄 肖文杰 《小城镇建设》 2024年第5期100-107,共8页
传统村落的类型解析及空间区划是开展传统村落整体性保护和区域性发展的基础前提,本文在对山东省传统村落调查的基础上,基于空间基因理论视角,从地景、聚落、建筑、文化4个层次构建起13个指标的传统村落空间风貌分类指标体系,并采用K-mo... 传统村落的类型解析及空间区划是开展传统村落整体性保护和区域性发展的基础前提,本文在对山东省传统村落调查的基础上,基于空间基因理论视角,从地景、聚落、建筑、文化4个层次构建起13个指标的传统村落空间风貌分类指标体系,并采用K-modes聚类算法对山东省177个传统村落进行聚类分析,得到八大空间风貌类型,进一步结合区域文化、地理特点及行政区划,划分出山东省5个传统村落风貌区,从宏观视角分析了山东省传统村落空间风貌特征及其形成与发展的内在逻辑和地理分布规律,为更加整体全面地认识山东省传统村落特点、开展区域性传统村落集中连片保护利用等工作提供科学参考。 展开更多
关键词 传统村落 空间基因 k-modes算法 空间区划 山东省
下载PDF
K-Modes聚类数据收集和发布过程中的混洗差分隐私保护方法 被引量:1
8
作者 蒋伟进 陈艺琳 +3 位作者 韩裕清 吴玉庭 周为 王海娟 《通信学报》 EI CSCD 北大核心 2024年第1期201-213,共13页
针对目前聚类数据收集与发布安全性不足的问题,为保护聚类数据中的用户隐私并提高数据质量,基于混洗差分隐私模型,提出一种去可信第三方的K-Modes聚类数据收集和发布的隐私保护方法。首先,使用K-Modes聚类数据收集算法对用户数据进行采... 针对目前聚类数据收集与发布安全性不足的问题,为保护聚类数据中的用户隐私并提高数据质量,基于混洗差分隐私模型,提出一种去可信第三方的K-Modes聚类数据收集和发布的隐私保护方法。首先,使用K-Modes聚类数据收集算法对用户数据进行采样并加噪,再通过填补取值域随机排列发布算法打乱采样数据的初始顺序,使恶意攻击者不能根据用户与数据之间的关系识别出目标用户。然后,尽可能减小噪声的干扰,利用循环迭代的方式计算出新的质心完成聚类。最后,从理论层面上分析了以上3种方法的隐私性、可行性和复杂度,并利用3个真实数据集和近年来具有权威性的同类算法KM、DPLM、LDPKM等进行准确率、熵值的对比,验证所提方法的有效性。实验结果表明,所提方法的隐私保护和发布数据质量均优于当前同类算法。 展开更多
关键词 混洗差分隐私 k-modes 隐私保护 数据收集 数据发布
下载PDF
基于模糊K-Modes和免疫遗传算法的聚类分析 被引量:2
9
作者 曹文婷 邹海 段凤玲 《计算机技术与发展》 2009年第2期151-153,共3页
为了克服传统的模糊K-Modes算法分类正确率低、收敛速度慢的缺点,文中将免疫遗传算法应用到聚类分析中,提出了一种基于模糊K-Modes和免疫遗传算法的聚类算法。通过引入免疫算子,不仅提高了收敛速度,而且避免了陷于局部极小,从而能较快... 为了克服传统的模糊K-Modes算法分类正确率低、收敛速度慢的缺点,文中将免疫遗传算法应用到聚类分析中,提出了一种基于模糊K-Modes和免疫遗传算法的聚类算法。通过引入免疫算子,不仅提高了收敛速度,而且避免了陷于局部极小,从而能较快地收敛到全局最优解。免疫算子包括抽取疫苗、接种疫苗和选择疫苗。实验结果证明,此算法具有较好的聚类效果,且稳定性强。 展开更多
关键词 模糊 K—Modes免疫遗传算法 优化计算
下载PDF
基于VMD模糊熵与GG聚类的直流配电网故障检测方法 被引量:1
10
作者 韦延方 王志杰 +2 位作者 王鹏 曾志辉 王晓卫 《电机与控制学报》 EI CSCD 北大核心 2024年第2期129-141,共13页
针对直流配电网存在的故障信号难以提取、不易对各类故障进行诊断等问题,提出一种基于变分模态分解(VMD)模糊熵与Gath-Geva(GG)聚类的故障检测方法。首先,提取出暂态电流,采用VMD算法将故障暂态电流分解成若干个固有模态分量(IMF)。然后... 针对直流配电网存在的故障信号难以提取、不易对各类故障进行诊断等问题,提出一种基于变分模态分解(VMD)模糊熵与Gath-Geva(GG)聚类的故障检测方法。首先,提取出暂态电流,采用VMD算法将故障暂态电流分解成若干个固有模态分量(IMF)。然后,分别计算分解得到的若干个IMF的模糊熵,将其作为特征向量。最后,采用GG聚类算法对故障特征的特征向量进行聚类识别。GG聚类的主要算法为将聚类样本划分为c类,设出隶属度矩阵,通过设定迭代来计算聚类中心与最大似然估计距离,更新隶属度矩阵,当隶属度矩阵满足条件矩阵时终止迭代,从而实现对单极故障、极间故障以及区外交流侧接地故障的聚类识别。仿真结果表明,所提保护方案可靠性强、准确率高,在不同故障类型、故障位置和过渡电阻等工况下均能可靠检测直流线路故障并准确识别故障类型,且具备一定的抗干扰能力。 展开更多
关键词 直流配电网 故障暂态电流 变分模态分解 模糊 Gath-Geva 故障检测
下载PDF
基于模糊聚类和改进Densenet网络的小样本轴承故障诊断 被引量:1
11
作者 魏文军 张轩铭 杨立本 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2024年第3期154-163,共10页
针对实际中轴承的故障数据少难以满足深度学习数据大量训练模型的要求,利用卷积神经网络的微小特征提取优势和模糊聚类不需要训练即可完成分类的特点,提出了一种基于模糊聚类和改进Densenet网络的小样本轴承故障诊断方法。首先将预训练... 针对实际中轴承的故障数据少难以满足深度学习数据大量训练模型的要求,利用卷积神经网络的微小特征提取优势和模糊聚类不需要训练即可完成分类的特点,提出了一种基于模糊聚类和改进Densenet网络的小样本轴承故障诊断方法。首先将预训练微调的Densenet网络去掉分类只保留特征提取层,设计一个维度自适应全局均值池化层(GAP)代替全连接层(FC),其次利用模糊聚类代替Densenet网络的softmax分类层,不需要训练即可完成分类。实验结果表明:该算法利用小样本数据训练网络中的GAP参数,模型需要的训练样本大大减少,诊断时将轴承时域图像输入到网络中,在GAP层输出1 920个特征数据,不同故障状态的特征数据构建特征向量矩阵,利用模糊聚类方法求得模糊相似矩阵和模糊等价矩阵,当置信因子从大到小变化时,由对应布尔矩阵得到动态聚类图,从而实现轴承故障分类。 展开更多
关键词 小样本 全局均值池化层 迁移学习 模糊 故障诊断
下载PDF
农业机器人采摘目标识别技术研究——基于FCM模糊聚类算法 被引量:1
12
作者 冯高峰 《农机化研究》 北大核心 2024年第3期30-33,41,共5页
介绍了FCM(Fuzzy C-Means)模糊聚类算法的原理,采用权重分配的方法对该算法进行了改进,通过建立模糊的相似矩阵,对目标对象的特征聚类图进行分析,并引入隶属度矩阵对FCM算法进行优化,以加快算法的迭代速度。实验结果表明:农业机器人采... 介绍了FCM(Fuzzy C-Means)模糊聚类算法的原理,采用权重分配的方法对该算法进行了改进,通过建立模糊的相似矩阵,对目标对象的特征聚类图进行分析,并引入隶属度矩阵对FCM算法进行优化,以加快算法的迭代速度。实验结果表明:农业机器人采用该方法对农作物轮廓分割识别度较高,算法计算效率较快,验证了其可靠性,该方法可用于目标农作物的分割和目标识别。 展开更多
关键词 农业机器人 FCM 模糊 隶属度矩阵 目标识别
下载PDF
融合模糊聚类和自适应去噪的推荐遗忘学习算法
13
作者 王建芳 柴广文 +2 位作者 陈艺卿 梁梦豪 罗军伟 《计算机科学与探索》 CSCD 北大核心 2024年第11期2969-2979,共11页
隐私保护在推荐系统中具有至关重要的地位,因为它有助于保护用户的敏感信息免受泄露风险。近年来,推荐遗忘学习作为一种有效的隐私保护手段引起了越来越多的关注。现有方法为了提高模型的训练效率,通常将数据划分为子分区进行训练。然而... 隐私保护在推荐系统中具有至关重要的地位,因为它有助于保护用户的敏感信息免受泄露风险。近年来,推荐遗忘学习作为一种有效的隐私保护手段引起了越来越多的关注。现有方法为了提高模型的训练效率,通常将数据划分为子分区进行训练。然而,简单划分子分区会破坏用户-项目间的完整性,降低数据的可用性。此外,子分区中隐式反馈的假阳性噪声会干扰模型的训练,使其无法准确地捕捉用户的真实偏好。为解决上述问题,提出了融合模糊聚类和自适应去噪的推荐遗忘学习算法(FDRU)。该算法使用模糊聚类来划分数据集,通过计算交互样本到各个聚类中心的余弦距离来确定隶属度,进而将训练集划分为若干个子分区。FDRU设计了一种自适应去噪方法,其能够根据阈值动态地剔除子分区中的假阳性噪声。通过动态权重聚合子模型进行预测和Top-N推荐。为了验证提出算法的性能,在三个公开数据集上进行实验验证,实验结果表明,提出的算法在召回率和归一化折损累计增益上优于其他基准算法。 展开更多
关键词 隐私保护 推荐 遗忘学习 模糊 自适应去噪
下载PDF
基于超像素快速模糊聚类的印刷品图像分割方法
14
作者 彭来湖 张晓蓉 +1 位作者 李建强 胡旭东 《包装学报》 2024年第3期85-90,共6页
针对当前彩色印刷品色差检测过程中效率低、复杂性高等问题,提出了一种基于超像素快速模糊聚类的印刷品图像分割方法(SFFCM)。先用简单线性迭代聚类(SLIC)算法将图像分割为紧密相邻的超像素区域。每个超像素区域被视为一个独立的聚类单... 针对当前彩色印刷品色差检测过程中效率低、复杂性高等问题,提出了一种基于超像素快速模糊聚类的印刷品图像分割方法(SFFCM)。先用简单线性迭代聚类(SLIC)算法将图像分割为紧密相邻的超像素区域。每个超像素区域被视为一个独立的聚类单元。随后,将模糊C均值聚类(FCM)算法应用于超像素的归属关系计算中,即引入隶属度值,允许超像素归属于多个聚类中心,并通过权衡归属度值来实现模糊聚类。实验结果表明,相对于其他算法,本文方法在保持良好实时性的同时,实现了较好的分割效果,有效平衡了算法复杂度与分割效果之间的关系。 展开更多
关键词 印刷品 图像分割 简单线性迭代算法 模糊C均值 超像素
下载PDF
Canny算子+模糊C聚类融合的红外热成像机场道面积水识别方法
15
作者 蔡靖 王锴 +1 位作者 李岳 戴轩 《科学技术与工程》 北大核心 2024年第28期12382-12390,共9页
为解决基于积水可见光图片处理时,受光照变化影响大、夜晚及恶劣天气下难以成像,或成像图像质量低到无法识别的问题。提出一种利用红外热成像+图像处理技术进行积水区域识别的方法,利用红外成像技术拍摄道面积水图像克服了传统拍照方式... 为解决基于积水可见光图片处理时,受光照变化影响大、夜晚及恶劣天气下难以成像,或成像图像质量低到无法识别的问题。提出一种利用红外热成像+图像处理技术进行积水区域识别的方法,利用红外成像技术拍摄道面积水图像克服了传统拍照方式受光照条件限制的缺陷,进一步针对红外成像积水边界边缘模糊、边缘温度分布无明显规律的特征,提出基于Canny算子和模糊C均值聚类的红外图像积水边缘检测融合算法,并利用该算法对实拍积水红外图像进行处理分析,结果表明:该算法对模糊边界有良好的提取效果,图像分割结果与人工标注的实际面积误差在7%以内,且利用像素点的比值能够快速、准确地获取积水面积,为湿滑跑道道面状况评估提供量化支撑,为飞机在湿滑道面上的安全运行提供有效技术支撑。 展开更多
关键词 积水 红外热成像 边缘检测 模糊C均值
下载PDF
结合软约束的演化数据流模糊聚类算法
16
作者 代少升 边志奇 袁中明 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第2期287-298,共12页
多源局部放电检测中,不同类型的局放信号同时存在且不断变化使得信号的分离更具挑战,而这种情况同样存在于许多数据流的聚类分析场景中。为了能够适应类簇内的不均匀密度和类簇间的重叠边界问题,同时对数据流的漂移和演化进行及时跟踪,... 多源局部放电检测中,不同类型的局放信号同时存在且不断变化使得信号的分离更具挑战,而这种情况同样存在于许多数据流的聚类分析场景中。为了能够适应类簇内的不均匀密度和类簇间的重叠边界问题,同时对数据流的漂移和演化进行及时跟踪,提出了一种结合软约束的实时数据流模糊聚类算法。算法引入2种模糊性软约束来描述微簇距离和密度上的不确定度,通过阈值划分出核心微簇、边界微簇和离群微簇;在类簇边缘使用模糊隶属度,给予微簇分属不同类簇的可能性,保证类簇的完整性并提高聚类效果;使用两阶段的流程结构和2种时间窗口模型,赋予算法具有对可变化数据流的适应能力和更低的时间空间占用率。在多种数据集上的实验表明,该算法相比同类型算法在聚类效果上提升了1%~3%,且平均运行时间缩短5%~20%,在实际硬件平台的测试中也验证了算法的聚类分离性能。 展开更多
关键词 数据流 密度 模糊 概念漂移 局部放电
下载PDF
贝叶斯优化模糊聚类地级行政区声环境
17
作者 曾宇 姚琨 +1 位作者 任爽 户文成 《应用声学》 CSCD 北大核心 2024年第2期385-392,共8页
声环境功能区划是噪声污染管理的重要手段。当前声环境功能区划研究大多是基于某个特定的地级行政区来进行的,难以反映各地级行政区声环境的异同。该文基于134个地级行政区的人口、面积、各声环境功能区面积和及面积占比,进行地级行政... 声环境功能区划是噪声污染管理的重要手段。当前声环境功能区划研究大多是基于某个特定的地级行政区来进行的,难以反映各地级行政区声环境的异同。该文基于134个地级行政区的人口、面积、各声环境功能区面积和及面积占比,进行地级行政区声环境表征和归一化处理。以轮廓系数作为聚类有效性评价指标,基于贝叶斯优化模糊聚类方法对地级行政区声环境表征进行聚类分析。通过与谱聚类、K-medoids聚类、高斯混合模型聚类的聚类性能对比,验证了该方法的有效性。结果表明,我国地级行政区声环境分为9类,城市规模和用地情况发生显著变化导致其声环境表征和归类发生变化后应重新评估当前噪声污染管理政策,并借鉴同类的地级行政区的噪声污染管理政策做出必要的调整。 展开更多
关键词 声环境功能区 地级行政区 模糊 贝叶斯优化 轮廓系数
下载PDF
基于粗糙集的改进K-Modes聚类算法 被引量:15
18
作者 白亮 梁吉业 曹付元 《计算机科学》 CSCD 北大核心 2009年第1期162-164,176,共4页
传统的K-Modes算法采用简单匹配的方法来计算对象之间的距离,并没有充分考虑同一属性下的两个不同值之间的相似性。基于粗糙集中的上、下近似,提出了一种新的距离度量,并重新定义了类中心,对传统K-Modes算法进行了改进。与其他改进K-Mo... 传统的K-Modes算法采用简单匹配的方法来计算对象之间的距离,并没有充分考虑同一属性下的两个不同值之间的相似性。基于粗糙集中的上、下近似,提出了一种新的距离度量,并重新定义了类中心,对传统K-Modes算法进行了改进。与其他改进K-Modes算法进行了比较,实验结果表明,基于粗糙集的改进K-Modes算法有效地提高了聚类精度。 展开更多
关键词 算法 粗糙集 距离度量 k-modes算法
下载PDF
基于本地差分隐私的K-modes聚类数据隐私保护方法 被引量:9
19
作者 张少波 原刘杰 +1 位作者 毛新军 朱更明 《电子学报》 EI CAS CSCD 北大核心 2022年第9期2181-2188,共8页
分类型数据聚类是数据挖掘的重要研究内容,聚类数据中通常包含用户一些敏感信息.为保护聚类数据中的用户隐私,当前主要采用基于可信第三方隐私保护模型,但现实中第三方也存在隐私泄露风险.针对此问题,该文引入本地差分隐私技术,提出一... 分类型数据聚类是数据挖掘的重要研究内容,聚类数据中通常包含用户一些敏感信息.为保护聚类数据中的用户隐私,当前主要采用基于可信第三方隐私保护模型,但现实中第三方也存在隐私泄露风险.针对此问题,该文引入本地差分隐私技术,提出一种去可信第三方的K-modes聚类数据隐私保护方法.该方法首先利用随机采样技术对数据进行采样,然后使用本地差分隐私技术对采样数据进行扰动,最后通过聚类服务端与用户的交互迭代完成聚类.在聚类过程中,无需可信第三方对数据进行隐私预处理,避免了第三方泄露用户隐私的风险.理论分析证明了该方法的隐私性和可行性,实验结果表明该方法在满足本地差分隐私机制的前提下保证了聚类结果的质量. 展开更多
关键词 隐私保护 本地差分隐私 数据挖掘 k-modes 去可信第三方
下载PDF
基于分类型矩阵对象数据的MD fuzzy k-modes聚类算法 被引量:10
20
作者 李顺勇 张苗苗 曹付元 《计算机研究与发展》 EI CSCD 北大核心 2019年第6期1325-1337,共13页
传统的聚类算法一般是对单值属性数据进行聚类.但在许多实际应用中,每个对象通常被多个特征向量所描述.例如,顾客在购物时可能同时购买多个产品.由多个特征向量描述的对象称为矩阵对象,由矩阵对象构成的数据集称为矩阵对象数据集.目前,... 传统的聚类算法一般是对单值属性数据进行聚类.但在许多实际应用中,每个对象通常被多个特征向量所描述.例如,顾客在购物时可能同时购买多个产品.由多个特征向量描述的对象称为矩阵对象,由矩阵对象构成的数据集称为矩阵对象数据集.目前,针对矩阵对象数据聚类算法的研究相对较少,还有很多问题有待解决.利用fuzzy k-modes算法的聚类过程,提出一种基于矩阵对象数据的matrix-object data fuzzy k-modes(MD fuzzy k-modes)聚类算法.该算法结合模糊集的概念引入模糊因子β,重新定义了矩阵对象间的相异性度量,并给出类中心的启发式更新算法.最后,在5个真实数据集上验证了MD fuzzy k-modes算法的有效性,并分析了模糊因子β与隶属度w之间的关系.大数据时代,利用MD fuzzy k-modes算法对多条记录进行聚类,能更易发现顾客的消费偏好,从而做出更有针对性的推荐. 展开更多
关键词 矩阵对象数据 MD FUZZY k-modes算法 相异性度量 中心
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部