期刊文献+
共找到1,118篇文章
< 1 2 56 >
每页显示 20 50 100
融合优化可调Q因子小波变换的改进密度峰值聚类算法 被引量:1
1
作者 史曼曼 宋朝炀 张景祥 《计算机应用研究》 CSCD 北大核心 2024年第2期466-472,共7页
为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化... 为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化选择策略及改进粒子群优化算法确定的最佳Q因子分解时序信号,通过最优特征子带的能量、均值、标准差和模糊熵构建特征子空间,并采用主成分分析降低特征维度,以减少特征冗余。同时,考虑到距离较远而周围密集程度较大的K近邻样本对局部密度的贡献率,引入权重系数及K近邻重新定义DPC的局部密度,并利用共享最近邻描述样本间的相似性。在BONN癫痫脑电信号和CWRU滚动轴承数据集上进行对比实验,结果表明,该算法的聚类精度分别为95%、94%,且Jacarrd、FMI和F_(1)值指标均优于其他对比算法,证明了OTQWT-IDPC算法的有效性。 展开更多
关键词 密度峰值算法 可调Q因子小波变换 粒子群优化算法 主成分分析
下载PDF
面向Shapelet空间的多变量时间序列密度聚类算法 被引量:1
2
作者 盛锦超 杜明晶 +1 位作者 孙嘉睿 李宇蕊 《计算机科学与探索》 CSCD 北大核心 2024年第2期387-402,共16页
多变量时间序列聚类问题已经成为时间序列分析任务中重要的研究课题,相较于单变量时间序列,多变量时间序列的研究复杂性更高,难度更大。尽管当前已经提出了许多针对多变量时间序列的聚类算法,但是这些算法在精度和解释性方面仍旧不足。... 多变量时间序列聚类问题已经成为时间序列分析任务中重要的研究课题,相较于单变量时间序列,多变量时间序列的研究复杂性更高,难度更大。尽管当前已经提出了许多针对多变量时间序列的聚类算法,但是这些算法在精度和解释性方面仍旧不足。其一,当前大部分工作并未考虑多变量时间序列的长度冗余性和变量相关性等问题,导致最终得到的相似性矩阵具有较大误差;其二,数据在聚类过程中普遍采用划分范式,当数值空间呈现复杂分布时该思想表现不佳,并且不具备对各个变量及空间的解释力。针对上述问题,提出了一种面向Shapelet(富有高信息量的连续子序列)空间的多变量时间序列自适应权重密度聚类算法(MDCS)。算法首先对各个变量进行Shapelet搜索,通过自适应策略获取到各自的Shapelet空间,接着对各个变量产生的数值分布进行组合加权,得到了更符合数据分布特征的相似度矩阵,最后利用改进密度计算和二次分配的共享最近邻密度峰值聚类算法对数据进行最终分配。在真实数据集上的实验结果证明,与目前先进的聚类算法相比,MDCS拥有更好的聚类结果,在标准化互信息和兰德系数指标上平均提高了0.344与0.09,兼顾了性能与可解释性。 展开更多
关键词 多变量时间序列 子序列 Shapelet空间 密度峰值 数据挖掘
下载PDF
基于改进粒子群的密度聚类算法混合矩阵估计 被引量:1
3
作者 刘成浩 张晓林 +1 位作者 孙溶辰 李铭 《系统工程与电子技术》 EI CSCD 北大核心 2024年第7期2211-2219,共9页
针对混合矩阵估计算法中传统的噪声环境下基于密度的空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法需要人为设定邻域半径以及核心点数这一问题,提出双约束粒子群优化(double constrained particle... 针对混合矩阵估计算法中传统的噪声环境下基于密度的空间聚类(density-based spatial clustering of applications with noise,DBSCAN)算法需要人为设定邻域半径以及核心点数这一问题,提出双约束粒子群优化(double constrained particle swarm optimization,DCPSO)算法,对DBSCAN算法的邻域半径参数进行寻优,将得到的最优参数作为DBSCAN算法的参数输入,然后计算聚类中心,完成混合矩阵估计。针对基于距离排序的源信号数目估计算法存在依靠经验参数的选取且不具备噪声点剔除能力的问题,提出了最大距离排序算法。实验结果表明,所提算法较相应的对比算法皆有提升,源信号数目估计准确率较原算法提高近40%,混合矩阵估计的误差较对比算法提升3 dB以上,且所提算法在收敛速度上优于原算法。 展开更多
关键词 欠定盲源分离 粒子群优化 密度空间 混合矩阵估计
下载PDF
基于密度的聚类算法在数据挖掘中的应用与改进
4
作者 何珍珍 张馨雨 《信息记录材料》 2024年第6期116-118,共3页
本研究针对密度聚类算法在数据挖掘中的关键挑战,提出了一系列创新改进措施。通过自适应参数调整、局部核密度估计、噪声抑制和多尺度聚类分析,有效提高了聚类算法的性能。实验验证显示,这些改进在处理复杂数据集时,尤其是在噪声和多密... 本研究针对密度聚类算法在数据挖掘中的关键挑战,提出了一系列创新改进措施。通过自适应参数调整、局部核密度估计、噪声抑制和多尺度聚类分析,有效提高了聚类算法的性能。实验验证显示,这些改进在处理复杂数据集时,尤其是在噪声和多密度尺度场景下,显著增强了聚类的准确性和鲁棒性。研究结果为密度聚类算法在实际应用中的优化提供了新思路,并为相关领域的智能数据分析提供了有力工具。 展开更多
关键词 密度算法 数据挖掘 自适应参数优化 局部核密度估计
下载PDF
结合基于密度的噪声应用空间聚类和反距离加权算法的城市环境电磁频谱地图构建
5
作者 谢佳炜 余志勇 +1 位作者 吕典 刘杨秋子 《火箭军工程大学学报》 2024年第4期93-97,107,共6页
针对传统电磁频谱地图构建方法感知节点分布不均匀、监测数据存在异常值等问题,将基于密度的噪声应用空间聚类(Density-based Spatial Clustering of Applications with Noise,DBSCAN)算法与反距离加权(Inverse Distance Weighting,IDW... 针对传统电磁频谱地图构建方法感知节点分布不均匀、监测数据存在异常值等问题,将基于密度的噪声应用空间聚类(Density-based Spatial Clustering of Applications with Noise,DBSCAN)算法与反距离加权(Inverse Distance Weighting,IDW)算法相结合,提出一种城市环境电磁频谱地图构建方法。该算法首先通过DBSCAN减轻极端值的影响,并分离核心点、边界点和噪声点,将每个核心点的局部密度作为权重,计算簇的加权中心点。其次,运用IDW对聚类簇的加权中心点进行插值估计,以显著减少需要进行插值的数据点数量,从而构建精度更高的电磁频谱地图。仿真结果表明:与IDW算法和反障碍距离加权算法相比,所提算法重构得到的电磁频谱地图的平均绝对误差和归一化均方误差分别降低了10%和23%以上。 展开更多
关键词 电磁频谱地图 反距离加权 城市环境 密度 空间插值
下载PDF
基于K-means聚类和特征空间增强的噪声标签深度学习算法 被引量:1
6
作者 吕佳 邱小龙 《智能系统学报》 CSCD 北大核心 2024年第2期267-277,共11页
深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样... 深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样本集赋予伪标签。然而,错误的伪标签以及训练样本数量不足的问题仍然限制着噪声标签学习算法性能的提升。为解决上述问题,提出基于K-means聚类和特征空间增强的噪声标签深度学习算法。首先,该算法利用K-means聚类算法对干净样本集进行标签聚类,并根据噪声样本集与聚类中心的距离大小筛选出难以分类的噪声样本,以提高训练样本的质量;其次,使用mixup算法扩充干净样本集和噪声样本集,以增加训练样本的数量;最后,采用特征空间增强算法抑制mixup算法新生成的噪声样本,从而提高网络的分类准确率。并在CIFAR10、CIFAR100、MNIST和ANIMAL-10共4个数据集上试验验证了该算法的有效性。 展开更多
关键词 噪声标签学习 深度学习 半监督学习 机器学习 神经网络 K-MEANS 特征空间增强 mixup算法
下载PDF
基于空间插值的不规则海洋地质样品测试分析数据聚类算法研究
7
作者 邵长高 严镔 陈秋 《热带海洋学报》 CAS CSCD 北大核心 2024年第2期166-172,共7页
海洋地质调查中获取大量海洋沉积物柱状样样品测试分析数据,样品测试分析目的不同导致柱状样数据采样深度不同,由此造成地质取样数据在三维空间上呈现不规则散点状分布。传统聚类算法无法在三维空间上对此类不规则散点数据进行聚类分析... 海洋地质调查中获取大量海洋沉积物柱状样样品测试分析数据,样品测试分析目的不同导致柱状样数据采样深度不同,由此造成地质取样数据在三维空间上呈现不规则散点状分布。传统聚类算法无法在三维空间上对此类不规则散点数据进行聚类分析。对此,文章设计了一种基于空间插值的不规则地质样品测试分析数据聚类算法,有效地将三维样品测试分析散点数据降为二维数据后进行聚类分析,本算法较好地解决了地质体中试验测试数据的不均衡性问题,为海洋地质大数据分析提供了基础技术方法。 展开更多
关键词 地质取样 实验测试 算法 空间插值 三维
下载PDF
融合密度和划分的文本聚类算法
8
作者 刘龙 刘新 +1 位作者 蔡林杰 唐朝 《计算机与数字工程》 2024年第1期178-183,共6页
文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中... 文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中的K-均值算法可以有效地聚类文档,但是算法的性能非常依赖于初始中心点的选择。论文提出了一种新的融合密度和划分的文本聚类算法。首先,通过密度选择适当的聚类中心点集合,然后使用最远距离的想法逐渐选择初始类中心点,最后使用划分方法对数据集进行聚类。实验表明,该算法的聚类效果稳定,聚类效果良好。 展开更多
关键词 文档 BERT K-均值算法 密度 最远距离
下载PDF
基于K-modes聚类算法的山东省传统村落空间风貌类型及区划研究 被引量:1
9
作者 范勇 李玄 肖文杰 《小城镇建设》 2024年第5期100-107,共8页
传统村落的类型解析及空间区划是开展传统村落整体性保护和区域性发展的基础前提,本文在对山东省传统村落调查的基础上,基于空间基因理论视角,从地景、聚落、建筑、文化4个层次构建起13个指标的传统村落空间风貌分类指标体系,并采用K-mo... 传统村落的类型解析及空间区划是开展传统村落整体性保护和区域性发展的基础前提,本文在对山东省传统村落调查的基础上,基于空间基因理论视角,从地景、聚落、建筑、文化4个层次构建起13个指标的传统村落空间风貌分类指标体系,并采用K-modes聚类算法对山东省177个传统村落进行聚类分析,得到八大空间风貌类型,进一步结合区域文化、地理特点及行政区划,划分出山东省5个传统村落风貌区,从宏观视角分析了山东省传统村落空间风貌特征及其形成与发展的内在逻辑和地理分布规律,为更加整体全面地认识山东省传统村落特点、开展区域性传统村落集中连片保护利用等工作提供科学参考。 展开更多
关键词 传统村落 空间基因 K-modes算法 空间区划 山东省
下载PDF
基于密度峰值聚类的Tri-training算法
10
作者 罗宇航 吴润秀 +3 位作者 崔志华 张翼英 何业慎 赵嘉 《系统仿真学报》 CAS CSCD 北大核心 2024年第5期1189-1198,共10页
Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类... Tri-training利用无标签数据进行分类可有效提高分类器的泛化能力,但其易将无标签数据误标,从而形成训练噪声。提出一种基于密度峰值聚类的Tri-training(Tri-training with density peaks clustering,DPC-TT)算法。密度峰值聚类通过类簇中心和局部密度可选出数据空间结构表现较好的样本。DPC-TT算法采用密度峰值聚类算法获取训练数据的类簇中心和样本的局部密度,对类簇中心的截断距离范围内的样本认定为空间结构表现较好,标记为核心数据,使用核心数据更新分类器,可降低迭代过程中的训练噪声,进而提高分类器的性能。实验结果表明:相比于标准Tritraining算法及其改进算法,DPC-TT算法具有更好的分类性能。 展开更多
关键词 TRI-TRAINING 半监督学习 密度峰值 空间结构
下载PDF
基于改进密度峰值聚类算法的梨花密度分级 被引量:1
11
作者 周桂红 孙乐琳 +1 位作者 梁芳芳 张秀花 《农业工程学报》 EI CAS CSCD 北大核心 2023年第1期126-135,共10页
精准判断梨花疏密程度是自动疏花的基础。为了更好地判断梨花密度,该研究提出了基于改进密度峰值聚类算法的梨花密度分级方法。该方法首先提取梨花位置坐标,获取需要聚类的数据点。其次,为了实现梨花图像的密度分级,针对原有密度峰值聚... 精准判断梨花疏密程度是自动疏花的基础。为了更好地判断梨花密度,该研究提出了基于改进密度峰值聚类算法的梨花密度分级方法。该方法首先提取梨花位置坐标,获取需要聚类的数据点。其次,为了实现梨花图像的密度分级,针对原有密度峰值聚类算法在梨花密度分级中的不足,结合梨花密度分级需求,改进了对聚类中心的选取方式,通过4组局部密度和中心偏移距离分割阈值将决策图划分为4部分来选取聚类中心,分别对应高、中、低密度以及无需疏花处理等4个等级,实现了对疏密合理的梨花图像的准确分级。最后,针对只有团状分布、稀疏分布及大尺度特写的梨花分布聚类分级不准确的问题,改进了两点间的距离d_(ij)参数的计算方法,统一梨花尺度大小和密度分级标准,对所有分布类型的梨花图像均能实现合理的密度分级。试验结果表明,该研究算法能够适应不同尺度大小的梨花图像,预测准确率为94.89%,密度分级准确率达到94.29%,可实现自然环境下局部花簇的密度分级,为机器智能疏花提供了技术支持。 展开更多
关键词 图像识别 农业 算法 密度分级 位置坐标 阈值 梨花
下载PDF
基于类簇合并的无参数密度峰值聚类算法
12
作者 刘天娇 王胜景 袁永生 《现代电子技术》 北大核心 2024年第8期1-8,共8页
密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚... 密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚类算法(NDPCCM)。首先根据样本点两两之间的相似度的分布特征将其分为类内相似度和类间相似度两种类型,并利用类内相似度自动确定截断相似度,避免了人为设置参数;接着根据簇中心权值的下降趋势自动选择初始类簇中心,得到初始类簇;最后通过合并初始类簇对初步聚类结果进行优化,提高了聚类的准确性。在人工数据集和UCI真实数据集上,将所提算法与DPC、DBSCAN、K-means算法进行对比实验。结果表明所提算法无需输入参数就能够自动得到类簇,且聚类性能优于其他算法。 展开更多
关键词 分析 密度峰值算法 初始 簇合并 相似度 性能
下载PDF
基于融合改进K-means聚类算法的数据检测技术 被引量:2
13
作者 郭克难 《电子设计工程》 2024年第5期41-45,共5页
针对现有医疗财务数据分析系统平台老旧,采用传统K-means算法进行数据处理时性能较差的问题,文中设计了一种财务异常数据检测算法。对于传统K-means算法存在的分类效果不佳、运行效率偏低等不足,该算法结合密度峰值法对样本点的局部密... 针对现有医疗财务数据分析系统平台老旧,采用传统K-means算法进行数据处理时性能较差的问题,文中设计了一种财务异常数据检测算法。对于传统K-means算法存在的分类效果不佳、运行效率偏低等不足,该算法结合密度峰值法对样本点的局部密度和高密度距离进行计算,进而优化簇中心的选择。同时融合PCA降维算法减少了数据的冗余信息,进一步提高了运行效率。通过引入LOF离群检测算法对分簇后的数据进行检测,从而得到异常数据结果。实验测试中,所提算法在人工数据集上的平均ARI指标为0.844,真实数据集的准确率则达到了79.2%,在所有对比算法中均为最优,表明该算法具有良好的性能,可以对财务异常数据进行准确地检测。 展开更多
关键词 K-MEANS 密度峰值检测 主成分分析法 离群检测算法 异常数据检测
下载PDF
基于人工鱼群的自适应密度峰值聚类算法
14
作者 何凯琳 张正军 +1 位作者 位雅 唐莉 《计算机工程与设计》 北大核心 2024年第1期110-119,共10页
针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,... 针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,根据两个相邻簇的簇间边界区域密度与簇平均密度构造簇间合并规则,利用人工鱼群算法寻找使改进轮廓系数指标达到最大值时的最优截断距离d_(c)。在合成数据集和真实数据集上的实验结果表明,AFSADPC算法具有较好的聚类效果。 展开更多
关键词 密度峰值 算法 人工鱼群算法 截断距离 幂律分布 簇合并策略 轮廓系数
下载PDF
基于密度聚类算法和广度优先搜索算法的道岔摩擦电流智能分析系统
15
作者 邱晓莉 韩思远 +1 位作者 熊庆 余东 《城市轨道交通研究》 北大核心 2024年第4期114-118,共5页
[目的]现场的道岔摩擦电流测试与调整存在流程繁琐且风险高、对检修人员专业水平要求高、测定数值的主观性占比大3个弊端,为此需要基于各类智能算法及技术提升道岔的智能运维水平。[方法]分析了道岔摩擦电流测试曲线4个阶段的特征,提出... [目的]现场的道岔摩擦电流测试与调整存在流程繁琐且风险高、对检修人员专业水平要求高、测定数值的主观性占比大3个弊端,为此需要基于各类智能算法及技术提升道岔的智能运维水平。[方法]分析了道岔摩擦电流测试曲线4个阶段的特征,提出建立道岔摩擦电流的智能分析系统。阐述了该系统的功能及工作原理,设定了该系统的摩擦电流标准值及阈值范围。该系统可基于密度聚类算法和广度优先搜索算法自动获取道岔摩擦电流值。介绍了该系统的调试界面截图,以说明系统在获取道岔摩擦电流值如何为现场检修人员提供操作建议。[结果及结论]该智能系统具有良好的可用性,实现了节约检修时间、降低维护成本和提高检修效率的既定目的。 展开更多
关键词 城市轨道交通 信号 智能运维 道岔转辙机 摩擦电流 密度算法 广度优先搜索算法
下载PDF
改进密度峰值聚类算法的财务数据分析 被引量:1
16
作者 李青 高飞 《西安工业大学学报》 CAS 2023年第1期74-80,共7页
为了提高财务数据分析的准确度。文中采用密度峰值聚类算法进行财务数据聚类分析,实现财务数据的深度分析。通过对财务数据样本进行特征提取,建立密度峰值聚类财务分析模型。根据密度峰值聚类的核函数计算密度值,对距离值和密度值按降... 为了提高财务数据分析的准确度。文中采用密度峰值聚类算法进行财务数据聚类分析,实现财务数据的深度分析。通过对财务数据样本进行特征提取,建立密度峰值聚类财务分析模型。根据密度峰值聚类的核函数计算密度值,对距离值和密度值按降序排序,选择较大值所对应的样本点作为若干聚类中心。通过计算各节点和各个聚类中心点的距离,根据设定的距离阈值来判定样本类别。为了防止距离阈值设置不合理而对聚类结果造成较大扰动,引入果蝇优化算法对距离阈值参数进行优化改进,通过果蝇群体对味道浓度的不断更新优化,获得最优适应度个体。采用经过果蝇优化算法优化后的密度峰值聚类算法完成聚类分析,获得财务数据聚类结果。实验结果表明:通过合理设置果蝇优化算法气味变化率范围等参数,对于6类行业样本的聚类准确率均超过了0.9。相比于常用财务数据分析聚类算法,经过果蝇优化算法改进的密度峰值聚类算法能够获得更高的聚类准确率和稳定性。 展开更多
关键词 财务数据 密度峰值 果蝇算法 距离阈值
下载PDF
结合灰狼优化算法和动态邻域的三支密度峰值聚类算法
17
作者 陈沛琦 黄春梅 《长江信息通信》 2024年第1期70-73,77,共5页
针对密度峰值聚类算法聚类效果受截断距离dc的取值影响较大以及传统二支聚类处理不确定数据强制划分带来的决策错误,提出结合灰狼优化算法和动态邻域的三支密度峰值聚类算法。首先,为解决截断距离dc的选取难问题,将聚类内部指标Silhoue... 针对密度峰值聚类算法聚类效果受截断距离dc的取值影响较大以及传统二支聚类处理不确定数据强制划分带来的决策错误,提出结合灰狼优化算法和动态邻域的三支密度峰值聚类算法。首先,为解决截断距离dc的选取难问题,将聚类内部指标Silhouette指标作为目标函数,利用灰狼优化算法(GWO)的全局寻优能力求解最优的截断距离dc;为了使不确定数据的划分更加合理,结合动态邻域的思想,利用K近邻算法将二支聚类结果转化为三支聚类结果。通过在人工数据集以及UCI真实数据集的实验验证,该算法的聚类精度和总体性能优于其他5种对比算法。 展开更多
关键词 密度峰值 灰狼优化算法 三支 截断距离
下载PDF
改进的密度峰值聚类算法的差分隐私保护方案
18
作者 葛丽娜 陈园园 +1 位作者 王捷 王哲 《郑州大学学报(工学版)》 CAS 北大核心 2023年第6期19-24,共6页
针对改进的密度峰值聚类(AdDPC)算法在计算局部密度时产生的隐私泄露问题以及算法的一次分配策略,提出一种改进的密度峰值聚类算法的差分隐私保护方案。该方案在算法计算局部密度的过程中添加Laplace随机噪声,使得即使攻击者拥有最大背... 针对改进的密度峰值聚类(AdDPC)算法在计算局部密度时产生的隐私泄露问题以及算法的一次分配策略,提出一种改进的密度峰值聚类算法的差分隐私保护方案。该方案在算法计算局部密度的过程中添加Laplace随机噪声,使得即使攻击者拥有最大背景知识,也无法通过添加或者删除数据集中的某一点来获取相应的信息,从而利用差分攻击获取目标数据点的信息,达到保护隐私数据的目的,并且在分配非聚类中心点时引入可达定义改进AdDPC算法的分配策略,避免因为一次分配策略导致数据点分配错误的问题。实验对比了DP-rcCFSFDP算法、AdAPC-rDP算法、IDP K-means算法的F-Measure和ARI,结果表明:当隐私预算大于1.5时,所提算法的F-Measure和ARI优于其他算法,所提算法能够在保护敏感数据的同时保证数据的可用性。 展开更多
关键词 密度峰值 差分隐私 随机噪声 算法
下载PDF
非负拉格朗日松弛优化的子空间聚类算法
19
作者 朱东霞 贾洪杰 黄龙霞 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第1期100-113,共14页
传统的子空间聚类和谱聚类中普遍使用谱松弛方法聚类,需要先计算拉普拉斯矩阵的特征向量。特征向量中包含负数,根据元素的正负可以直接得到二类聚类的结果。对于多类聚类问题,需要递归地进行二划分,或在特征向量空间中使用k-means算法聚... 传统的子空间聚类和谱聚类中普遍使用谱松弛方法聚类,需要先计算拉普拉斯矩阵的特征向量。特征向量中包含负数,根据元素的正负可以直接得到二类聚类的结果。对于多类聚类问题,需要递归地进行二划分,或在特征向量空间中使用k-means算法聚类,分配类簇标签是间接的,这种后处理的聚类方式会增加聚类结果的不稳定性。针对谱松弛的问题,提出了一种非负拉格朗日松弛优化的子空间聚类算法,在目标函数中集成了自表示学习和秩约束。通过非负拉格朗日松弛来求解相似性矩阵和隶属矩阵,并保持隶属矩阵的非负性。在这种情况下,原来的隶属矩阵就变成了类簇的后验概率,当算法收敛时,只需将数据点分配给具有最大后验概率的类簇,即可得到聚类结果。与已有的子空间聚类和谱聚类方法相比,所提出的算法设计了新的优化规则,可以实现类簇标签的直接分配,不需要额外的聚类步骤。最后,给出了算法的收敛性证明。在5个基准聚类数据集上的大量实验表明,所提算法的聚类性能优于近几年来的子空间聚类方法。 展开更多
关键词 算法 自表示 优化 非负拉格朗日松弛 空间
下载PDF
基于密度峰值聚类算法的实验教学课程个性化推荐方法
20
作者 师海燕 齐芸 汪玲 《合肥师范学院学报》 2024年第3期110-114,共5页
海量的教学课程资源,增加了用户的选择困难性。面对这种情况,为帮助用户选择适合的课程资源,研究基于数据挖掘的实验教学课程个性化推荐方法。利用密度峰值聚类算法对用户进行聚类,并找出目标用户的最近邻。根据最近邻用户对课程的评分... 海量的教学课程资源,增加了用户的选择困难性。面对这种情况,为帮助用户选择适合的课程资源,研究基于数据挖掘的实验教学课程个性化推荐方法。利用密度峰值聚类算法对用户进行聚类,并找出目标用户的最近邻。根据最近邻用户对课程的评分,预测目标用户对每门实验课程的评分。从预测评分中选择得分最高的N个实验课程作为个性化课程推荐给目标用户。实验结果表明:当采用基于数据挖掘的推荐方法时,推荐新颖性为0.536,推荐覆盖率为95.63%,与三种传统推荐方法相比,推荐新颖性和推荐覆盖率均更大,由此说明所研究方法的推荐性能更好。 展开更多
关键词 数据挖掘 密度峰值算法 实验教学课程 个性化推荐
下载PDF
上一页 1 2 56 下一页 到第
使用帮助 返回顶部