期刊文献+
共找到800篇文章
< 1 2 40 >
每页显示 20 50 100
基于航迹数据的改进DBSCAN聚类算法研究
1
作者 申正义 李平 +2 位作者 王洪林 赵迪 郭文琪 《空天预警研究学报》 CSCD 2024年第2期128-131,共4页
为研究模拟训练航迹数据聚类,针对基于密度的噪声应用空间聚类(DBSCAN)算法参数选取不精准、聚类准确度不高的问题,提出一种改进的DBSCAN聚类算法.首先,通过KNN算法计算邻域半径并得到用于DBSCAN聚类的初始化核心数据对象,实现粗聚类;其... 为研究模拟训练航迹数据聚类,针对基于密度的噪声应用空间聚类(DBSCAN)算法参数选取不精准、聚类准确度不高的问题,提出一种改进的DBSCAN聚类算法.首先,通过KNN算法计算邻域半径并得到用于DBSCAN聚类的初始化核心数据对象,实现粗聚类;其次,根据数据对象的特点,加入航向特征进行二次聚类,既解决了DBSCAN算法随机初始化核心点和参数选取难的问题,又加入能够反映数据方向的特征;最后,进行了仿真实验.实验结果表明,改进DBSCAN算法比传统DBSCAN算法具有更好的聚类效果. 展开更多
关键词 模拟训练 dbscan算法 二次 自适应参数选取 航迹数据
下载PDF
融合密度和划分的文本聚类算法
2
作者 刘龙 刘新 +1 位作者 蔡林杰 唐朝 《计算机与数字工程》 2024年第1期178-183,共6页
文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中... 文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中的K-均值算法可以有效地聚类文档,但是算法的性能非常依赖于初始中心点的选择。论文提出了一种新的融合密度和划分的文本聚类算法。首先,通过密度选择适当的聚类中心点集合,然后使用最远距离的想法逐渐选择初始类中心点,最后使用划分方法对数据集进行聚类。实验表明,该算法的聚类效果稳定,聚类效果良好。 展开更多
关键词 文档 BERT K-均值算法 密度 最远距离
下载PDF
融合优化可调Q因子小波变换的改进密度峰值聚类算法 被引量:1
3
作者 史曼曼 宋朝炀 张景祥 《计算机应用研究》 CSCD 北大核心 2024年第2期466-472,共7页
为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化... 为提升时间序列的聚类精度,提出一种融合优化可调Q因子小波变换的改进密度峰值聚类(improved density peaks clustering based on optimal tunable Q-factor wavelet transform,OTQWT-IDPC)算法,该算法利用可调Q因子小波变换的能量优化选择策略及改进粒子群优化算法确定的最佳Q因子分解时序信号,通过最优特征子带的能量、均值、标准差和模糊熵构建特征子空间,并采用主成分分析降低特征维度,以减少特征冗余。同时,考虑到距离较远而周围密集程度较大的K近邻样本对局部密度的贡献率,引入权重系数及K近邻重新定义DPC的局部密度,并利用共享最近邻描述样本间的相似性。在BONN癫痫脑电信号和CWRU滚动轴承数据集上进行对比实验,结果表明,该算法的聚类精度分别为95%、94%,且Jacarrd、FMI和F_(1)值指标均优于其他对比算法,证明了OTQWT-IDPC算法的有效性。 展开更多
关键词 密度峰值算法 可调Q因子小波变换 粒子群优化算法 主成分分析
下载PDF
融合改进DBSCAN聚类和多种进化策略的改进蝗虫优化算法
4
作者 于平 《仪表技术与传感器》 CSCD 北大核心 2024年第5期98-105,112,共9页
针对蝗虫优化算法复杂高维问题收敛精度不高、寻优能力不强、难以跳出局部最优的缺陷,提出一种融合改进DBSCAN聚类和多种进化策略的改进蝗虫优化算法(GOA)。首先,引入多核加权距离度量和动态并行运算策略,以提高改进DBSCAN高维数据聚类... 针对蝗虫优化算法复杂高维问题收敛精度不高、寻优能力不强、难以跳出局部最优的缺陷,提出一种融合改进DBSCAN聚类和多种进化策略的改进蝗虫优化算法(GOA)。首先,引入多核加权距离度量和动态并行运算策略,以提高改进DBSCAN高维数据聚类效率。其次,利用改进DBSCAN可以对任意形状数据集进行聚类的优势,对蝗虫种群进行聚类分析,并为蝗虫个体赋予核心点、边界点和孤立点等空间属性。最后,综合考虑种群空间特性和个体间进化程度差异性,设计多种蝗虫个体进化策略,以更好地提升算法全局寻优能力。典型复杂、高维测试函数以及经典TSP问题仿真结果表明:改进后的GOA在收敛精度上更具优势。 展开更多
关键词 蝗虫优化算法 dbscan 收敛精度
下载PDF
基于类簇合并的无参数密度峰值聚类算法
5
作者 刘天娇 王胜景 袁永生 《现代电子技术》 北大核心 2024年第8期1-8,共8页
密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚... 密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚类算法(NDPCCM)。首先根据样本点两两之间的相似度的分布特征将其分为类内相似度和类间相似度两种类型,并利用类内相似度自动确定截断相似度,避免了人为设置参数;接着根据簇中心权值的下降趋势自动选择初始类簇中心,得到初始类簇;最后通过合并初始类簇对初步聚类结果进行优化,提高了聚类的准确性。在人工数据集和UCI真实数据集上,将所提算法与DPC、DBSCAN、K-means算法进行对比实验。结果表明所提算法无需输入参数就能够自动得到类簇,且聚类性能优于其他算法。 展开更多
关键词 分析 密度峰值算法 初始 簇合并 相似度 性能
下载PDF
基于人工鱼群的自适应密度峰值聚类算法
6
作者 何凯琳 张正军 +1 位作者 位雅 唐莉 《计算机工程与设计》 北大核心 2024年第1期110-119,共10页
针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,... 针对密度峰值聚类算法中截断距离d c和聚类中心缺乏选取依据,以及对簇中存在多密度峰值的数据无法准确聚类问题,提出一种基于人工鱼群的自适应密度峰值聚类算法(AFSADPC)。选择簇中心权值γ大于幂律分布上分位数的样本点作为聚类中心,根据两个相邻簇的簇间边界区域密度与簇平均密度构造簇间合并规则,利用人工鱼群算法寻找使改进轮廓系数指标达到最大值时的最优截断距离d_(c)。在合成数据集和真实数据集上的实验结果表明,AFSADPC算法具有较好的聚类效果。 展开更多
关键词 密度峰值 算法 人工鱼群算法 截断距离 幂律分布 簇合并策略 轮廓系数
下载PDF
基于密度聚类算法和广度优先搜索算法的道岔摩擦电流智能分析系统
7
作者 邱晓莉 韩思远 +1 位作者 熊庆 余东 《城市轨道交通研究》 北大核心 2024年第4期114-118,共5页
[目的]现场的道岔摩擦电流测试与调整存在流程繁琐且风险高、对检修人员专业水平要求高、测定数值的主观性占比大3个弊端,为此需要基于各类智能算法及技术提升道岔的智能运维水平。[方法]分析了道岔摩擦电流测试曲线4个阶段的特征,提出... [目的]现场的道岔摩擦电流测试与调整存在流程繁琐且风险高、对检修人员专业水平要求高、测定数值的主观性占比大3个弊端,为此需要基于各类智能算法及技术提升道岔的智能运维水平。[方法]分析了道岔摩擦电流测试曲线4个阶段的特征,提出建立道岔摩擦电流的智能分析系统。阐述了该系统的功能及工作原理,设定了该系统的摩擦电流标准值及阈值范围。该系统可基于密度聚类算法和广度优先搜索算法自动获取道岔摩擦电流值。介绍了该系统的调试界面截图,以说明系统在获取道岔摩擦电流值如何为现场检修人员提供操作建议。[结果及结论]该智能系统具有良好的可用性,实现了节约检修时间、降低维护成本和提高检修效率的既定目的。 展开更多
关键词 城市轨道交通 信号 智能运维 道岔转辙机 摩擦电流 密度算法 广度优先搜索算法
下载PDF
基于DBSCAN聚类算法的毕星团成员星辨认 被引量:1
8
作者 徐颖 吴凌燕 +2 位作者 康婷 廖涛 赖菁波 《山西电子技术》 2024年第2期46-49,共4页
疏散星团[1]在天文学和天文物理学的研究中至关重要,对其成员星的正确判断是所有研究工作的基础。成员星识别的可靠性随着天体测量技术的不断发展,而变得愈发重要。本文运用DBSCAN聚类算法,实现毕星团成员星认定问题的分析与研究。通过... 疏散星团[1]在天文学和天文物理学的研究中至关重要,对其成员星的正确判断是所有研究工作的基础。成员星识别的可靠性随着天体测量技术的不断发展,而变得愈发重要。本文运用DBSCAN聚类算法,实现毕星团成员星认定问题的分析与研究。通过色指数与温度公式求出各个侯选星成员星的温度。以绝对星等为纵坐标,将其成员星的赫罗图作为恒星表面温度的横坐标,对筛选出的毕星团成员星体绘制了一幅赫罗图。 展开更多
关键词 dbscan算法 毕星团 赫罗图 量化分析
下载PDF
结合灰狼优化算法和动态邻域的三支密度峰值聚类算法
9
作者 陈沛琦 黄春梅 《长江信息通信》 2024年第1期70-73,77,共5页
针对密度峰值聚类算法聚类效果受截断距离dc的取值影响较大以及传统二支聚类处理不确定数据强制划分带来的决策错误,提出结合灰狼优化算法和动态邻域的三支密度峰值聚类算法。首先,为解决截断距离dc的选取难问题,将聚类内部指标Silhoue... 针对密度峰值聚类算法聚类效果受截断距离dc的取值影响较大以及传统二支聚类处理不确定数据强制划分带来的决策错误,提出结合灰狼优化算法和动态邻域的三支密度峰值聚类算法。首先,为解决截断距离dc的选取难问题,将聚类内部指标Silhouette指标作为目标函数,利用灰狼优化算法(GWO)的全局寻优能力求解最优的截断距离dc;为了使不确定数据的划分更加合理,结合动态邻域的思想,利用K近邻算法将二支聚类结果转化为三支聚类结果。通过在人工数据集以及UCI真实数据集的实验验证,该算法的聚类精度和总体性能优于其他5种对比算法。 展开更多
关键词 密度峰值 灰狼优化算法 三支 截断距离
下载PDF
基于DBSCAN聚类算法的卫星数据分区异常检测
10
作者 尚星宇 《科技创新与应用》 2024年第10期138-142,共5页
随着我国第一颗电磁监测卫星的发射,卫星探测的海量数据不断涌现,探究空间载荷数据变化特征已成为当前研究热点。为了对张衡一号卫星LAP载荷数据进行异常检测,该文将处理后的数据按地理纬度划分为南纬50°到南纬20°,南纬20... 随着我国第一颗电磁监测卫星的发射,卫星探测的海量数据不断涌现,探究空间载荷数据变化特征已成为当前研究热点。为了对张衡一号卫星LAP载荷数据进行异常检测,该文将处理后的数据按地理纬度划分为南纬50°到南纬20°,南纬20°到北纬20°,北纬20°到北纬50°三个区域,依次采用DBSCAN密度聚类算法进行聚类异常检测。结果表明,该方法可用于对LAP数据的异常检测。DBSCAN密度聚类算法可用于检测卫星异常数据,为检测卫星探测数据异常、研究空间数据变化特征提供思路参考。 展开更多
关键词 ZH-1卫星 原位电子密度观测数据 异常检测 dbscan 算法
下载PDF
基于密度的聚类算法在数据挖掘中的应用与改进
11
作者 何珍珍 张馨雨 《信息记录材料》 2024年第6期116-118,共3页
本研究针对密度聚类算法在数据挖掘中的关键挑战,提出了一系列创新改进措施。通过自适应参数调整、局部核密度估计、噪声抑制和多尺度聚类分析,有效提高了聚类算法的性能。实验验证显示,这些改进在处理复杂数据集时,尤其是在噪声和多密... 本研究针对密度聚类算法在数据挖掘中的关键挑战,提出了一系列创新改进措施。通过自适应参数调整、局部核密度估计、噪声抑制和多尺度聚类分析,有效提高了聚类算法的性能。实验验证显示,这些改进在处理复杂数据集时,尤其是在噪声和多密度尺度场景下,显著增强了聚类的准确性和鲁棒性。研究结果为密度聚类算法在实际应用中的优化提供了新思路,并为相关领域的智能数据分析提供了有力工具。 展开更多
关键词 密度算法 数据挖掘 自适应参数优化 局部核密度估计
下载PDF
基于改进密度峰值聚类算法的梨花密度分级 被引量:1
12
作者 周桂红 孙乐琳 +1 位作者 梁芳芳 张秀花 《农业工程学报》 EI CAS CSCD 北大核心 2023年第1期126-135,共10页
精准判断梨花疏密程度是自动疏花的基础。为了更好地判断梨花密度,该研究提出了基于改进密度峰值聚类算法的梨花密度分级方法。该方法首先提取梨花位置坐标,获取需要聚类的数据点。其次,为了实现梨花图像的密度分级,针对原有密度峰值聚... 精准判断梨花疏密程度是自动疏花的基础。为了更好地判断梨花密度,该研究提出了基于改进密度峰值聚类算法的梨花密度分级方法。该方法首先提取梨花位置坐标,获取需要聚类的数据点。其次,为了实现梨花图像的密度分级,针对原有密度峰值聚类算法在梨花密度分级中的不足,结合梨花密度分级需求,改进了对聚类中心的选取方式,通过4组局部密度和中心偏移距离分割阈值将决策图划分为4部分来选取聚类中心,分别对应高、中、低密度以及无需疏花处理等4个等级,实现了对疏密合理的梨花图像的准确分级。最后,针对只有团状分布、稀疏分布及大尺度特写的梨花分布聚类分级不准确的问题,改进了两点间的距离d_(ij)参数的计算方法,统一梨花尺度大小和密度分级标准,对所有分布类型的梨花图像均能实现合理的密度分级。试验结果表明,该研究算法能够适应不同尺度大小的梨花图像,预测准确率为94.89%,密度分级准确率达到94.29%,可实现自然环境下局部花簇的密度分级,为机器智能疏花提供了技术支持。 展开更多
关键词 图像识别 农业 算法 密度分级 位置坐标 阈值 梨花
下载PDF
基于两阶段搜索的密度聚类算法 被引量:1
13
作者 汪勇 李巧娜 艾学轶 《计算机工程与设计》 北大核心 2023年第1期188-193,共6页
为克服当前密度聚类算法存在的随机性、主观性和连带错误等问题,提出一种基于两阶段搜索的密度聚类算法。给出密度阈值和簇最近邻定义及计算方法。采用密度排序、簇最近邻分配和自适应搜索策略构建算法的两阶段聚类机制,设计邻域递归搜... 为克服当前密度聚类算法存在的随机性、主观性和连带错误等问题,提出一种基于两阶段搜索的密度聚类算法。给出密度阈值和簇最近邻定义及计算方法。采用密度排序、簇最近邻分配和自适应搜索策略构建算法的两阶段聚类机制,设计邻域递归搜索和簇最近邻搜索两个阶段的聚类算法,实现不同密度数据点的准确聚类。8个数据集聚类实验结果表明,该密度聚类算法聚类稳定,无噪声,且自动确定类簇数,聚类精度优于比较的密度聚类算法。 展开更多
关键词 算法 密度 算法设计 两阶段搜索 密度阈值 簇最近邻 分配策略
下载PDF
一种基于目标点云分布特性的动态聚类算法
14
作者 李彩虹 何晨阳 +1 位作者 高锋 陈佳欣 《汽车安全与节能学报》 CAS CSCD 北大核心 2024年第2期261-267,共7页
激光雷达在自动驾驶系统的目标检测任务中发挥着重要作用,但其扫描机理会使得点云分布不均匀,常规聚类算法由于参数固定会导致较多的错误聚类。为解决该问题,该文以椭圆形状作为邻域空间,设计基于采样点位置的邻域自适应调整策略,提出... 激光雷达在自动驾驶系统的目标检测任务中发挥着重要作用,但其扫描机理会使得点云分布不均匀,常规聚类算法由于参数固定会导致较多的错误聚类。为解决该问题,该文以椭圆形状作为邻域空间,设计基于采样点位置的邻域自适应调整策略,提出一种基于目标点云分布特性的动态聚类算法。通过正确聚类、过聚类等综合结果评估算法的性能,在KITTI数据集上进行了数值分析得到算法参数,并在校园环境中进行了实车对比实验。结果表明:所提算法能减少基于密度的噪声应用空间聚类(DBSCAN)中固定邻域所造成的70.60%过聚类、49.76%欠聚类等错误结果,从而有效提高算法的综合聚类性能。 展开更多
关键词 智能汽车 目标检测 激光雷达 点云 KITTI数据集 基于密度的噪声应用空间(dbscan)
下载PDF
改进的密度峰值聚类算法的差分隐私保护方案
15
作者 葛丽娜 陈园园 +1 位作者 王捷 王哲 《郑州大学学报(工学版)》 CAS 北大核心 2023年第6期19-24,共6页
针对改进的密度峰值聚类(AdDPC)算法在计算局部密度时产生的隐私泄露问题以及算法的一次分配策略,提出一种改进的密度峰值聚类算法的差分隐私保护方案。该方案在算法计算局部密度的过程中添加Laplace随机噪声,使得即使攻击者拥有最大背... 针对改进的密度峰值聚类(AdDPC)算法在计算局部密度时产生的隐私泄露问题以及算法的一次分配策略,提出一种改进的密度峰值聚类算法的差分隐私保护方案。该方案在算法计算局部密度的过程中添加Laplace随机噪声,使得即使攻击者拥有最大背景知识,也无法通过添加或者删除数据集中的某一点来获取相应的信息,从而利用差分攻击获取目标数据点的信息,达到保护隐私数据的目的,并且在分配非聚类中心点时引入可达定义改进AdDPC算法的分配策略,避免因为一次分配策略导致数据点分配错误的问题。实验对比了DP-rcCFSFDP算法、AdAPC-rDP算法、IDP K-means算法的F-Measure和ARI,结果表明:当隐私预算大于1.5时,所提算法的F-Measure和ARI优于其他算法,所提算法能够在保护敏感数据的同时保证数据的可用性。 展开更多
关键词 密度峰值 差分隐私 随机噪声 算法
下载PDF
用于雷达信号分选的K中位最近邻聚类算法
16
作者 伍佳钰 甄佳奇 《黑龙江大学自然科学学报》 CAS 2024年第4期496-504,共9页
在处理雷达信号时,基于密度的空间聚类(Density-based spatial clustering of applications with noise,DBSCAN)分选算法依赖于参数或阈值的选取,影响分选的准确率。为此提出了一种改进的雷达信号脉冲分选算法,在DBSCAN聚类基础上结合了... 在处理雷达信号时,基于密度的空间聚类(Density-based spatial clustering of applications with noise,DBSCAN)分选算法依赖于参数或阈值的选取,影响分选的准确率。为此提出了一种改进的雷达信号脉冲分选算法,在DBSCAN聚类基础上结合了K中位最近邻(K-median nearest neighbor,KMNN)算法,通过引入自衰减系数并设置阈值上限对参数值列表进行二次处理,可以自适应根据聚类结果与不同参数时的K值之间的关系确定最优的邻域半径和最少点个数,提高了分选的正确率。通过仿真实验验证了算法利用雷达脉冲描述字特征进行自适应分选的有效性。 展开更多
关键词 雷达信号分选 dbscan K中位最近邻算法
下载PDF
基于优化K-means算法的高校成绩聚类分析研究
17
作者 张梁 杨立波 +1 位作者 张小勇 史俊冰 《太原学院学报(自然科学版)》 2024年第2期79-84,共6页
针对经典K均值算法在聚类中心易受异常值影响,导致聚类结果不稳定的问题,提出基于样本分布密度的优化K-means算法,以提高聚类稳定性和准确性;聚类后通过CH指数和分类区间占比总体两种方法,客观评价3种离散化方法,结果表明,优化的K-mean... 针对经典K均值算法在聚类中心易受异常值影响,导致聚类结果不稳定的问题,提出基于样本分布密度的优化K-means算法,以提高聚类稳定性和准确性;聚类后通过CH指数和分类区间占比总体两种方法,客观评价3种离散化方法,结果表明,优化的K-means算法避免了区间分类不合理现象,更加准确地反映了成绩样本的分布特点。 展开更多
关键词 均值算法 分布密度 K-MEANS
下载PDF
基于融合改进K-means聚类算法的数据检测技术 被引量:1
18
作者 郭克难 《电子设计工程》 2024年第5期41-45,共5页
针对现有医疗财务数据分析系统平台老旧,采用传统K-means算法进行数据处理时性能较差的问题,文中设计了一种财务异常数据检测算法。对于传统K-means算法存在的分类效果不佳、运行效率偏低等不足,该算法结合密度峰值法对样本点的局部密... 针对现有医疗财务数据分析系统平台老旧,采用传统K-means算法进行数据处理时性能较差的问题,文中设计了一种财务异常数据检测算法。对于传统K-means算法存在的分类效果不佳、运行效率偏低等不足,该算法结合密度峰值法对样本点的局部密度和高密度距离进行计算,进而优化簇中心的选择。同时融合PCA降维算法减少了数据的冗余信息,进一步提高了运行效率。通过引入LOF离群检测算法对分簇后的数据进行检测,从而得到异常数据结果。实验测试中,所提算法在人工数据集上的平均ARI指标为0.844,真实数据集的准确率则达到了79.2%,在所有对比算法中均为最优,表明该算法具有良好的性能,可以对财务异常数据进行准确地检测。 展开更多
关键词 K-MEANS 密度峰值检测 主成分分析法 离群检测算法 异常数据检测
下载PDF
自适应邻域密度聚类及事故黑点识别应用
19
作者 刘韡 黄俊龙 +1 位作者 鲁娜 刁麓弘 《黑龙江交通科技》 2024年第6期138-143,150,共7页
聚类作为识别交通事故黑点的主要方法之一,其主要问题是交通事故多发区事先无法确定,即无法提前知道聚类簇数。利用样本点之间的连接概率定义了数据点的局部密度,根据局部密度大小来确定聚类中心和簇数,再对数据点进行聚类。结果表明:... 聚类作为识别交通事故黑点的主要方法之一,其主要问题是交通事故多发区事先无法确定,即无法提前知道聚类簇数。利用样本点之间的连接概率定义了数据点的局部密度,根据局部密度大小来确定聚类中心和簇数,再对数据点进行聚类。结果表明:一是算法对参数不敏感,具有较好的通用性;二是算法能自动确定聚类簇数;三是算法聚类过程只依赖局部密度与邻接点,能够识别噪声点,提升结果的准确性。运用算法在一些真实数据集上进行试验,将聚类结果与其他算法结果利用评价指标ARI(Adjusted Rand Index)和NMI(Normalized Mutual Information)进行比较。最后利用算法对美国6个州的交通事故进行聚类,结果表明算法对交通事故有较好的适应性,能将城市及周边道路上事故密集区域准确识别出来。 展开更多
关键词 交通事故黑点 算法 簇数 自适应邻域 局部密度
下载PDF
改进密度峰值聚类算法的财务数据分析
20
作者 李青 高飞 《西安工业大学学报》 CAS 2023年第1期74-80,共7页
为了提高财务数据分析的准确度。文中采用密度峰值聚类算法进行财务数据聚类分析,实现财务数据的深度分析。通过对财务数据样本进行特征提取,建立密度峰值聚类财务分析模型。根据密度峰值聚类的核函数计算密度值,对距离值和密度值按降... 为了提高财务数据分析的准确度。文中采用密度峰值聚类算法进行财务数据聚类分析,实现财务数据的深度分析。通过对财务数据样本进行特征提取,建立密度峰值聚类财务分析模型。根据密度峰值聚类的核函数计算密度值,对距离值和密度值按降序排序,选择较大值所对应的样本点作为若干聚类中心。通过计算各节点和各个聚类中心点的距离,根据设定的距离阈值来判定样本类别。为了防止距离阈值设置不合理而对聚类结果造成较大扰动,引入果蝇优化算法对距离阈值参数进行优化改进,通过果蝇群体对味道浓度的不断更新优化,获得最优适应度个体。采用经过果蝇优化算法优化后的密度峰值聚类算法完成聚类分析,获得财务数据聚类结果。实验结果表明:通过合理设置果蝇优化算法气味变化率范围等参数,对于6类行业样本的聚类准确率均超过了0.9。相比于常用财务数据分析聚类算法,经过果蝇优化算法改进的密度峰值聚类算法能够获得更高的聚类准确率和稳定性。 展开更多
关键词 财务数据 密度峰值 果蝇算法 距离阈值
下载PDF
上一页 1 2 40 下一页 到第
使用帮助 返回顶部