期刊文献+
共找到44,603篇文章
< 1 2 250 >
每页显示 20 50 100
数据流上基于K-median聚类的算法研究 被引量:3
1
作者 郑广寰 林锦贤 《微电子学与计算机》 CSCD 北大核心 2006年第z1期190-192,共3页
文章研究和分析了数据流上的K-median聚类算法技术,包括:(1)流模型和K-median问题定义;(2)基于流的K-median聚类基本决策和内在机理;(3)理论上有性能保证的流算法。对于每一特征,这种技术能在没有实际保留任何数据流对象的情形下有效地... 文章研究和分析了数据流上的K-median聚类算法技术,包括:(1)流模型和K-median问题定义;(2)基于流的K-median聚类基本决策和内在机理;(3)理论上有性能保证的流算法。对于每一特征,这种技术能在没有实际保留任何数据流对象的情形下有效地确定聚类点。它通过一个聚类块的一分为二或相邻聚类块的合二为一来动态地生成聚类点,从而实现上述目标。作为结果,这种技术所确定的聚类点将比其他常规方法更准确。在数据流环境中,这种技术能够在产生高质量聚类结果的同时非常有效地执行。 展开更多
关键词 数据流 k-median聚类 算法 理念
下载PDF
基于大数据聚类的通信网络安全态势预测技术 被引量:5
2
作者 陈功平 王红 《淮阴师范学院学报(自然科学版)》 CAS 2024年第1期20-26,共7页
传统通信网络安全态势预测技术缺乏大数据支撑,难以对发生的攻击进行详细分类和追踪,导致在进行长时间的态势预测中收敛过慢,准确度降低.提出一种基于大数据聚类的通信网络安全态势预测技术.分析通信网络的属性以及特点,选择安全态势描... 传统通信网络安全态势预测技术缺乏大数据支撑,难以对发生的攻击进行详细分类和追踪,导致在进行长时间的态势预测中收敛过慢,准确度降低.提出一种基于大数据聚类的通信网络安全态势预测技术.分析通信网络的属性以及特点,选择安全态势描述一级指标,将数据标准化处理之后,细分出二级指标;优化大数据聚类算法,计算最优聚类数量、确定聚类中心,建立关联规则库并优化预测流程,完成基于大数据聚类的通信网络安全态势预测技术的设计.通过实验结果表明,与两种传统的安全态势预测技术相比,设计的技术收敛速度更快,全体数据点没有出现残差扩散的现象,并且数据完整度较高. 展开更多
关键词 大数据 通信网络 安全态势 描述指标 优化 收敛速度
下载PDF
基于层次分析灰色定权聚类的煤层气开发甜点预测方法——以柿庄北区块为例 被引量:2
3
作者 张亚飞 张松航 +2 位作者 邓志宇 王瑞欣 刘广景 《煤炭科学技术》 EI CAS CSCD 北大核心 2024年第5期166-175,共10页
随着煤层气产业的发展以及非常规油气勘探开发一体化的要求,当前煤层气的勘查评价工作逐渐由勘探选区向开发甜点选区推进。然而,受限于勘探开发阶段或资料占有程度,当前多数的选区评价体系对煤储层的可改性和煤层气的可采性考虑不足,在... 随着煤层气产业的发展以及非常规油气勘探开发一体化的要求,当前煤层气的勘查评价工作逐渐由勘探选区向开发甜点选区推进。然而,受限于勘探开发阶段或资料占有程度,当前多数的选区评价体系对煤储层的可改性和煤层气的可采性考虑不足,在指导开发区井位优选或加密井方面效果不佳。基于沁水盆地柿庄北区块100余口煤层气参数井和开发井资料,分析区内3号煤层煤层气开发的资源条件、储层可改造性和煤层气可采性,采用层次分析和灰色定权聚类方法构建评价模型,评价了煤层气开发甜点区,为区内新井和加密井的部署提供依据。评价模型以煤层含气量、煤厚反映煤层气资源条件;综合考虑地应力环境和岩石力学性质,构建储层综合可改造性参数,评价储层可改造性;使用原始结构煤和碎裂煤占比、临储比和储层原始渗透率反映煤层气的可采性。每个参数采用word聚类方法分级,每个点位(每口井)计算出综合优度并排序,最终划分出煤层气开发甜点区。评价结果表明,研究区中部综合优度大于65的地区为进一步开展开发工作的甜点区。 展开更多
关键词 煤层气 柿庄北区块 评价体系 层次分析法 灰色定权 开发甜点
下载PDF
采用混合策略联合优化的模糊C-均值聚类信息熵点云简化算法 被引量:1
4
作者 黄鹤 黄佳慧 +2 位作者 刘国权 王会峰 高涛 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第7期214-226,共13页
针对传统聚类算法处理点云简化问题时精度低、耗时长且易丢失特征信息等问题,提出了一种基于动态精英自适应混合策略的鹈鹕算法(DEAMPOA)与加权熵法联合优化的模糊C-均值聚类(FCM)信息熵点云简化算法。采用动态自适应种群混合策略,同时... 针对传统聚类算法处理点云简化问题时精度低、耗时长且易丢失特征信息等问题,提出了一种基于动态精英自适应混合策略的鹈鹕算法(DEAMPOA)与加权熵法联合优化的模糊C-均值聚类(FCM)信息熵点云简化算法。采用动态自适应种群混合策略,同时融合了精英反向化思路,显著提升了鹈鹕优化算法(POA)的收敛趋势和全局寻优能力,提高了寻找FCM最优聚类中心的成功率;利用DEAMPOA结合加权熵法对FCM进行优化,提高鲁棒性的同时增强了搜索精度,得到较好的聚类结果;在8种UCI标准数据集上与4种算法对比进行聚类性能评估实验,验证了所提方法综合性能优越;将所提方法与信息熵融合,并应用在三维点云KITTI数据集简化中。实验结果表明:与包围框简化法、随机采样简化法和特征选择简化法对比,所提方法全局误差简化前后点集之间平均欧式距离(MED)指标分别降低了2.25%、6.93%、5.74%,点云简化效果最优且运行速度满足要求。 展开更多
关键词 C-均值 鹈鹕优化算法 点云简化 信息熵
下载PDF
基于谱聚类的中国绿色创新效率评价及影响机理研究 被引量:1
5
作者 郝立丽 张盼 +1 位作者 李洪敏 王威 《东北师大学报(自然科学版)》 CAS 北大核心 2024年第1期46-54,共9页
基于创新价值链视角,运用超效率SBM-Undesirable模型分别测算了中国30个省份技术研发和成果转化2个阶段的绿色创新效率;利用谱聚类算法将中国30个省份进行了绿色创新区域划分,并应用Kernel密度估计方法对各区域绿色创新效率的差异性进... 基于创新价值链视角,运用超效率SBM-Undesirable模型分别测算了中国30个省份技术研发和成果转化2个阶段的绿色创新效率;利用谱聚类算法将中国30个省份进行了绿色创新区域划分,并应用Kernel密度估计方法对各区域绿色创新效率的差异性进行了研究;构建了面板Tobit模型,探究影响因素对各区域绿色创新效率的影响机理.结果表明:从全国范围看,成果转化阶段绿色创新效率高于技术研发阶段,技术研发阶段仍然存在较大的提升空间;划分成的3个绿色创新区域绿色创新效率存在不均衡性,各区域绿色创新效率演变规律存在显著差异;不同阶段的影响因素对各区域绿色创新效率的影响程度和方向存在差异性.基于分析结论,从政府支持力度、环境规制等方面对不同区域提高绿色创新效率给出针对性建议. 展开更多
关键词 创新价值链 绿色创新效率
下载PDF
基于多帧聚类的紧凑型HFSWR虚假点迹识别方法 被引量:1
6
作者 孙伟峰 赵林林 +1 位作者 纪永刚 戴永寿 《系统工程与电子技术》 EI CSCD 北大核心 2024年第2期419-427,共9页
紧凑型高频地波雷达发射功率低,目标检测时信噪比低、虚警率高,会产生大量虚假点迹,影响后续目标跟踪性能。为了滤除虚假点迹,利用目标的运动特性,提出了一种多帧聚类与极限学习机分类两级级联的虚假点迹识别方法。首先,利用基于最优邻... 紧凑型高频地波雷达发射功率低,目标检测时信噪比低、虚警率高,会产生大量虚假点迹,影响后续目标跟踪性能。为了滤除虚假点迹,利用目标的运动特性,提出了一种多帧聚类与极限学习机分类两级级联的虚假点迹识别方法。首先,利用基于最优邻域尺寸的多帧聚类方法,将连续多帧中与待识别点迹属于同一潜在目标的点迹聚类成簇。然后,计算簇内待识别点迹与其相邻帧内点迹的距离-多普勒速度的差分值,以其为特征利用极限学习机辨识虚假点迹。实验结果表明,所提方法能够准确将属于同一目标的点迹聚类,虚假点迹识别率达到95%。 展开更多
关键词 紧凑型地波雷达 虚假点迹识别 多帧 极限学习机
下载PDF
基于局部密度聚类的WSN多Sink节点部署研究 被引量:1
7
作者 李翠然 吕安琪 +1 位作者 谢健骊 孙振刚 《传感技术学报》 CAS CSCD 北大核心 2024年第2期326-331,共6页
针对无线传感器网络中传感器节点能量受限,网络生命周期短的问题,在考虑网络成本的情况下,提出一种基于节点局部密度聚类的多Sink节点优化部署算法。首先,基于多属性因子构建聚类决策函数确定Sink节点部署位置,完成传感器节点聚类;然后... 针对无线传感器网络中传感器节点能量受限,网络生命周期短的问题,在考虑网络成本的情况下,提出一种基于节点局部密度聚类的多Sink节点优化部署算法。首先,基于多属性因子构建聚类决策函数确定Sink节点部署位置,完成传感器节点聚类;然后,根据下一跳节点与Sink节点间距离最短准则搜索并形成数据传输路径;最后,以网络生命周期成本比最大化为依据确定最优的Sink节点数目,实现多Sink节点优化部署。仿真结果表明:与已有算法相比,所提算法能够有效延长网络生命周期,具有较高的网络生命周期能效比。 展开更多
关键词 无线传感器网络 Sink节点部署 局部密度 网络生命周期
下载PDF
基于累积和事件段识别与改进谱聚类的锂离子电池储能系统内短路故障检测方法 被引量:1
8
作者 肖先勇 陈智凡 +2 位作者 汪颖 何涛 张逢蓉 《电网技术》 EI CSCD 北大核心 2024年第2期658-667,共10页
锂离子电池系统的内短路故障可能导致严重安全事故,其检测受到在线检测实时性以及故障特征获得性制约,是当下锂离子电池储能系统安全运行亟待解决的问题。该文提出一种基于累积和(cumulative sum,CUSUM)事件段检测与改进谱聚类的锂离子... 锂离子电池系统的内短路故障可能导致严重安全事故,其检测受到在线检测实时性以及故障特征获得性制约,是当下锂离子电池储能系统安全运行亟待解决的问题。该文提出一种基于累积和(cumulative sum,CUSUM)事件段检测与改进谱聚类的锂离子电池储能系统内短路故障检测方法。首先,考虑内短路故障时的电压/温度变化特性,基于累积和事件突变点识别方法,识别疑似内短路故障事件段。其次,构建三维故障特征,刻画检测对象内短路故障特征属性。然后,构建基于Wasserstein测度的内短路故障特征距离矩阵,检测三维空间各点稀疏特性,客观划定故障聚类,实现内短路故障检测。搭建锂离子电池内短路实验平台、建立锂离子电池电–热耦合仿真模型,算例结果表明该文方法能够准确识别疑似内短路故障事件段,在不同串并联形式及故障类型下实现故障检测,证明了该文方法的正确性与可行性。 展开更多
关键词 内短路故障检测 事件段检测 故障特征 Wasserstein距离 改进谱算法
下载PDF
基于软聚类的深度图增强方法 被引量:1
9
作者 杨洋 何童瑶 +2 位作者 詹永照 赵岩 王新宇 《江苏大学学报(自然科学版)》 CAS 北大核心 2024年第2期183-190,共8页
针对现有的深度获取方式存在数据缺失、分辨率低等问题,提出一种基于软聚类的深度图增强方法,称为软聚类求解器.该方法利用软聚类的强边缘保持特性提高深度图增强的精度.将软聚类仿射矩阵和加权最小二乘模型有机结合,构建了软聚类求解... 针对现有的深度获取方式存在数据缺失、分辨率低等问题,提出一种基于软聚类的深度图增强方法,称为软聚类求解器.该方法利用软聚类的强边缘保持特性提高深度图增强的精度.将软聚类仿射矩阵和加权最小二乘模型有机结合,构建了软聚类求解器中的置信加权最小二乘模型,提出了基于迭代的求解方法.为评估所提出的方法,在多项深度图增强任务上进行试验,包括深度图补洞、深度图超分辨率和深度图纠正,评价指标包含了峰值信噪比(PSNR)、结构相似度(SSIM)、均方根差(RMSE)和运行效率.结果表明:文中方法在深度图补洞任务中的平均PSNR达到了42.28,平均SSIM达到了98.83%;在深度图超分辨率、深度图纠正任务中的平均RMSE达到了8.96、 2.36.文中方法处理1张分辨率为2 048×1 024像素的图像仅需5.03 s. 展开更多
关键词 图像处理 计算机视觉 加权最小二乘 深度图增强 置信度 三维空间
下载PDF
基于融合矩阵的文本相似度计算实现检索结果聚类 被引量:1
10
作者 赵悦阳 崔雷 《医学信息学杂志》 CAS 2024年第3期58-64,共7页
目的/意义弥补医学文本语义表示方面的不足,实现PubMed数据库检索结果聚类。方法/过程采用Jaccard系数和TF-IDF构建融合矩阵方法,建立短语间、文档间、短语与文档内容间的相似性关系融合矩阵,训练聚类算法,将PubMed数据库检索结果集合分... 目的/意义弥补医学文本语义表示方面的不足,实现PubMed数据库检索结果聚类。方法/过程采用Jaccard系数和TF-IDF构建融合矩阵方法,建立短语间、文档间、短语与文档内容间的相似性关系融合矩阵,训练聚类算法,将PubMed数据库检索结果集合分组,随后生成类别标签,描述每一类簇文档的含义。结果/结论基于融合矩阵的聚类效果较好,提取出描述类别的高频词能很好地区分类别含义,对检索结果文本聚类任务有效。 展开更多
关键词 文献检索 文本 融合矩阵 文本相似度
下载PDF
基于一致性图的权重自适应多视角谱聚类算法
11
作者 王丽娟 邢津萍 +3 位作者 尹明 郝志峰 蔡瑞初 温雯 《计算机工程》 CAS CSCD 北大核心 2024年第2期122-131,共10页
随着移动设备和互联网的普及,多视角数据的采集和分享变得更加容易,其可以从多个视角更准确地描述数据。目前,一些多视角聚类算法忽略了不同视角间的一致性潜在知识和不同视角的重要性。针对该问题,提出一种平衡视角间一致性信息的多视... 随着移动设备和互联网的普及,多视角数据的采集和分享变得更加容易,其可以从多个视角更准确地描述数据。目前,一些多视角聚类算法忽略了不同视角间的一致性潜在知识和不同视角的重要性。针对该问题,提出一种平衡视角间一致性信息的多视角聚类算法。首先通过调节视角权重学习视角间一致的共享相似度矩阵,提升共享矩阵的一致性,其中相关性强的视角具有的一致性信息更多,视角权重越大,在一致性学习中发挥的作用越大,而差异性大的视角其权重越小,在学习中发挥的作用越小。其次学习视角间的一致性样本嵌入以及不同视角的特征嵌入,并将特征嵌入中包含的多样性特征信息迁移到样本嵌入中,以此促进样本嵌入的一致性表达。在不同视角特征中包含多样性信息,可补充上述共享相似度矩阵学习中单一样本关系的不足。因此,采用二部图协同聚类,通过建立样本数据、样本嵌入和特征嵌入的关系图,学习样本的特征嵌入,并将其迁移到样本嵌入中。最后将图学习、谱聚类和特征嵌入学习整合到统一的框架中进行联合优化,得到最优的样本嵌入。实验结果表明,通过对样本嵌入进行K-means聚类,将该算法运行于5个真实数据集并与7种聚类算法对比,其中在3-Sources、Yale、MRSCV1数据集上的正确率均高于对比算法5%以上,验证了该算法的有效性。 展开更多
关键词 多视角 一致性学习 权重自适应 协同
下载PDF
基于LMDI和系统聚类的电力行业碳排放影响因素分析 被引量:2
12
作者 施应玲 余欣玥 《生态经济》 北大核心 2024年第2期22-29,共8页
电力行业作为直接使用一次能源的最大部门,是落实我国碳减排目标的重点行业。为厘清电力行业碳排放的主要驱动或抑制来源,论文构建了LMDI模型,从国家及省域两个层面对2006—2020年电力行业碳排放的影响因素进行了分解。研究结果表明,从... 电力行业作为直接使用一次能源的最大部门,是落实我国碳减排目标的重点行业。为厘清电力行业碳排放的主要驱动或抑制来源,论文构建了LMDI模型,从国家及省域两个层面对2006—2020年电力行业碳排放的影响因素进行了分解。研究结果表明,从国家及省域两个层面来看,经济发展效应均为电力碳排放的主要促进因素,火电燃料转化效应和产业结构效应均为电力碳排放的抑制因素,电源结构效应、工业电耗强度效应在全国层面为电力碳排放的抑制因素,但在各省份中的影响效果及程度各有不同。论文以主要抑制因素为变量,利用系统聚类法将30个省份划分为六大区域,针对各区域影响因素的作用效果提出了因地制宜的减排政策。 展开更多
关键词 电力行业 碳排放 影响因素 LMDI模型 Q系统
下载PDF
基于网格近邻优化的密度峰值聚类算法 被引量:1
13
作者 刘继 杨金瑞 《计算机应用研究》 CSCD 北大核心 2024年第4期1058-1063,共6页
密度峰值聚类(DPC)将数据样本点的局部密度和相对距离进行结合,能对任意形状数据集进行聚类处理,但密度峰值聚类算法存在主观选择截断距离、简单分配策略和较高时间复杂度等问题。为此,提出了一种基于网格近邻优化的密度峰值聚类算法(KG... 密度峰值聚类(DPC)将数据样本点的局部密度和相对距离进行结合,能对任意形状数据集进行聚类处理,但密度峰值聚类算法存在主观选择截断距离、简单分配策略和较高时间复杂度等问题。为此,提出了一种基于网格近邻优化的密度峰值聚类算法(KG-DPC算法)。首先对数据空间进行网格化,减少了样本数据点之间距离的计算量;在计算局部密度时不仅考虑了网格自身的密度值,而且考虑了周围k个近邻的网格密度值,降低了主观选择截断距离对聚类结果的影响,提高了聚类准确率,设定网格密度阈值,保证了聚类结果的稳定性。通过实验结果表明,KG-DPC算法比DBSCAN、DPC和SDPC算法在聚类准确率上有很大提升,在聚类平均消耗时间上DPC、SNN-DPC和DPC-NN算法分别降低38%、44%和44%。在保证基本聚类准确率的基础上,KG-DPC算法在聚类效率上有特定优势。 展开更多
关键词 密度峰值 密度阈值 网格 近邻优化
下载PDF
基于模糊聚类和改进Densenet网络的小样本轴承故障诊断 被引量:1
14
作者 魏文军 张轩铭 杨立本 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2024年第3期154-163,共10页
针对实际中轴承的故障数据少难以满足深度学习数据大量训练模型的要求,利用卷积神经网络的微小特征提取优势和模糊聚类不需要训练即可完成分类的特点,提出了一种基于模糊聚类和改进Densenet网络的小样本轴承故障诊断方法。首先将预训练... 针对实际中轴承的故障数据少难以满足深度学习数据大量训练模型的要求,利用卷积神经网络的微小特征提取优势和模糊聚类不需要训练即可完成分类的特点,提出了一种基于模糊聚类和改进Densenet网络的小样本轴承故障诊断方法。首先将预训练微调的Densenet网络去掉分类只保留特征提取层,设计一个维度自适应全局均值池化层(GAP)代替全连接层(FC),其次利用模糊聚类代替Densenet网络的softmax分类层,不需要训练即可完成分类。实验结果表明:该算法利用小样本数据训练网络中的GAP参数,模型需要的训练样本大大减少,诊断时将轴承时域图像输入到网络中,在GAP层输出1 920个特征数据,不同故障状态的特征数据构建特征向量矩阵,利用模糊聚类方法求得模糊相似矩阵和模糊等价矩阵,当置信因子从大到小变化时,由对应布尔矩阵得到动态聚类图,从而实现轴承故障分类。 展开更多
关键词 小样本 全局均值池化层 迁移学习 模糊 故障诊断
下载PDF
复杂动态负荷幅度域波形模态聚类与电能表误差敏感特征 被引量:2
15
作者 王学伟 顾鹏婷 +2 位作者 袁瑞铭 李文文 王国兴 《北京化工大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第1期92-100,共9页
针对复杂动态负荷游程波形模态及引起电能表误差的典型特征认识不足的问题,首先提出动态电流信号幅度域游程波形模态提取算法,提取了多种幅度域毫秒级小颗粒度游程波形模态;其次,提出LK-Shape游程波形模态聚类算法,提取了动态电流信号... 针对复杂动态负荷游程波形模态及引起电能表误差的典型特征认识不足的问题,首先提出动态电流信号幅度域游程波形模态提取算法,提取了多种幅度域毫秒级小颗粒度游程波形模态;其次,提出LK-Shape游程波形模态聚类算法,提取了动态电流信号幅度域的6类典型游程波形模态及其快速变化特征;最后,提出导致电能表超差的两种敏感游程波形模态,并通过实验验证了该游程波形模态适于测试电能表误差,表明了所提方法的有效性和实用性。 展开更多
关键词 动态电能计量 波形模态 波形特征提取 信号典型特征 信号敏感特征
下载PDF
基于二部图的联合谱嵌入多视图聚类算法
16
作者 赵兴旺 王淑君 +1 位作者 刘晓琳 梁吉业 《软件学报》 EI CSCD 北大核心 2024年第9期4408-4424,共17页
多视图聚类在图像处理、数据挖掘和机器学习等领域引起了越来越多的关注.现有的多视图聚类算法存在两个不足,一是在图构造过程中只考虑每个视图数据之间的成对关系生成亲和矩阵,而缺乏邻域关系的刻画;二是现有的方法将多视图信息融合和... 多视图聚类在图像处理、数据挖掘和机器学习等领域引起了越来越多的关注.现有的多视图聚类算法存在两个不足,一是在图构造过程中只考虑每个视图数据之间的成对关系生成亲和矩阵,而缺乏邻域关系的刻画;二是现有的方法将多视图信息融合和聚类的过程相分离,从而降低了算法的聚类性能.为此,提出一种更为准确和鲁棒的基于二部图的联合谱嵌入多视图聚类算法.首先,基于多视图子空间聚类的思想构造二部图进而产生相似图,接着利用相似图的谱嵌入矩阵进行图融合,其次,在融合过程中考虑每个视图的重要性进行权重约束,进而引入聚类指示矩阵得到最终的聚类结果.提出的模型将二部图、嵌入矩阵与聚类指示矩阵约束在一个框架下进行优化.此外,提供一种求解该模型的快速优化策略,该策略将优化问题分解成小规模子问题,并通过迭代步骤高效解决.提出算法和已有的多视图聚类算法在真实数据集上进行实验分析.实验结果表明,相比已有方法,提出算法在处理多视图聚类问题上是更加有效和鲁棒的. 展开更多
关键词 多视图 子空间 二部图 谱嵌入矩阵 指示矩阵
下载PDF
跳跃跟踪SSA交叉迭代AP聚类算法
17
作者 黄鹤 李文龙 +3 位作者 杨澜 王会峰 高涛 陈婷 《电子学报》 EI CAS CSCD 北大核心 2024年第3期977-990,共14页
针对传统近邻传播聚类算法以数据点对之间的相似度作为输入度量,由于需要预设偏向参数p和阻尼系数λ,算法精度无法精确控制的问题,提出了一种跳跃跟踪麻雀搜索算法优化的交叉迭代近邻传播聚类方法.首先,针对麻雀搜索算法中发现者和加入... 针对传统近邻传播聚类算法以数据点对之间的相似度作为输入度量,由于需要预设偏向参数p和阻尼系数λ,算法精度无法精确控制的问题,提出了一种跳跃跟踪麻雀搜索算法优化的交叉迭代近邻传播聚类方法.首先,针对麻雀搜索算法中发现者和加入者位置更新不足的问题,设计了一种跳跃跟踪优化策略,通过考虑偏好阻尼因子的跳跃策略设计大步长更新发现者,增加麻雀搜索算法的全局勘探能力和寻优速度,加入者设计动态小步长跟踪领头雀更新位置,同时,利用自适应种群划分机制更新发现者和加入者的比重,增加算法的后期局部开发能力和寻优速度;其次,设计基于扰动因子的Tent映射,在此基础上增加3个参数,使映射分布范围增大,并避免了陷入小周期点和不稳周期点;最后,引入轮廓系数作为评价函数,跳跃跟踪麻雀搜索算法自动寻找较优的p和λ,代替手动输入参数,并融合基于扰动因子的Tent映射优化近邻传播算法,交叉迭代确定最优簇数.使用多种算法聚类University of California Irvine数据集的10种公共数据集,仿真结果表明,本文提出的聚类算法与经典近邻传播算法、基于差分改进的仿射传播聚类算法、基于麻雀搜索算法优化的近邻传播聚类算法和进化近邻传播算法相比具有更优的搜索效率以及聚类精度.对国家信息数据进行了聚类分析,提出的方法更加准确有效合理,具有较好的应用价值. 展开更多
关键词 近邻传播 改进Tent映射 改进麻雀搜索算法 轮廓系数 数据集
下载PDF
基于机器学习的茶树DNA聚类算法
18
作者 杨小平 倪萍 +4 位作者 诸葛天秋 罗跃新 郭春雨 庞月兰 吴雨婷 《广西大学学报(自然科学版)》 CAS 北大核心 2024年第2期386-399,共14页
为了研究茶树基因序列的聚类问题,设计一种基于累计方差贡献率进行改进的核主成分分析(KPCA)与k均值(k-means)++聚类算法相结合的降维聚类算法(KPCA-k-means++)。将基因库数据集筛选分组后,利用k-mers算法提取基因数据的数据特征,根据... 为了研究茶树基因序列的聚类问题,设计一种基于累计方差贡献率进行改进的核主成分分析(KPCA)与k均值(k-means)++聚类算法相结合的降维聚类算法(KPCA-k-means++)。将基因库数据集筛选分组后,利用k-mers算法提取基因数据的数据特征,根据累计方差贡献率的占比大于85%的标准确定降维主元个数对KPCA进行降维改进并采用k-means++算法对降维后数据聚类,通过CH(Calinski-Harabaze Index)指标和响应时间分析聚类结果。结果表明:在单独聚类、KPCA聚类、改进PCA聚类、改进KPCA聚类4种处理方式中,改进KPCA-k-means++算法在不同处理方式和不同样本数的对比下,CH指标均为最高,与未改进时相比平均高出33%。在响应时间方面,改进KPCA-k-means++算法与同样改进PCA-k-means++算法在不同聚类数和样本数的对比下响应时间均较短。改进KPCA-k-means++算法能够保证对于茶树的基因序列的聚类准确率和聚类速度,表现出极好的聚类稳定性。 展开更多
关键词 核主成分分析 累计方差贡献率 K均值算法 基因
下载PDF
谱聚类和Apriori算法在建筑坍塌事故致因组合分析中的应用 被引量:1
19
作者 李珏 蒋敏 《安全与环境学报》 CAS CSCD 北大核心 2024年第2期617-625,共9页
建筑坍塌事故是人员伤亡和经济损失较大的事故类型之一。为探究建筑坍塌事故不同致因之间的关联和相互依存关系,首先,选取国内2015—2020年231份建筑坍塌事故报告作为研究对象,借助R语言平台进行文本挖掘,得到43个致因。其次,运用Pytho... 建筑坍塌事故是人员伤亡和经济损失较大的事故类型之一。为探究建筑坍塌事故不同致因之间的关联和相互依存关系,首先,选取国内2015—2020年231份建筑坍塌事故报告作为研究对象,借助R语言平台进行文本挖掘,得到43个致因。其次,运用Python进行谱聚类,根据致因之间的关联强度对其进行聚类。最后,利用关联规则挖掘Apriori算法确定建筑坍塌事故致因之间的关键关联组合。结果表明,43个事故致因可分为5类,在每一个簇类中确定了最关键的致因组合,并提出了针对性的预防措施,为坍塌事故的预防和控制提供一种新的思路。 展开更多
关键词 安全社会工程 建筑施工 坍塌事故 文本挖掘 APRIORI算法
下载PDF
局部线性下的函数型主成分聚类算法 被引量:1
20
作者 陈海龙 胡晓雪 《统计与决策》 CSSCI 北大核心 2024年第5期39-44,共6页
函数型聚类分析在统计学领域被广泛关注,其分析过程通常在降维目标实现后进行。为了有效解决函数型主成分聚类问题,文章结合局部线性嵌入算法(Locally Linear Embedding,LLE)在非线性空间下的适用性,提出了一种局部线性下的函数型主成... 函数型聚类分析在统计学领域被广泛关注,其分析过程通常在降维目标实现后进行。为了有效解决函数型主成分聚类问题,文章结合局部线性嵌入算法(Locally Linear Embedding,LLE)在非线性空间下的适用性,提出了一种局部线性下的函数型主成分分析模型(LLE Function Principle Component Analysis,LFPCA)。首先,采用函数型主成分分析法作为降维目标方法,改进了FPCA的算法模型,通过将LLE算法的权重系数矩阵与函数型主成分定义相结合,构建出一个适用于非线性空间下的聚类算法;其次,在求解算法的过程中定义了函数型主成分得分,并结合EM算法构建出GMM模型来近似函数型算法的概率密度函数,使模型更高效且适用性更强;最后,通过随机模拟实验及应用分析验证了LFPCA算法模型在真实数据集上具有良好的聚类效能。 展开更多
关键词 函数型主成分 局部线性嵌入算法 EM算法 GMM模型
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部