期刊文献+
共找到10,630篇文章
< 1 2 250 >
每页显示 20 50 100
基于SSA-Kmeans聚类算法的青菜杂质图像分割
1
作者 刘可心 赵爽 苗玉彬 《中国农机化学报》 北大核心 2024年第2期151-156,共6页
为解决青菜包装生产线在加工过程中的杂质在线检测问题,提出一种基于SSA-Kmeans的青菜杂质图像分割算法。首先利用直方图均衡化进行彩色图像增强以降低光照影响;其次基于麻雀搜索算法对初始聚类中心寻优,根据得到的最佳聚类中心,选取包... 为解决青菜包装生产线在加工过程中的杂质在线检测问题,提出一种基于SSA-Kmeans的青菜杂质图像分割算法。首先利用直方图均衡化进行彩色图像增强以降低光照影响;其次基于麻雀搜索算法对初始聚类中心寻优,根据得到的最佳聚类中心,选取包含颜色信息的ab二维数据进行Kmeans聚类;然后对聚类后的图像二值化处理并用形态学滤波方法校正,最终完成图像分割。利用该算法对落叶、枯叶和黄叶等杂质进行图像分割试验,杂质平均匹配率为93.22%,平均误分率为0.70%,平均准确率为92.52%。与FCM算法、Kmeans算法、PSO-Kmeans算法的对比试验表明:本文算法分割精度更优,对不同杂质的分割均表现出良好的鲁棒性,为实现青菜杂质在线检测提供一种新方法支撑,对提高青菜机械化生产水平具有一定的实用价值。 展开更多
关键词 青菜生产 杂质检测 kmeans 麻雀搜索算法
下载PDF
一种新的基于信息熵和PSO-Kmeans聚类算法的典型工艺路线发现与重用体系
2
作者 李春磊 常智勇 李亮 《西北工业大学学报》 EI CAS CSCD 北大核心 2023年第1期198-208,共11页
制造企业在经营和发展过程中会积累大量的制造实例,对这些实例资源进行合理地挖掘和重用,是提高制造效率和支持创新的最有效途径之一。为了科学确定重用对象和提高重用灵活性,提出了一种基于信息熵和PSO-Kmeans聚类算法的典型工艺路线... 制造企业在经营和发展过程中会积累大量的制造实例,对这些实例资源进行合理地挖掘和重用,是提高制造效率和支持创新的最有效途径之一。为了科学确定重用对象和提高重用灵活性,提出了一种基于信息熵和PSO-Kmeans聚类算法的典型工艺路线发现与重用体系。在该体系下,提出了一种基于多级最长公共子序列信息熵的机加工艺路线相似度度量方法。在此基础上,提出了一种基于谱聚类思想和PSO-Kmeans聚类算法的典型工艺路线发现方法,并分析讨论了2种基于典型工艺路线的机加工艺重用途径。通过3个验证实例,说明所提出的体系可以更好地支持制造实例重用。 展开更多
关键词 制造实例重用 典型工艺路线 相似性度量 信息熵 PSO-kmeans聚类算法
下载PDF
重心随机漂移KMeans聚类算法的设计 被引量:2
3
作者 尹晓丽 《长春大学学报》 2017年第8期35-38,共4页
利用KMeans聚类算法进行聚类过程中,有可能会产生孤立聚点,这种情况一旦发生,会严重影响算法的聚类效果。为避免产生孤立聚点,本文改进了KMeans聚类算法,设计了一类重心随机漂移(Center Random Drift,简称CRD)KMeans聚类算法。该算法会... 利用KMeans聚类算法进行聚类过程中,有可能会产生孤立聚点,这种情况一旦发生,会严重影响算法的聚类效果。为避免产生孤立聚点,本文改进了KMeans聚类算法,设计了一类重心随机漂移(Center Random Drift,简称CRD)KMeans聚类算法。该算法会首先判断生成的聚点是否是孤立聚点,利用CRD算法对孤立聚点进行替换,从而有效避免了孤立聚点的产生。通过在Matlab环境下进行图像聚类对比实验发现,针对色彩丰富的图片,新算法和传统KMeans算法性能没有明显差异,而针对图片色彩比较单一的图片,传统的KMeans聚类算法聚类效果不佳,新算法依然可以有效聚类。 展开更多
关键词 kmeans 机器学习 CRD kmeans MATLAB
下载PDF
基于Hadoop的多核果蝇-Kmeans聚类算法 被引量:1
4
作者 李小川 刘媛华 《软件导刊》 2018年第4期51-53,57,共4页
针对Kmeans算法对海量数据聚类效率过低的不足,基于Hadoop的分布式架构思想,提出一种多核果蝇-Kmeans聚类算法(MKFOA-Kmeans)。以每次迭代后果蝇位置为聚类中心进行一次Kmeans聚类算法,综合了果蝇优化算法强全局搜索能力以及Kmeans算法... 针对Kmeans算法对海量数据聚类效率过低的不足,基于Hadoop的分布式架构思想,提出一种多核果蝇-Kmeans聚类算法(MKFOA-Kmeans)。以每次迭代后果蝇位置为聚类中心进行一次Kmeans聚类算法,综合了果蝇优化算法强全局搜索能力以及Kmeans算法强局部搜索能力的优点。MapReduce框架简化了算法执行过程,避免了由于存储空间不足而造成的算法失效。在由普通硬件搭建的Hadoop平台下进行仿真实验,表明MKFOA-Kmeans算法对大数据的聚类准确率高,并且随着数据量的增加,聚类效率优势也愈加明显。 展开更多
关键词 大型数据 HADOOP 果蝇算法 多核 kmeans算法
下载PDF
基于反向K近邻和密度峰值初始化的加权Kmeans聚类入侵检测算法 被引量:2
5
作者 张喜梅 解滨 +1 位作者 徐童童 张春昊 《南京理工大学学报》 CAS CSCD 北大核心 2023年第1期56-65,共10页
传统Kmeans聚类算法的性能易受初始类簇中心随机性和类簇中心计算的迭代过程中边缘点和离群点反复计入的影响,为了避免这些影响,该文提出一种基于反向K近邻和密度峰值初始化的加权Kmeans聚类算法。通过样本的近邻信息计算每个样本的反向... 传统Kmeans聚类算法的性能易受初始类簇中心随机性和类簇中心计算的迭代过程中边缘点和离群点反复计入的影响,为了避免这些影响,该文提出一种基于反向K近邻和密度峰值初始化的加权Kmeans聚类算法。通过样本的近邻信息计算每个样本的反向K近邻,针对不同规模、不同密度分布数据集,可以自适应地搜索密度峰值点作为初始类簇中心;自适应设定相对簇半径,并通过样本加权进行类簇中心迭代,在不同数据分布下可以有效降低边缘点和离群点对聚类结果的影响。试验结果证明,该算法在聚类性能提升的同时迭代次数大幅降低,随着入侵行为类型和数据规模的增加,该文聚类算法仍体现出较好的性能,且在发现未知攻击类型上效果显著。 展开更多
关键词 kmeans 入侵检测 密度峰值 样本加权 反向K近邻
下载PDF
跳跃跟踪SSA交叉迭代AP聚类算法
6
作者 黄鹤 李文龙 +3 位作者 杨澜 王会峰 高涛 陈婷 《电子学报》 EI CAS CSCD 北大核心 2024年第3期977-990,共14页
针对传统近邻传播聚类算法以数据点对之间的相似度作为输入度量,由于需要预设偏向参数p和阻尼系数λ,算法精度无法精确控制的问题,提出了一种跳跃跟踪麻雀搜索算法优化的交叉迭代近邻传播聚类方法.首先,针对麻雀搜索算法中发现者和加入... 针对传统近邻传播聚类算法以数据点对之间的相似度作为输入度量,由于需要预设偏向参数p和阻尼系数λ,算法精度无法精确控制的问题,提出了一种跳跃跟踪麻雀搜索算法优化的交叉迭代近邻传播聚类方法.首先,针对麻雀搜索算法中发现者和加入者位置更新不足的问题,设计了一种跳跃跟踪优化策略,通过考虑偏好阻尼因子的跳跃策略设计大步长更新发现者,增加麻雀搜索算法的全局勘探能力和寻优速度,加入者设计动态小步长跟踪领头雀更新位置,同时,利用自适应种群划分机制更新发现者和加入者的比重,增加算法的后期局部开发能力和寻优速度;其次,设计基于扰动因子的Tent映射,在此基础上增加3个参数,使映射分布范围增大,并避免了陷入小周期点和不稳周期点;最后,引入轮廓系数作为评价函数,跳跃跟踪麻雀搜索算法自动寻找较优的p和λ,代替手动输入参数,并融合基于扰动因子的Tent映射优化近邻传播算法,交叉迭代确定最优簇数.使用多种算法聚类University of California Irvine数据集的10种公共数据集,仿真结果表明,本文提出的聚类算法与经典近邻传播算法、基于差分改进的仿射传播聚类算法、基于麻雀搜索算法优化的近邻传播聚类算法和进化近邻传播算法相比具有更优的搜索效率以及聚类精度.对国家信息数据进行了聚类分析,提出的方法更加准确有效合理,具有较好的应用价值. 展开更多
关键词 近邻传播 改进Tent映射 改进麻雀搜索算法 轮廓系数 数据集
下载PDF
基于机器学习的茶树DNA聚类算法
7
作者 杨小平 倪萍 +4 位作者 诸葛天秋 罗跃新 郭春雨 庞月兰 吴雨婷 《广西大学学报(自然科学版)》 CAS 北大核心 2024年第2期386-399,共14页
为了研究茶树基因序列的聚类问题,设计一种基于累计方差贡献率进行改进的核主成分分析(KPCA)与k均值(k-means)++聚类算法相结合的降维聚类算法(KPCA-k-means++)。将基因库数据集筛选分组后,利用k-mers算法提取基因数据的数据特征,根据... 为了研究茶树基因序列的聚类问题,设计一种基于累计方差贡献率进行改进的核主成分分析(KPCA)与k均值(k-means)++聚类算法相结合的降维聚类算法(KPCA-k-means++)。将基因库数据集筛选分组后,利用k-mers算法提取基因数据的数据特征,根据累计方差贡献率的占比大于85%的标准确定降维主元个数对KPCA进行降维改进并采用k-means++算法对降维后数据聚类,通过CH(Calinski-Harabaze Index)指标和响应时间分析聚类结果。结果表明:在单独聚类、KPCA聚类、改进PCA聚类、改进KPCA聚类4种处理方式中,改进KPCA-k-means++算法在不同处理方式和不同样本数的对比下,CH指标均为最高,与未改进时相比平均高出33%。在响应时间方面,改进KPCA-k-means++算法与同样改进PCA-k-means++算法在不同聚类数和样本数的对比下响应时间均较短。改进KPCA-k-means++算法能够保证对于茶树的基因序列的聚类准确率和聚类速度,表现出极好的聚类稳定性。 展开更多
关键词 核主成分分析 累计方差贡献率 K均值算法 基因
下载PDF
基于K-means聚类和特征空间增强的噪声标签深度学习算法 被引量:1
8
作者 吕佳 邱小龙 《智能系统学报》 CSCD 北大核心 2024年第2期267-277,共11页
深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样... 深度学习中神经网络的性能依赖于高质量的样本,然而噪声标签会降低网络的分类准确率。为降低噪声标签对网络性能的影响,噪声标签学习算法被提出。该算法首先将训练样本集划分成干净样本集和噪声样本集,然后使用半监督学习算法对噪声样本集赋予伪标签。然而,错误的伪标签以及训练样本数量不足的问题仍然限制着噪声标签学习算法性能的提升。为解决上述问题,提出基于K-means聚类和特征空间增强的噪声标签深度学习算法。首先,该算法利用K-means聚类算法对干净样本集进行标签聚类,并根据噪声样本集与聚类中心的距离大小筛选出难以分类的噪声样本,以提高训练样本的质量;其次,使用mixup算法扩充干净样本集和噪声样本集,以增加训练样本的数量;最后,采用特征空间增强算法抑制mixup算法新生成的噪声样本,从而提高网络的分类准确率。并在CIFAR10、CIFAR100、MNIST和ANIMAL-10共4个数据集上试验验证了该算法的有效性。 展开更多
关键词 噪声标签学习 深度学习 半监督学习 机器学习 神经网络 K-MEANS 特征空间增强 mixup算法
下载PDF
采用混合策略联合优化的模糊C-均值聚类信息熵点云简化算法
9
作者 黄鹤 黄佳慧 +2 位作者 刘国权 王会峰 高涛 《西安交通大学学报》 EI CAS CSCD 北大核心 2024年第7期214-226,共13页
针对传统聚类算法处理点云简化问题时精度低、耗时长且易丢失特征信息等问题,提出了一种基于动态精英自适应混合策略的鹈鹕算法(DEAMPOA)与加权熵法联合优化的模糊C-均值聚类(FCM)信息熵点云简化算法。采用动态自适应种群混合策略,同时... 针对传统聚类算法处理点云简化问题时精度低、耗时长且易丢失特征信息等问题,提出了一种基于动态精英自适应混合策略的鹈鹕算法(DEAMPOA)与加权熵法联合优化的模糊C-均值聚类(FCM)信息熵点云简化算法。采用动态自适应种群混合策略,同时融合了精英反向化思路,显著提升了鹈鹕优化算法(POA)的收敛趋势和全局寻优能力,提高了寻找FCM最优聚类中心的成功率;利用DEAMPOA结合加权熵法对FCM进行优化,提高鲁棒性的同时增强了搜索精度,得到较好的聚类结果;在8种UCI标准数据集上与4种算法对比进行聚类性能评估实验,验证了所提方法综合性能优越;将所提方法与信息熵融合,并应用在三维点云KITTI数据集简化中。实验结果表明:与包围框简化法、随机采样简化法和特征选择简化法对比,所提方法全局误差简化前后点集之间平均欧式距离(MED)指标分别降低了2.25%、6.93%、5.74%,点云简化效果最优且运行速度满足要求。 展开更多
关键词 C-均值 鹈鹕优化算法 点云简化 信息熵
下载PDF
基于核KMeans和SOM神经网络算法的海况聚类分析 被引量:2
10
作者 陈晓曼 苏欢 《陕西科技大学学报》 北大核心 2023年第3期208-214,共7页
为了更加高质量地利用海况数据,避免由复杂因素导致的对海况误判问题,基于KMeans、核技巧、自组织映射(Self-organizing Mapping, SOM)神经网络构建了自组织映射混合核KMeans(SOM-Gaussian and Polynomial Kernel-KMeans, SGPK-KMeans)... 为了更加高质量地利用海况数据,避免由复杂因素导致的对海况误判问题,基于KMeans、核技巧、自组织映射(Self-organizing Mapping, SOM)神经网络构建了自组织映射混合核KMeans(SOM-Gaussian and Polynomial Kernel-KMeans, SGPK-KMeans)算法.克服了KMeans对复杂数据聚类效果不佳、核KMeans需要指定聚类数目和对初始聚类中心敏感的问题.通过海况数据聚类实验,将SGPK-KMeans算法的聚类效果与经典KMeans、单核KMeans和SOM神经网络算法进行对比分析.结果表明SGPK-KMeans对于海况数据聚类具有更加稳定的效果且能更加准确的识别出数据中的异常值. 展开更多
关键词 海况 kmeans SOM神经网络
下载PDF
用聚类与插值改进深度学习算法实现变工况轴承故障诊断
11
作者 李俊卿 耿继亚 +2 位作者 胡晓东 张承志 何玉灵 《电力科学与工程》 2024年第6期60-68,共9页
针对基于深度学习轴承故障诊断模型由于工况因素导致诊断效果不佳的问题,提出了一种用聚类与插值(Clustering and interpolation,CAI)改进深度学习算法实现变工况轴承故障诊断的方法。首先,采用有限元法仿真多工况、多故障类型的轴承振... 针对基于深度学习轴承故障诊断模型由于工况因素导致诊断效果不佳的问题,提出了一种用聚类与插值(Clustering and interpolation,CAI)改进深度学习算法实现变工况轴承故障诊断的方法。首先,采用有限元法仿真多工况、多故障类型的轴承振动信号数据,获取足够样本;然后,完成宽卷积核深度卷积神经网络(Deepconvolutionalneuralnetworks with widekernel,WDCNN)模型构建,并利用任一工况下的数据完成模型训练;最后,利用CAI算法统一其余工况数据的转速信息,调用WDCNN模型完成对其余工况样本的故障诊断。结果显示,WDCNN模型对训练数据所属工况故障诊断准确率达99.9%,对经过CAI算法处理其他工况数据故障诊断识别率分别为98.7%、99.2%,是一种简单、准确有效、泛化能力强的故障诊断方法。 展开更多
关键词 深度学习 与插值算法 故障诊断 轴承 有限元分析
下载PDF
基于航迹数据的改进DBSCAN聚类算法研究
12
作者 申正义 李平 +2 位作者 王洪林 赵迪 郭文琪 《空天预警研究学报》 CSCD 2024年第2期128-131,共4页
为研究模拟训练航迹数据聚类,针对基于密度的噪声应用空间聚类(DBSCAN)算法参数选取不精准、聚类准确度不高的问题,提出一种改进的DBSCAN聚类算法.首先,通过KNN算法计算邻域半径并得到用于DBSCAN聚类的初始化核心数据对象,实现粗聚类;其... 为研究模拟训练航迹数据聚类,针对基于密度的噪声应用空间聚类(DBSCAN)算法参数选取不精准、聚类准确度不高的问题,提出一种改进的DBSCAN聚类算法.首先,通过KNN算法计算邻域半径并得到用于DBSCAN聚类的初始化核心数据对象,实现粗聚类;其次,根据数据对象的特点,加入航向特征进行二次聚类,既解决了DBSCAN算法随机初始化核心点和参数选取难的问题,又加入能够反映数据方向的特征;最后,进行了仿真实验.实验结果表明,改进DBSCAN算法比传统DBSCAN算法具有更好的聚类效果. 展开更多
关键词 模拟训练 DBSCAN算法 二次 自适应参数选取 航迹数据
下载PDF
一种基于粗糙熵的改进K-modes聚类算法
13
作者 刘财辉 曾雄 谢德华 《南京理工大学学报》 CAS CSCD 北大核心 2024年第3期335-341,共7页
K-modes聚类算法被广泛应用于人工智能、数据挖掘等领域。传统的K-modes聚类算法有不错的聚类效果,但是存在迭代次数多、计算量大、容易受到冗余属性的干扰等问题,且仅采用简单的0-1匹配的方法来定义2个样本属性值之间的距离,没有充分... K-modes聚类算法被广泛应用于人工智能、数据挖掘等领域。传统的K-modes聚类算法有不错的聚类效果,但是存在迭代次数多、计算量大、容易受到冗余属性的干扰等问题,且仅采用简单的0-1匹配的方法来定义2个样本属性值之间的距离,没有充分考虑每个属性对聚类结果的影响。针对上述问题,该文将粗糙熵引入K-modes算法。首先利用粗糙集属性约简算法消除冗余属性,确定各属性的重要程度;然后利用粗糙熵确定每个属性的权重,从而定义新的类内距离。将该文所提算法与传统的K-modes聚类算法分别在4组公开数据集上进行对比试验。试验结果表明,该文所提算法聚类准确率比传统的K-modes聚类算法更高。 展开更多
关键词 K-modes算法 粗糙集 粗糙熵 属性约简 权重
下载PDF
基于空间插值的不规则海洋地质样品测试分析数据聚类算法研究
14
作者 邵长高 严镔 陈秋 《热带海洋学报》 CAS CSCD 北大核心 2024年第2期166-172,共7页
海洋地质调查中获取大量海洋沉积物柱状样样品测试分析数据,样品测试分析目的不同导致柱状样数据采样深度不同,由此造成地质取样数据在三维空间上呈现不规则散点状分布。传统聚类算法无法在三维空间上对此类不规则散点数据进行聚类分析... 海洋地质调查中获取大量海洋沉积物柱状样样品测试分析数据,样品测试分析目的不同导致柱状样数据采样深度不同,由此造成地质取样数据在三维空间上呈现不规则散点状分布。传统聚类算法无法在三维空间上对此类不规则散点数据进行聚类分析。对此,文章设计了一种基于空间插值的不规则地质样品测试分析数据聚类算法,有效地将三维样品测试分析散点数据降为二维数据后进行聚类分析,本算法较好地解决了地质体中试验测试数据的不均衡性问题,为海洋地质大数据分析提供了基础技术方法。 展开更多
关键词 地质取样 实验测试 算法 空间插值 三维
下载PDF
基于蚁群算法的三支k-means聚类算法
15
作者 朱金 徐天杰 王平心 《江苏科技大学学报(自然科学版)》 CAS 2024年第3期63-69,共7页
在聚类分析中,三支k-means聚类算法较具有较强的处理边界不确定数据的能力,但仍然存在对初始聚类中心敏感的问题.通过将蚁群算法和三支k-means聚类算法相结合,给出了一种基于蚁群算法的三支k-means聚类算法来解决这一问题.利用蚁群算法... 在聚类分析中,三支k-means聚类算法较具有较强的处理边界不确定数据的能力,但仍然存在对初始聚类中心敏感的问题.通过将蚁群算法和三支k-means聚类算法相结合,给出了一种基于蚁群算法的三支k-means聚类算法来解决这一问题.利用蚁群算法中随机概率选择策略和信息素的正负反馈机制,动态调整权重的方法,对三支k-means聚类算法进行优化.在UCI数据集上实验证明,该方法对聚类结果的性能指标有所提高. 展开更多
关键词 三支k-means K-MEANS算法 中心 蚁群算法
下载PDF
基于聚类-Floyd-遗传算法的“车辆+无人机”城市物流配送路径优化
16
作者 李楠 辛春阳 《科学技术与工程》 北大核心 2024年第21期9186-9193,共8页
为了提高城市环境下物流配送效率,以配送时间和配送成本为优化目标,建立“车辆+无人机”路径优化数学模型,提出一种基于聚类-Floyd-遗传算法的三阶算法。实验结果表明,该算法通过多阶数据处理,可有效降低运算量,克服了遗传算法收敛速度... 为了提高城市环境下物流配送效率,以配送时间和配送成本为优化目标,建立“车辆+无人机”路径优化数学模型,提出一种基于聚类-Floyd-遗传算法的三阶算法。实验结果表明,该算法通过多阶数据处理,可有效降低运算量,克服了遗传算法收敛速度慢、易陷入局部最优的问题。对无人机容量进行灵敏度分析表明,无人机的配送能力随载重量增大而显著提升,载重量和最大航程同步提升能更好地发挥无人机的配送能力。和单纯车辆配送的方式相比,“车辆+无人机”配送模式总配送成本降低36.1%,总配送时间减少34.5%。证明了该算法在城市物流配送方面具有一定实用价值。 展开更多
关键词 车辆+无人机 算法 FLOYD算法 遗传算法 路径优化
下载PDF
融合密度和划分的文本聚类算法
17
作者 刘龙 刘新 +1 位作者 蔡林杰 唐朝 《计算机与数字工程》 2024年第1期178-183,共6页
文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中... 文档聚类是聚类的经典应用,它是将相似的文档归为同一类,可以有效地组织、摘要和导航文本信息,也可以用来提高分类效果。论文使用BERT模型处理文档向量化,将文档表示为高维向量。传统的密度聚类算法不适用于高维数据集,划分聚类算法中的K-均值算法可以有效地聚类文档,但是算法的性能非常依赖于初始中心点的选择。论文提出了一种新的融合密度和划分的文本聚类算法。首先,通过密度选择适当的聚类中心点集合,然后使用最远距离的想法逐渐选择初始类中心点,最后使用划分方法对数据集进行聚类。实验表明,该算法的聚类效果稳定,聚类效果良好。 展开更多
关键词 文档 BERT K-均值算法 密度 最远距离
下载PDF
局部线性下的函数型主成分聚类算法
18
作者 陈海龙 胡晓雪 《统计与决策》 北大核心 2024年第5期39-44,共6页
函数型聚类分析在统计学领域被广泛关注,其分析过程通常在降维目标实现后进行。为了有效解决函数型主成分聚类问题,文章结合局部线性嵌入算法(Locally Linear Embedding,LLE)在非线性空间下的适用性,提出了一种局部线性下的函数型主成... 函数型聚类分析在统计学领域被广泛关注,其分析过程通常在降维目标实现后进行。为了有效解决函数型主成分聚类问题,文章结合局部线性嵌入算法(Locally Linear Embedding,LLE)在非线性空间下的适用性,提出了一种局部线性下的函数型主成分分析模型(LLE Function Principle Component Analysis,LFPCA)。首先,采用函数型主成分分析法作为降维目标方法,改进了FPCA的算法模型,通过将LLE算法的权重系数矩阵与函数型主成分定义相结合,构建出一个适用于非线性空间下的聚类算法;其次,在求解算法的过程中定义了函数型主成分得分,并结合EM算法构建出GMM模型来近似函数型算法的概率密度函数,使模型更高效且适用性更强;最后,通过随机模拟实验及应用分析验证了LFPCA算法模型在真实数据集上具有良好的聚类效能。 展开更多
关键词 函数型主成分 局部线性嵌入算法 EM算法 GMM模型
下载PDF
谱聚类和Apriori算法在建筑坍塌事故致因组合分析中的应用
19
作者 李珏 蒋敏 《安全与环境学报》 CAS CSCD 北大核心 2024年第2期617-625,共9页
建筑坍塌事故是人员伤亡和经济损失较大的事故类型之一。为探究建筑坍塌事故不同致因之间的关联和相互依存关系,首先,选取国内2015—2020年231份建筑坍塌事故报告作为研究对象,借助R语言平台进行文本挖掘,得到43个致因。其次,运用Pytho... 建筑坍塌事故是人员伤亡和经济损失较大的事故类型之一。为探究建筑坍塌事故不同致因之间的关联和相互依存关系,首先,选取国内2015—2020年231份建筑坍塌事故报告作为研究对象,借助R语言平台进行文本挖掘,得到43个致因。其次,运用Python进行谱聚类,根据致因之间的关联强度对其进行聚类。最后,利用关联规则挖掘Apriori算法确定建筑坍塌事故致因之间的关键关联组合。结果表明,43个事故致因可分为5类,在每一个簇类中确定了最关键的致因组合,并提出了针对性的预防措施,为坍塌事故的预防和控制提供一种新的思路。 展开更多
关键词 安全社会工程 建筑施工 坍塌事故 文本挖掘 APRIORI算法
下载PDF
启发式k-means聚类算法的改进研究
20
作者 殷丽凤 栗庆杰 《大连交通大学学报》 CAS 2024年第2期115-119,共5页
启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结... 启发式k-means聚类算法通过在k-means第一次迭代后查看附近的集群来预测每个数据点可能会被划分到的集群子集,有效地加快了算法的运行速度。但由于启发式算法存在随机选择初始聚类中心以及无法有效识别数据集中离群点的缺陷,导致聚类结果的误差平方和较大并且轮廓系数偏小。针对这一问题,提出了CHk-means算法,该算法引入仔细播种方法,克服了启发式k-means算法随机选择初始聚类中心带来的局部最优解问题;该算法引入局部异常因子LOF算法对离群点进行检测,降低了离群点数据对聚类结果的影响。在多个数据集上对3种算法进行对比试验,结果表明CHk-means算法可有效降低聚类结果的误差平方和,增强聚类的轮廓系数,使聚类质量得到明显改善。 展开更多
关键词 算法 K-MEANS 启发式算法 仔细播种 局部异常因子 离群点
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部