期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
基于初始偏向度的AP算法聚类性能优化研究 被引量:2
1
作者 赵延龙 滑楠 《计算机应用研究》 CSCD 北大核心 2018年第2期372-374,399,共4页
在对AP算法仿真研究过程中发现,样本数据点作为类代表点的初始偏向度取值,与算法最终聚类性能有着密切的联系。针对两者之间的数量关系展开深入研究,通过建立初始偏向度多重单目标优化模型,限定算法花费时长在可设定的范围内,确定初始... 在对AP算法仿真研究过程中发现,样本数据点作为类代表点的初始偏向度取值,与算法最终聚类性能有着密切的联系。针对两者之间的数量关系展开深入研究,通过建立初始偏向度多重单目标优化模型,限定算法花费时长在可设定的范围内,确定初始偏向度最优取值,使得算法聚类准确率取得最优,同时花费时长相对较小。实验结果表明,对于三种经典的标准数据集4k2-far、wine和iris,优化后的AP算法与优化前相比,在降低花费时长的同时提高了聚类准确率,从而有效提高算法的聚类性能。 展开更多
关键词 AP算法 初始偏向度 多重单目标优化 聚类性能
下载PDF
基于聚类LDA方法的Web服务发现聚类性能分析 被引量:1
2
作者 郑浩泉 张琦 《自动化技术与应用》 2020年第10期27-30,共4页
为了提高Web服务的资源利用率,本文构建得到了一种Web服务多功能聚类方法,并综合运用模糊C均值算与LDA模型来划分Web服务的不同功能。在相同主题下时,聚类LDA方法具有比LDA方法更高的召回率和准确率,由此表明采用聚类LDA方法可以比LDA... 为了提高Web服务的资源利用率,本文构建得到了一种Web服务多功能聚类方法,并综合运用模糊C均值算与LDA模型来划分Web服务的不同功能。在相同主题下时,聚类LDA方法具有比LDA方法更高的召回率和准确率,由此表明采用聚类LDA方法可以比LDA方法更加高效地发现有用的Web服务标签,同时实现更精准聚类结果。 展开更多
关键词 WEB服务 模糊C均值 LDA 聚类性能
下载PDF
基于类簇合并的无参数密度峰值聚类算法
3
作者 刘天娇 王胜景 袁永生 《现代电子技术》 北大核心 2024年第8期1-8,共8页
密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚... 密度峰值聚类算法(DPC)通过决策图直观地找到类簇中心进而完成聚类,是一种简单高效的聚类算法。然而,DPC算法的截断距离和类簇中心都是人为确定的,受主观影响较大,具有不确定性。针对上述问题,提出一种基于类簇合并的无参数密度峰值聚类算法(NDPCCM)。首先根据样本点两两之间的相似度的分布特征将其分为类内相似度和类间相似度两种类型,并利用类内相似度自动确定截断相似度,避免了人为设置参数;接着根据簇中心权值的下降趋势自动选择初始类簇中心,得到初始类簇;最后通过合并初始类簇对初步聚类结果进行优化,提高了聚类的准确性。在人工数据集和UCI真实数据集上,将所提算法与DPC、DBSCAN、K-means算法进行对比实验。结果表明所提算法无需输入参数就能够自动得到类簇,且聚类性能优于其他算法。 展开更多
关键词 分析 密度峰值算法 初始 簇合并 相似度 聚类性能
下载PDF
基于数据集压缩的聚类算法性能优化研究 被引量:6
4
作者 赵延龙 滑楠 《计算机应用研究》 CSCD 北大核心 2018年第5期1450-1453,共4页
针对目前聚类算法对大数据集的聚类分析中存在时间花费过大的问题,提出了一种基于最近邻相似性的数据集压缩算法。通过将若干个相似性最近邻的数据点划分成一个数据簇并随机选择簇头构成新的数据集,大大缩减了数据的规模。然后分别采用K... 针对目前聚类算法对大数据集的聚类分析中存在时间花费过大的问题,提出了一种基于最近邻相似性的数据集压缩算法。通过将若干个相似性最近邻的数据点划分成一个数据簇并随机选择簇头构成新的数据集,大大缩减了数据的规模。然后分别采用K-means算法和AP算法对压缩后的数据集进行聚类分析。实验结果表明,压缩后的数据集与原始数据集的聚类分析相比,在保证聚类准确率基本一致的前提下,有效降低了聚类的花费时长,提高了算法的聚类性能,证明了该数据集压缩算法在聚类分析中的有效性和可靠性。 展开更多
关键词 数据压缩 聚类性能
下载PDF
集成多策略改进FCM算法的旋转机械故障数据聚类分析研究 被引量:5
5
作者 邓林峰 张爱华 赵荣珍 《振动工程学报》 EI CSCD 北大核心 2019年第5期918-926,共9页
针对旋转机械故障数据聚类分析中的初始聚类中心不确定和孤立点敏感问题,提出了一种集成多策略改进的模糊C均值(FCM)聚类方法。首先以故障数据集的决策属性为等价关系对数据集进行划分,得到若干个由等价关系导出的等价类;然后以每个等... 针对旋转机械故障数据聚类分析中的初始聚类中心不确定和孤立点敏感问题,提出了一种集成多策略改进的模糊C均值(FCM)聚类方法。首先以故障数据集的决策属性为等价关系对数据集进行划分,得到若干个由等价关系导出的等价类;然后以每个等价类为可行域,采用均值漂移方法搜索故障数据类中心;最后以搜索到的类中心为FCM算法的初始聚类中心,通过核技术计算故障数据样本与相应类中心在高维特征空间中的欧氏距离,从而实现数据样本相似性的有效度量,并完成故障数据的模糊聚类。通过标准数据集和旋转机械故障数据集对方法的性能进行了验证及比较分析。结果显示,改进FCM算法的聚类性能相比传统FCM算法的聚类性能得到了明显提升,在收敛速度和聚类准确性两个性能指标上,改进的FCM算法比FCM算法具有显著优势。 展开更多
关键词 故障诊断 旋转机械 分析 模糊C均值 聚类性能
下载PDF
鲁棒的交叉熵模糊聚类算法 被引量:4
6
作者 姚兰 严寒冰 蔚泽峰 《计算机应用研究》 CSCD 北大核心 2019年第10期2948-2951,共4页
针对模糊C-均值聚类(FCM)算法对噪声敏感、容易收敛到局部极小值的问题,提出一种基于交叉熵的模糊聚类算法。通过引入交叉熵重新定义了传统FCM算法的目标函数,利用交叉熵度量样本隶属度之间的差异性,并采用拉格朗日求解方法和朗伯W函数... 针对模糊C-均值聚类(FCM)算法对噪声敏感、容易收敛到局部极小值的问题,提出一种基于交叉熵的模糊聚类算法。通过引入交叉熵重新定义了传统FCM算法的目标函数,利用交叉熵度量样本隶属度之间的差异性,并采用拉格朗日求解方法和朗伯W函数解决了目标函数的优化问题,此外,分析了样本划分矩阵的分布情况,依据分布特性对噪声样本进行识别。人工数据集合和标准数据集加噪的实验结果表明,该算法提高了传统FCM算法的抗干扰能力,具有更强的鲁棒性,噪声样本识别的准确率较高。 展开更多
关键词 模糊 交叉熵 模糊C-均值 聚类性能
下载PDF
新型模糊半监督加权聚类算法中的权值v
7
作者 李龙龙 何东健 王美丽 《计算机工程与设计》 北大核心 2016年第7期1937-1941,共5页
为体现实际应用中不同特征对聚类性能的影响,提出一种模糊半监督加权聚类算法。采用聚类和特征加权同步进行的思想,将特征加权融合到聚类过程中,对不同约束条件下的权值对聚类准确率的影响进行分析,实时观测权值在聚类过程中的变化轨迹... 为体现实际应用中不同特征对聚类性能的影响,提出一种模糊半监督加权聚类算法。采用聚类和特征加权同步进行的思想,将特征加权融合到聚类过程中,对不同约束条件下的权值对聚类准确率的影响进行分析,实时观测权值在聚类过程中的变化轨迹的目标。在UCI和自测数据集上的相关实验结果表明,权值能够有效提高算法的性能。 展开更多
关键词 机器学习 半监督 特征加权 成对约束 聚类性能
下载PDF
基于mutual KNN和标准化的谱聚类算法 被引量:4
8
作者 谭马龙 文国秋 +2 位作者 童涛 吴林 杜婷婷 《计算机工程与设计》 北大核心 2019年第7期1878-1884,共7页
在谱聚类算法中,利用K近邻算法构建拉普拉斯矩阵时,会造成聚类的算法复杂度提高和聚类结果不佳的问题,为此提出一种基于mutual KNN和标准化矩阵的谱聚类算法,能有效提升聚类划分的执行效率和准确率。将提出算法与多组对比算法在多个数... 在谱聚类算法中,利用K近邻算法构建拉普拉斯矩阵时,会造成聚类的算法复杂度提高和聚类结果不佳的问题,为此提出一种基于mutual KNN和标准化矩阵的谱聚类算法,能有效提升聚类划分的执行效率和准确率。将提出算法与多组对比算法在多个数据集上进行实验比较,比较结果表明,多个评测指标(如聚类准确率、聚类的标准化互信息、方差等)全面验证了该算法能有效提高聚类性能和执行效率,适用于高维大数据的聚类分析。 展开更多
关键词 拉普拉斯矩阵 标准化 聚类性能 高维大数据
下载PDF
基于新径向基函数网络的变压器故障诊断法 被引量:11
9
作者 陈江波 文习山 +1 位作者 蓝磊 张博 《高电压技术》 EI CAS CSCD 北大核心 2007年第3期140-143,共4页
油中溶解气体分析(DGA)是判别变压器内部绝缘状况及发现内部潜伏性故障的重要手段,而多层前馈网络(MLFNN)是应用广泛的故障诊断模型。为此,提出了以DGA数据为特征参数的新型径向基函数神经网络(RBFNN)诊断变压器故障。在分析传统k-均值... 油中溶解气体分析(DGA)是判别变压器内部绝缘状况及发现内部潜伏性故障的重要手段,而多层前馈网络(MLFNN)是应用广泛的故障诊断模型。为此,提出了以DGA数据为特征参数的新型径向基函数神经网络(RBFNN)诊断变压器故障。在分析传统k-均值聚类算法RBFNN的缺点和最优聚类特性的基础上,介绍了RBFNN的新算法-自适应k-均值聚类算法,它既能避免传统k-均值聚类算法的局部收敛的缺点,又能动态调整学习率。最后,大量聚类实验结果显示自适应k-均值聚类算法在收敛速度和聚类性能上比传统k-均值聚类算法显著提高;故障诊断实验结果显示所提出的模型故障诊断准确度高于传统BPNN、RBFNN及IEC三比值法。 展开更多
关键词 K-均值算法 径向基函数神经网络 变压器 故障诊断 方法 收敛速度 聚类性能
下载PDF
基于改进蜻蜓优化多核模糊聚类算法的异常检测 被引量:8
10
作者 张颖 彭然 《数学的实践与认识》 2021年第19期208-219,共12页
对模糊C-均值聚类算法(FCM)改进及在异常检测中的应用进行研究,提出了一种基于改进蜻蜓优化多核模糊聚类算法的异常检测方案.针对FCM聚类个数事先确定,对噪声、不同形状聚类鲁棒性差以及初始聚类中心敏感的缺陷,设计最佳多核聚类策略,... 对模糊C-均值聚类算法(FCM)改进及在异常检测中的应用进行研究,提出了一种基于改进蜻蜓优化多核模糊聚类算法的异常检测方案.针对FCM聚类个数事先确定,对噪声、不同形状聚类鲁棒性差以及初始聚类中心敏感的缺陷,设计最佳多核聚类策略,通过采用加权多核度量和最佳聚类评价指标,在实现自适应数据聚类个数确定的同时,证明对不同聚类问题具有更好的鲁棒性;提出密度峰值聚类中心初始化机制,通过迭代计算密度峰值函数,对聚类中心进行初始化;引入蜻蜓算法(DA),对DA迭代进化机制进行改进,并将聚类中心等效为蜻蜓个体编码,充分利用DA全局寻优优势,以改善FCM聚类性能;搭建MPI并行运算架构,将最佳多核聚类策略和蜻蜓算法局部搜索更新进行分布式计算处理,以提高数据聚类的运行效率.最后,将改进蜻蜓优化多核模糊聚类算法(IDM-FCM)应用于异常检测.仿真结果表明,对于不同形状以及孤点聚类问题,IDM-FCM具有更好的聚类效果,聚类正确率提高了约19.1%,而且,基于IDM-FCM的异常检测算法具备更高的检测能力,检测成功率提高了约5.2-39.2%,误报率降低了了约70.2-92.3%. 展开更多
关键词 异常检测 分析 模糊C-均值 蜻蜓算法 聚类性能 检测能力
原文传递
核空间广义均衡模糊C-均值聚类算法 被引量:1
11
作者 杜朵朵 吴成茂 《中国图象图形学报》 CSCD 北大核心 2017年第2期188-196,共9页
目的针对现有广义均衡模糊C-均值聚类不收敛问题,提出一种改进广义均衡模糊聚类新算法,并将其推广至再生希尔伯特核空间以便提高该类算法的普适性。方法在现有广义均衡模糊C-均值聚类目标函数的基础上,利用Schweizer T范数极限表达式的... 目的针对现有广义均衡模糊C-均值聚类不收敛问题,提出一种改进广义均衡模糊聚类新算法,并将其推广至再生希尔伯特核空间以便提高该类算法的普适性。方法在现有广义均衡模糊C-均值聚类目标函数的基础上,利用Schweizer T范数极限表达式的性质构造了新的广义均衡模糊C-均值聚类最优化目标函数,然后采用拉格朗日乘子法获取其迭代求解所对应的隶属度和聚类中心表达式,同时对其聚类中心迭代表达式进行修改并得到一类聚类性能显著改善的修正聚类算法;最后利用非线性函数将数据样本映射至高维特征空间获得核空间广义均衡模糊聚类算法。结果对Iris标准文本数据聚类和灰度图像分割测试表明,提出的改进广义均衡模模糊聚类新算法及其修正算法具有良好的分类性能,核空间广义均衡模糊聚类算法对比现有融入类间距离的改进模糊C-均值聚类(FCS)算法和改进再生核空间的模糊局部C-均值聚类(KFLICM)算法能将图像分割的误分率降低10%30%。结论本文算法克服了现有广义均衡模糊C-均值聚类算法的缺陷,同时改善了聚类性能,适合复杂数据聚类分析的需要。 展开更多
关键词 广义均衡模糊C-均值 核空间 Schweizer T范数 图像分割 误分率 聚类性能
原文传递
多尺度变换近邻传播算法
12
作者 唐敏 《长春工业大学学报》 CAS 2015年第2期198-201,共4页
利用多尺度变换将高维数据映射成低维数据,便于近邻传播聚类。仿真证明,与传统近邻传播算法相比,基于多尺度变换的近邻传播算法聚类精度高,收敛速度快。
关键词 近邻传播算法 多尺度变换 聚类性能
下载PDF
基于交通因子状态网络的城市交叉口交通流预测 被引量:6
13
作者 张伟斌 张帅 +1 位作者 郭海锋 冯姚瑶 《中国公路学报》 EI CAS CSCD 北大核心 2021年第12期217-228,共12页
信息技术的快速发展,为交通研究和城市交通管理提供了大规模、多样化的数据资源,并为城市交通状态估计和交通流预测方法的研究提供了有力支持。将城市交叉口视为一个微观交通系统,采用数据驱动与领域知识结合的方式,建立微观层次的交通... 信息技术的快速发展,为交通研究和城市交通管理提供了大规模、多样化的数据资源,并为城市交通状态估计和交通流预测方法的研究提供了有力支持。将城市交叉口视为一个微观交通系统,采用数据驱动与领域知识结合的方式,建立微观层次的交通因子状态网络模型(Traffic Factor State Network, TFSN),考察交通因素之间的相互关联,并考虑环境因素的影响。该模型结合交通因子和环境影响因子的影响,通过对交通流数据进行聚类分析,估算出对应于环境影响因子的交通状态,并通过实际案例验证其物理意义以及与交通流实际状态的对应关系。进一步地,基于不同交通状态下的交通流数据建立高阶多元马尔可夫链,进行交通流预测,并根据交通流时间序列的聚类性能指标提高模型的预测准确性。对数据序列马氏性强弱、马尔可夫模型阶数与模型预测准确性之间关系进行分析。研究结果表明:根据马氏性合理选择马尔可夫模型的阶数可以提升模型预测准确性;直接对原始交通流数据进行预测的平均绝对百分比误差为24.61%,而不同交通状态下交通流预测的平均绝对百分比误差为16.99%,相比直接预测误差下降了7.62%,验证了所提出的微观交通因子状态网络的有效性和可用性。 展开更多
关键词 交通工程 交通流预测 EM算法 交通因子状态网络模型 高阶多元马尔可夫链 聚类性能指标
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部