期刊文献+
共找到113篇文章
< 1 2 6 >
每页显示 20 50 100
基于改进K-means聚类和皮尔逊相关系数户变关系异常诊断 被引量:4
1
作者 周纲 黄瑞 +3 位作者 刘度度 张芝敏 胡军华 高云鹏 《电测与仪表》 北大核心 2024年第3期76-82,152,共8页
用电信息采集系统易出现台区户变关系错误问题,传统诊断技术主要针对少用户台区出现异常用户情况,但对于多达数百用户台区,存在多相邻台区异常用户特征提取难题。文中首先通过主成分分析对GIS系统获取台区总表和用户电表电压数据实现降... 用电信息采集系统易出现台区户变关系错误问题,传统诊断技术主要针对少用户台区出现异常用户情况,但对于多达数百用户台区,存在多相邻台区异常用户特征提取难题。文中首先通过主成分分析对GIS系统获取台区总表和用户电表电压数据实现降维,建立改进K-means聚类提取电压数据特征,提出改进皮尔逊相关系数算法分析待检测用户,据此建立基于改进K-means聚类和改进皮尔逊相关系数的户变关系异常诊断方法,实现多异常用户所属正确台区诊断。实际算例分析结果表明,文中提出算法在识别同一台区一个及多个异常用户、不同台区多个异常用户情况下均能有效实现异常用户的准确检测与分析,相比传统检测方法,实现简单且准确性更高。 展开更多
关键词 户变关系 GIS系统 成分分析 改进k-means
下载PDF
主成分分析和K-means聚类在说话人识别中的应用 被引量:7
2
作者 马金龙 景新幸 +2 位作者 杨海燕 冼灿娇 赵靖 《计算机应用》 CSCD 北大核心 2015年第A01期127-129,共3页
为了解决特征提取计算量大且特征参数不够全面的问题,提出了用主成分分析和K-means聚类进行语音特征参数提取的方法。通过对说话人识别系统中最常用的线性预测倒谱系数(LPCC)参数和梅尔倒谱系数(MFCC)参数提取原理以及差分参数的提取算... 为了解决特征提取计算量大且特征参数不够全面的问题,提出了用主成分分析和K-means聚类进行语音特征参数提取的方法。通过对说话人识别系统中最常用的线性预测倒谱系数(LPCC)参数和梅尔倒谱系数(MFCC)参数提取原理以及差分参数的提取算法深入研究,选择LPCC、MFCC以及其一阶差分参数的组合作为最终混合特征参数。首先用主成分分析降低每一帧语音信号特征参数的阶数,然后经过K-means聚类降低帧数,最后通过矢量量化(VQ)来进行说话人识别。实验结果表明,该方法降低了计算复杂度,同时也提升了识别准确性。 展开更多
关键词 成分分析 k-means 混合特征参数 矢量量化 说话人识别
下载PDF
基于主成分分析和K-means聚类的平行坐标可视化技术研究 被引量:6
3
作者 马国峻 王水波 +1 位作者 裴庆祺 詹阳 《网络与信息安全学报》 2017年第8期18-27,共10页
为了解决多维数据的维数过高、数据量过大带来的平行坐标可视化图形线条密集交叠以及数据规律特征不易获取的问题,提出基于主成分分析和K-means聚类的平行坐标(PCAKP,principal component analysis and k-means clustering parallel coo... 为了解决多维数据的维数过高、数据量过大带来的平行坐标可视化图形线条密集交叠以及数据规律特征不易获取的问题,提出基于主成分分析和K-means聚类的平行坐标(PCAKP,principal component analysis and k-means clustering parallel coordinate)可视化方法。该方法首先对多维数据采用主成分分析方法进行降维处理,其次对降维后的数据采用K-means聚类处理,最后对聚类得到的数据采用平行坐标可视化技术进行可视化展示。以统计局网站发布的数据为测试数据,对PCAKP可视化方法进行测试,与传统平行坐标可视化图形进行对比,验证了PCAKP可视化方法的实用性和有效性。 展开更多
关键词 数据可视化:平行坐标可视化 成分分析 k-means
下载PDF
基于融合改进K-means聚类算法的数据检测技术 被引量:3
4
作者 郭克难 《电子设计工程》 2024年第5期41-45,共5页
针对现有医疗财务数据分析系统平台老旧,采用传统K-means算法进行数据处理时性能较差的问题,文中设计了一种财务异常数据检测算法。对于传统K-means算法存在的分类效果不佳、运行效率偏低等不足,该算法结合密度峰值法对样本点的局部密... 针对现有医疗财务数据分析系统平台老旧,采用传统K-means算法进行数据处理时性能较差的问题,文中设计了一种财务异常数据检测算法。对于传统K-means算法存在的分类效果不佳、运行效率偏低等不足,该算法结合密度峰值法对样本点的局部密度和高密度距离进行计算,进而优化簇中心的选择。同时融合PCA降维算法减少了数据的冗余信息,进一步提高了运行效率。通过引入LOF离群检测算法对分簇后的数据进行检测,从而得到异常数据结果。实验测试中,所提算法在人工数据集上的平均ARI指标为0.844,真实数据集的准确率则达到了79.2%,在所有对比算法中均为最优,表明该算法具有良好的性能,可以对财务异常数据进行准确地检测。 展开更多
关键词 k-means 密度峰值检测 成分分析法 离群检测算法 异常数据检测
下载PDF
基于改进K-means聚类的电网抢修资源优化技术
5
作者 姚宗溥 张韶华 +2 位作者 余伟 杨宁 汪毅 《电子设计工程》 2024年第11期131-135,共5页
针对传统电网抢修资源配置中存在主观性强、处理突发状况能力较弱的问题,文中基于改进K-means聚类算法提出了一种电网抢修资源的分配策略。该策略采用改进算法分析平台的工单数据,以获得聚合数据包,并利用主成分分析法完成对数据的降维... 针对传统电网抢修资源配置中存在主观性强、处理突发状况能力较弱的问题,文中基于改进K-means聚类算法提出了一种电网抢修资源的分配策略。该策略采用改进算法分析平台的工单数据,以获得聚合数据包,并利用主成分分析法完成对数据的降维。降维后的数据经过深度稀疏自编码器的训练,得到的数据特征被K-means++算法聚类,进而输出工单任务的优先级。所提改进算法考虑了多种复杂因素的影响,相比传统算法其综合性能更为理想。多项实验结果表明,所提算法的聚类性能和数据训练性能在多个对比算法中均为最优,可以准确地识别出测试用例中的任务等级,为电网抢修资源的分配与决策提供技术支撑。 展开更多
关键词 k-means 成分分析法 深度稀疏自编码器 资源配置 电网抢修
下载PDF
集群数据下因子分析模型K-Means聚类
6
作者 谢兰俊 《统计学与应用》 2024年第5期1750-1758,共9页
集群数据刻画了不同研究对象在群内的动态关系,在经济学、社会和医学等领域被广泛应用。经典的聚类分析方法常用来刻画样本之间的相似性,进而对样本或者指标进行聚类,对于集群数据子群之间的聚类研究较少。本文对集群数据建立因子分析模... 集群数据刻画了不同研究对象在群内的动态关系,在经济学、社会和医学等领域被广泛应用。经典的聚类分析方法常用来刻画样本之间的相似性,进而对样本或者指标进行聚类,对于集群数据子群之间的聚类研究较少。本文对集群数据建立因子分析模型,通过主成分法,产生群组各异的集群数据,使用K-means聚类方法对集群数据群聚类。随机模拟用因子分析模型主成分法产生集群数据,模拟表明了聚类方法的有效性。实例分析对集群数据群进行聚类,使用轮廓系数对聚类进行评价。评价结果表明,运用机器学习K-means算法对集群数据子群聚类效果较好。Cluster data characterizes the dynamic relationships among different research objects within a cluster, and is widely used in fields such as economics, society, and medicine. Classic clustering analysis methods are commonly used to characterize the similarity between samples and cluster samples or indicators, but there is relatively little research on clustering between subgroups of cluster data. This article establishes a factor analysis model for cluster data, generates cluster data with different groups through principal component analysis, and uses K-means clustering method to cluster the cluster data. Random simulation uses factor analysis model principal component analysis to generate cluster data, and the simulation shows the effectiveness of the clustering method. Case analysis is used to cluster data groups and evaluate the clustering using silhouette coefficients. The evaluation results indicate that the use of machine learning K-means algorithm has a good clustering effect on subgroups of cluster data. 展开更多
关键词 集群数据 因子分析模型 成分法 k-means
下载PDF
基于主成分分析和K-means的便利贴显微共聚焦激光拉曼光谱分类 被引量:2
7
作者 陈壮 贾成贺 姜红 《中国人民公安大学学报(自然科学版)》 2022年第3期9-14,共6页
显微共聚焦激光拉曼光谱法与机器学习结合,建立便利贴物证识别分类模型,为基层民警开展侦查工作提供帮助。以36个不同产地、不同生产厂家的便利贴样品为研究对象,利用显微共聚焦激光拉曼光谱法获取便利贴样品拉曼光谱数据,并对拉曼光谱... 显微共聚焦激光拉曼光谱法与机器学习结合,建立便利贴物证识别分类模型,为基层民警开展侦查工作提供帮助。以36个不同产地、不同生产厂家的便利贴样品为研究对象,利用显微共聚焦激光拉曼光谱法获取便利贴样品拉曼光谱数据,并对拉曼光谱数据进行基线校正、曲线平滑、标准化预处理。利用主成分分析法对36个便利贴样品预处理后的拉曼光谱数据降维,提取了3个特征值大于等于1且累计贡献率85%以上的主成分,3个主成分解释了样品拉曼光谱数据大部分信息。利用K-means无监督聚类算法,指定K值范围,并计算对应聚类系数,确定36个便利贴样品最佳聚类数为6类。利用判别分析验证基于主成分分析和K-means的样品分类模型的适用性和准确性,经验证,样品分类模型原始分类正确率和交叉验证分类正确率分别为100%和97.22%。实验结果表明,显微共聚焦激光拉曼光谱法结合主成分分析和K-means可以实现便利贴分类模型构建,且分类结果可靠。 展开更多
关键词 显微共焦激光拉曼光谱法 成分分析 k-means 便利贴
下载PDF
一种结合有效降维和K-means聚类的协同过滤推荐模型 被引量:15
8
作者 郁雪 李敏强 《计算机应用研究》 CSCD 北大核心 2009年第10期3718-3720,3762,共4页
为了克服"维灾"所带来的问题,提出一种基于主成分分析的维数约简方法,并在转换后的低维向量空间上进行K-means聚类算法,以减少目标用户的最近邻搜索范围,代替在超高维空间上逐一寻找最近邻的过程。实验结果证明了新算法的有效... 为了克服"维灾"所带来的问题,提出一种基于主成分分析的维数约简方法,并在转换后的低维向量空间上进行K-means聚类算法,以减少目标用户的最近邻搜索范围,代替在超高维空间上逐一寻找最近邻的过程。实验结果证明了新算法的有效性,特别在目标用户的历史评价信息较少的情况下,也能有较好的预测精度。 展开更多
关键词 协同过滤 成分分析 维数约简 k-means
下载PDF
基于用户需求意象的多重K-means-ELM侗锦配色模型研究 被引量:3
9
作者 张超 闫茹玉 朱晓君 《丝绸》 CAS CSCD 北大核心 2022年第12期108-118,共11页
社会的快速发展为少数民族文化的发展创造了崭新的环境。当前对研究对象的配色方案中,大多是对色彩本身进行研究而鲜有结合人的主观意象,为挖掘意象词与服饰配色之间的隐含关系,建立用户需求意象与服饰色彩构成及占比之间的映射模型,提... 社会的快速发展为少数民族文化的发展创造了崭新的环境。当前对研究对象的配色方案中,大多是对色彩本身进行研究而鲜有结合人的主观意象,为挖掘意象词与服饰配色之间的隐含关系,建立用户需求意象与服饰色彩构成及占比之间的映射模型,提出了一种基于用户需求意象的多重K-means-ELM侗锦配色方案。首先,通过对侗族织锦色彩样本的提取,运用语意差异法(SD法)获得用户的认知数据源。结合聚类分析对侗族织锦图像进行分类和色彩提取。其次,基于色彩提取结果采用K-means对相似色彩构成的图像进行多重聚类划分得到具有相似色彩构成及占比的图像集合。最后,以侗族织锦色彩样本、色彩比例关系和HSV空间数值等信息与用户意象建立映射关系,采用极限学习机(Extreme learning machine,ELM)对多重划分得到的聚类图像样本单独建模,构建用户需求意象的多重K-means-ELM侗锦配色模型进行侗族服饰的配色研究。经过算例分析,将配色模型运用到以“星河”为主题的现代插画设计实际创作中进行验证,得出了该模型的可行性与科学性,所提出的配色方法提高了建模精度、降低了配色难度,从而细化意象—色彩之间的映射关系。 展开更多
关键词 侗族织锦 用户需求意象 彩量化 主色k-means多重聚类 极限学习机 k-means-ELM配建模 现代插画设计
下载PDF
基于K-means聚类分析的汽车行驶工况构建 被引量:3
10
作者 周溪召 刘启超 《物流科技》 2020年第11期93-96,共4页
为描述汽车行驶过程的运动学规律需构建汽车行驶工况,文章定义了四类行驶状态,划分运动学片段共560个,选取21个运动学特征参数进行标定,利用主成分分析及K-means聚类算法将运动学片段聚为3类,低速、中速、高速状态,分别从每类中提取片... 为描述汽车行驶过程的运动学规律需构建汽车行驶工况,文章定义了四类行驶状态,划分运动学片段共560个,选取21个运动学特征参数进行标定,利用主成分分析及K-means聚类算法将运动学片段聚为3类,低速、中速、高速状态,分别从每类中提取片段合成最终的汽车行驶工况。结果表明:文章构建的工况与其所在的采样总体平均误差为13.87%,小于15%,故构建的状态合理。其他城市同样可按照此方法构建。 展开更多
关键词 行驶工况 运动学片段 成分分析 k-means
下载PDF
改进全局K-Means聚类算法的汽车行驶工况研究
11
作者 徐淑萍 熊小墩 +1 位作者 苏小会 张玉西 《西安工业大学学报》 CAS 2021年第3期338-344,共7页
为有效促进汽车节能减排和新技术发展,文中提出了一种改进全局K Means聚类算法的汽车行驶工况构建方法,通过采集城市道路行驶工况的数据并对数据进行预处理,利用主成分分析法和改进的K Means聚类算法分别对运动学片段中实验数据的12个... 为有效促进汽车节能减排和新技术发展,文中提出了一种改进全局K Means聚类算法的汽车行驶工况构建方法,通过采集城市道路行驶工况的数据并对数据进行预处理,利用主成分分析法和改进的K Means聚类算法分别对运动学片段中实验数据的12个特征参数进行降维和聚类,拟合出某城市汽车行驶工况。分析结果表明:拟合曲线的汽车运动特性能更好代表所采集数据源的相应特性,两者的误差小,时耗低,行驶工况拟合度高,能综合反映实际车辆运行的状况。 展开更多
关键词 行驶工况 成分分析 改进全局k-means 特征参数
下载PDF
基于k-means算法的高速公路服务区分类研究
12
作者 毛俊飞 张冲 +2 位作者 高超 刘兴国 王光亚 《交通技术》 2024年第2期73-80,共8页
截至2023年6月,我国高速公路的建设规模已达到17.73万公里,位居全球之首。根据国家公路网的长远规划预计到2035年,我国的高速公路总长度将达到16.2万公里,现如今已经提前完成规划,基本形成一个现代化、高质量的国家公路网络。这不仅在... 截至2023年6月,我国高速公路的建设规模已达到17.73万公里,位居全球之首。根据国家公路网的长远规划预计到2035年,我国的高速公路总长度将达到16.2万公里,现如今已经提前完成规划,基本形成一个现代化、高质量的国家公路网络。这不仅在新的发展格局中发挥着重要作用,而且对推动经济发展具有关键性的支持作用。在这个背景下,高速公路服务区的分类成为了一个研究重点。它对于理解不同类型服务区周边的土地利用、客流变化规律、发展趋势和建设规划具有重要意义。为了深入分析这一课题,本文采用了聚类分析方法。通过收集服务区附近的兴趣点(POI)、交通枢纽等关键设施的数据,作为研究的主要变量。在对数据进行Z-Score标准化处理后,本研究运用了主成分分析和k-means聚类方法对高速公路服务区进行了细致的分类。根据我们的分析结果,这些服务区可以分为四类:综合型服务区、融合型生产服务区、旅游型服务区以及工业型生产服务区。这一分类不仅为我们后续的深入研究奠定了基础,而且为服务区未来的发展方向提供了参考。 展开更多
关键词 分析 成分分析 k-means 高速公路服务区
下载PDF
茶叶中生物碱及多酚类化合物高效液相色谱-主成分聚类分析 被引量:3
13
作者 宋华湘 陈波 +1 位作者 蔡青云 姚守拙 《天然产物研究与开发》 CAS CSCD 2003年第5期415-418,共4页
色谱分析,以结果中该9种组分的相对含量关系为指标建立样本矩阵,应用主成分分析法进行 聚类分析,结果很好的反映了不同品种和产地的茶叶的品质差异。
关键词 茶叶 高效液相 成分 生物碱 多酚化合物
下载PDF
融合PCA与自适应K-Means聚类的水电机组故障检测在线方法 被引量:14
14
作者 徐雄 林海军 +1 位作者 刘悠勇 胡边 《电子测量与仪器学报》 CSCD 北大核心 2022年第3期260-267,共8页
灯泡贯流式水电机组在运行过程中,由于受水力因素、机械、工况等因素影响,很容易导致转轮叶片与转轮室发生故障,严重影响水电机组安全运行。在分析灯泡贯流式水电机组转轮叶片与转轮室故障信号特征的基础上,提出了一种基于K均值(K-Means... 灯泡贯流式水电机组在运行过程中,由于受水力因素、机械、工况等因素影响,很容易导致转轮叶片与转轮室发生故障,严重影响水电机组安全运行。在分析灯泡贯流式水电机组转轮叶片与转轮室故障信号特征的基础上,提出了一种基于K均值(K-Means)和莱特准则(Wright′s criterion)的水电机组故障在线检测方法。该方法利用主元分析(PCA)对水电机组振动和噪声信号特征降维后,融合莱特准则改进传统K均值算法,以实现K值的自适应选择,对特征进行在线聚类,能快速准确识别水轮机变负荷状态与金属扫膛故障。将本文方法应用到五凌电力近尾洲水电站灯泡贯流式机组故障检测中,实验结果表明,采用该方法的故障在线检测准确率为100%、变负荷在线检测准确率为96.7%,运行近10个月没有出现故障误报和漏报,表明了该方法的有效性。 展开更多
关键词 水电机组 故障在线检测 变负荷检测 自适应k-means 元分析
下载PDF
基于R语言的主成分分析与聚类分析在成绩评价中的应用
15
作者 申丹丹 《科技资讯》 2024年第21期253-256,共4页
主成分分析与聚类分析是当前大数据时代较有应用前景的数据分析方法。首先,介绍主成分分析与聚类分析的原理及其在R语言中的算法实现。其次,利用主成分分析建立一种可以综合评价成绩的方式,通过成绩综合评价的得分进行相应的排名,然后... 主成分分析与聚类分析是当前大数据时代较有应用前景的数据分析方法。首先,介绍主成分分析与聚类分析的原理及其在R语言中的算法实现。其次,利用主成分分析建立一种可以综合评价成绩的方式,通过成绩综合评价的得分进行相应的排名,然后根据主成分中的得分进行聚类分析。对20名学生考试成绩进行分析与评价,得出的结果可以用来反映学生的学习情况与教师的教学成效,这就为成绩的管理提供了一种合理且便于操作的方式。 展开更多
关键词 成分分析 分析 k-means R语言 成绩分析
下载PDF
改进k-means的电网控制自动化系统数据聚类方法 被引量:2
16
作者 李明倩 王苗 刘芳 《机械与电子》 2023年第3期34-38,共5页
为了解决海量数据导致电网控制效率低的问题,提出改进k-means的电网控制自动化系统数据聚类方法。首先,利用主成分分析法提取出电网控制自动化系统数据主成分,将数据简化和降维;然后,通过滤波去噪处理电网数据,保证聚类样本干净整洁;最... 为了解决海量数据导致电网控制效率低的问题,提出改进k-means的电网控制自动化系统数据聚类方法。首先,利用主成分分析法提取出电网控制自动化系统数据主成分,将数据简化和降维;然后,通过滤波去噪处理电网数据,保证聚类样本干净整洁;最后,在改进k-means聚类算法下对数据聚类,确定k值得到最优聚类结果,实现电网控制自动化系统数据聚类。实验结果,对比每组样本下3种方法的Silhouette值,每组实验中Silhouette值的最大值都是所提方法,说明所提方法的聚类难度小和频率控制稳定性小。 展开更多
关键词 k-means 电网控制 成分分析 数据去噪 数据
下载PDF
基于全局K-means聚类算法的汽车行驶工况构建 被引量:16
17
作者 高建平 任德轩 郗建国 《河南理工大学学报(自然科学版)》 CAS 北大核心 2019年第1期112-118,共7页
为构建符合郑州市交通特征的乘用车典型行驶工况,选取60辆乘用车进行数据采集,将采集的有效行驶数据划分成120 744条运动学片段,采用主成分分析法对构建的特征参数矩阵进行降维、非线性化处理。选取戴维森-堡丁指数来确定最佳聚类数,并... 为构建符合郑州市交通特征的乘用车典型行驶工况,选取60辆乘用车进行数据采集,将采集的有效行驶数据划分成120 744条运动学片段,采用主成分分析法对构建的特征参数矩阵进行降维、非线性化处理。选取戴维森-堡丁指数来确定最佳聚类数,并通过全局K-means聚类算法将主成分分析得到的4个主成分聚成3类,然后采用相关系数法从各类片段库中选取具有代表性的运动学片段,从而构建出郑州市乘用车典型循环工况(ZZ_DC)。通过与传统K-means聚类算法构建的工况比较,采用全局K-means聚类构建的工况更加准确地反映了郑州市乘用车在实际道路上的行驶状态。将ZZ_DC工况与国内一直采用的乘用车测试工况(NEDC工况)比较,结果表明,ZZ_DC工况与NEDC工况差异显著,因此,有必要开发出适用于郑州市交通特征的乘用车行驶工况。 展开更多
关键词 乘用车 行驶工况 成分分析法 全局k-means
下载PDF
基于K-Means聚类的微生物群落结构研究 被引量:4
18
作者 王侠林 贺建峰 《软件导刊》 2018年第1期146-148,151,共4页
随着宏基因组学的不断发展,揭示了微生物菌群在研究中的重要作用。采用K-Means聚类算法对来源于北平顶猴阴道微生物群落OTUs数据集的27个样本进行研究,并与PCA主成分分析法进行对比。K-Means聚类将OTUs数据集分成4个Cluster,而PCA将OTU... 随着宏基因组学的不断发展,揭示了微生物菌群在研究中的重要作用。采用K-Means聚类算法对来源于北平顶猴阴道微生物群落OTUs数据集的27个样本进行研究,并与PCA主成分分析法进行对比。K-Means聚类将OTUs数据集分成4个Cluster,而PCA将OTUs数据集划分成5个Cluster。此外,结合样本的元数据-pH,发现样本间的pH值相似性更能与K-Means聚类的分类保持一致。相较于PCA主成分析方法,K-Means聚类能更精确地对OTUs数据集进行分类。 展开更多
关键词 k-means PCA成分分析法 微生物群落结构 OTUs数据集
下载PDF
基于改进K-means聚类的汽车行驶工况构建方法研究 被引量:1
19
作者 刘继隆 李乐 俞俊 《农业装备与车辆工程》 2023年第5期105-109,共5页
为提升对实际道路载荷数据典型工况提取的合理性,将采集到的车辆数据进行预处理、运动片段划分、特征参数提取并形成特征参数矩阵,使用主成分分析法对特征参数降维处理,通过孤立森林对降维后的数据进行离群点检测,并采用K-means算法进... 为提升对实际道路载荷数据典型工况提取的合理性,将采集到的车辆数据进行预处理、运动片段划分、特征参数提取并形成特征参数矩阵,使用主成分分析法对特征参数降维处理,通过孤立森林对降维后的数据进行离群点检测,并采用K-means算法进行聚类分析,根据各工况运行时间所占比例构建汽车行驶工况。结果表明,改进后的K-means聚类算法的Average Silhouette值提升了6.53%,聚类效果明显优化,所构建的汽车行驶工况的相对平均误差为5.09%,验证了该方法的有效性。 展开更多
关键词 片段划分 成分分析 孤立森林 k-means 工况构造
下载PDF
基于训练集聚类选择优化的CPU功耗建模精度提升方法
20
作者 李泽锴 钟佳卿 +7 位作者 冯绍骏 陈娟 邓荣宇 徐涛 谭政源 周柯杏 朱鹏志 马兆阳 《计算机科学》 CSCD 北大核心 2024年第9期59-70,共12页
建立高精度、低开销的CPU功耗模型对于计算机系统的功耗管理与功耗优化至关重要。一般认为训练集规模越大,CPU功耗模型精度越高。但有研究发现增大训练集规模不一定会提高功耗建模精度,有时甚至会导致精度下降,因此,如何选择功耗模型训... 建立高精度、低开销的CPU功耗模型对于计算机系统的功耗管理与功耗优化至关重要。一般认为训练集规模越大,CPU功耗模型精度越高。但有研究发现增大训练集规模不一定会提高功耗建模精度,有时甚至会导致精度下降,因此,如何选择功耗模型训练集以保证CPU功耗模型精度达到要求具有重要意义。文中提出一种基于聚类的训练集选择优化算法来解决上述问题,在有效保证CPU功耗建模精度的同时降低了CPU功耗建模的开销。该算法首先通过主成分分析将基于PMC的程序特征转换为p维向量特征空间,然后根据找到的最优聚类数按照程序特征对程序进行聚类,从每个聚类簇中选出代表程序;最后根据“单聚类簇内代表性最强原则”与“多聚类簇间代表程序数最少原则”形成最优训练集,模型精度相比Baseline精度有明显提高。在x86和ARM两类处理器平台上分别采用线性功耗建模和神经网络功耗建模两种方式,对算法进行了实验评估,实验结果表明所提算法的功耗建模精度有效显著提升。 展开更多
关键词 CP功耗建模 训练集选择 成分分析 k-means
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部