期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于免疫遗传算法的工程图自动调优技术 被引量:4
1
作者 朱学敏 王宗彦 +2 位作者 杨芬 吴淑芳 陆春月 《图学学报》 CSCD 北大核心 2013年第2期83-88,共6页
针对目前三维模型参数化变型后,工程图自动生成方法中出现的视图布局不合理、比例失调、标注混乱等问题,及现有调图技术的局限性,论文提出采用免疫遗传算法对工程图进行优化调整。实现了基于模板参数化驱动后工程图的自动更新与视图布... 针对目前三维模型参数化变型后,工程图自动生成方法中出现的视图布局不合理、比例失调、标注混乱等问题,及现有调图技术的局限性,论文提出采用免疫遗传算法对工程图进行优化调整。实现了基于模板参数化驱动后工程图的自动更新与视图布局、视图比例及其各种标注位置等的优化调整。实验证明该方法可以实现智能化快速出图,保证设计的准确性,提高设计效率和质量。 展开更多
关键词 参数化变型设计 免疫遗传算法 工程图自动调优 智能化快速出图
下载PDF
基于资源签名与遗传算法的Hadoop参数自动调优系统 被引量:5
2
作者 马跃 余骋远 于碧辉 《计算机应用研究》 CSCD 北大核心 2017年第11期3219-3222,3228,共5页
在Hadoop集群的优化配置中,配置参数存在种类繁多、含义复杂、相互关联影响的特性,导致难以实现快速准确寻优。针对以上问题,构建了Hadoop集群自动调优系统,其中在系统中设计了资源获取器与参数配置库,分别用于获取各作业的资源消耗与... 在Hadoop集群的优化配置中,配置参数存在种类繁多、含义复杂、相互关联影响的特性,导致难以实现快速准确寻优。针对以上问题,构建了Hadoop集群自动调优系统,其中在系统中设计了资源获取器与参数配置库,分别用于获取各作业的资源消耗与存储分发配置方案。该系统利用MapReduce作业的小规模数据集资源签名将任务分类,在遗传算法框架中通过任务的测试评估对配置方案进行自动迭代优化。实验结果表明,调优后集群的任务完成时间明显缩减,集群的资源利用率有了明显提升。 展开更多
关键词 HADOOP集群 资源签名 遗传算法 参数配置 自动调优
下载PDF
Hadoop集群性能参数自动调优信息库系统构建 被引量:2
3
作者 郑晓薇 项明 +1 位作者 张大为 刘青昆 《小型微型计算机系统》 CSCD 北大核心 2014年第3期538-542,共5页
为了使Hadoop集群系统能够应对多变的任务及系统本身节点差异对集群性能带来的影响,采用TaskConfigure服务器构建Hadoop集群参数信息库系统实现对集群参数的自动调优配置.通过对集群节点及任务的分类,提出集群按类分配配置参数及采用节... 为了使Hadoop集群系统能够应对多变的任务及系统本身节点差异对集群性能带来的影响,采用TaskConfigure服务器构建Hadoop集群参数信息库系统实现对集群参数的自动调优配置.通过对集群节点及任务的分类,提出集群按类分配配置参数及采用节点资源利用效率生成集群系统参数的优化配置值.实验结果表明,参数信息库系统的自动调优保证了集群工作性能的充分发挥,有效地缩短了集群执行任务的工作时间,使集群具有良好的稳定性和扩展性. 展开更多
关键词 TaskConfigure服务器 HADOOP集群 参数信息库系统 自动调优
下载PDF
基于随机森林和遗传算法的Ceph参数自动调优 被引量:14
4
作者 陈禹 毛莺池 《计算机应用》 CSCD 北大核心 2020年第2期347-351,共5页
Ceph系统性能受Ceph配置参数的显著影响,在Ceph集群的配置优化中,配置参数种类繁多、含义复杂,导致难以实现快速准确寻优。针对以上问题,提出一种基于随机森林(RF)和遗传算法(GA)的参数调优方法,用于自动调整Ceph参数配置以优化Ceph系... Ceph系统性能受Ceph配置参数的显著影响,在Ceph集群的配置优化中,配置参数种类繁多、含义复杂,导致难以实现快速准确寻优。针对以上问题,提出一种基于随机森林(RF)和遗传算法(GA)的参数调优方法,用于自动调整Ceph参数配置以优化Ceph系统性能。该方法使用RF算法为Ceph系统构建性能预测模型,并将预测模型的输出作为GA的输入,通过GA对参数配置方案进行自动迭代优化。仿真结果表明,调优后的参数配置较默认的参数配置相比,使Ceph文件系统的读写性能提高了约1.4倍,并且寻优耗时远低于黑盒参数调优方法。 展开更多
关键词 Ceph 参数配置 随机森林 遗传算法 自动调优
下载PDF
多面体模型下的循环置换与自动调优 被引量:1
5
作者 彭畅 刘青枝 陈长波 《计算机工程与科学》 CSCD 北大核心 2023年第12期2121-2134,共14页
针对常用多面体编译器Pluto默认循环调度和分块大小性能欠佳的问题,提出了一种为其调度计算多种合法置换,根据置换和分块大小构成的配置空间为循环程序自动调优的方法。通过对定义循环融合的标量维度的处理,实现了非完美嵌套循环块间和... 针对常用多面体编译器Pluto默认循环调度和分块大小性能欠佳的问题,提出了一种为其调度计算多种合法置换,根据置换和分块大小构成的配置空间为循环程序自动调优的方法。通过对定义循环融合的标量维度的处理,实现了非完美嵌套循环块间和块内的同时置换。构建了4种机器学习驱动的自动调优策略,为循环程序在指定问题规模下寻找优化的置换序和分块大小组合。默认分块大小下,扩展后的Pluto编译器并行环境下生成的最佳置换相较于Pluto的默认调度取得了最高4.02和几何平均2.12的加速比。通过进一步搜索更优的置换序和分块大小组合,最好的自动调优策略在并行环境下相较于Pluto的默认优化取得了最高5.48和几何平均2.86的加速比。此外,指定问题规模下,自动调优得到的最佳配置和学习模型应用于相似问题规模时,相较于Pluto的默认优化也取得了不同程度的性能提升。 展开更多
关键词 循环置换 循环分块 多面体模型 自动调优 机器学习
下载PDF
基于机器学习的编译器自动调优综述 被引量:7
6
作者 池昊宇 陈长波 《计算机科学》 CSCD 北大核心 2022年第1期241-251,共11页
现代编译器提供的优化选项众多,选择何种参数因子、选择哪些选项组合以及以何种顺序应用这些选项成为复杂的问题,其中优化次序问题是最困难的优化问题。随着传统方法的改进(迭代编译结合启发式优化搜索)以及新技术的出现(机器学习),构... 现代编译器提供的优化选项众多,选择何种参数因子、选择哪些选项组合以及以何种顺序应用这些选项成为复杂的问题,其中优化次序问题是最困难的优化问题。随着传统方法的改进(迭代编译结合启发式优化搜索)以及新技术的出现(机器学习),构建一种相对高效、智能的编译器自动调优框架成为可能。文中通过调查过去数十年的相关研究,总结了前人的研究思路和应用方法。首先介绍了编译器自动调优的发展历程,包括早期的手工方法、成本函数驱动的方法、启发式优化搜索驱动的迭代编译、基于机器学习的直接预测以及机器学习驱动的迭代编译方法。然后重点梳理了基于机器学习的直接预测和机器学习驱动的迭代编译自动调优方法,统计和对比了一些较为成功的框架和最新的研究成果。最后提出了当前编译器优化存在的问题和今后的重点研究方向。 展开更多
关键词 编译器 自动调优 机器学习 迭代编译 化择项 化择序
下载PDF
自动调优技术在智慧校园数据库的应用与优化 被引量:2
7
作者 田浩 《湖南邮电职业技术学院学报》 2021年第4期26-29,共4页
文章分析了智慧校园数据平台建设过程中应用MPP架构数据库出现的主要问题,然后提出将基于机器学习的数据库自动调优技术OtterTune应用到其中,并针对MPP架构数据库负载刻画不够准确的问题,提出一种新的算法与解决思路,最后对新的算法进... 文章分析了智慧校园数据平台建设过程中应用MPP架构数据库出现的主要问题,然后提出将基于机器学习的数据库自动调优技术OtterTune应用到其中,并针对MPP架构数据库负载刻画不够准确的问题,提出一种新的算法与解决思路,最后对新的算法进行了性能分析,结果显示调优效果提升。 展开更多
关键词 智慧校园 MPP架构数据库 数据库自动调优 自动参数 多节点负载刻画
下载PDF
模板运算代码的自动生成与调优框架
8
作者 刘金硕 文尧 《计算机工程》 CAS CSCD 北大核心 2024年第6期35-47,共13页
针对现有模板代码生成方法不支持多图形处理器(GPU)、调优不充分等问题,提出一种由领域专用语言(DSL)描述的模板代码的自动生成与调优框架。在代码自动生成阶段,该框架能够自动解析上层提供的描述语言,构建计算图进而生成模板运算的统... 针对现有模板代码生成方法不支持多图形处理器(GPU)、调优不充分等问题,提出一种由领域专用语言(DSL)描述的模板代码的自动生成与调优框架。在代码自动生成阶段,该框架能够自动解析上层提供的描述语言,构建计算图进而生成模板运算的统一计算设备架构(CUDA)核函数,同时根据单GPU或多GPU环境生成不同的主机端代码。在代码调优阶段,根据不同的GPU型号确定候选参数范围,动态调用生成的CUDA核函数以确定最优参数。在多GPU的情况下,自动生成的主机端代码能够使用计算与通信重叠的方法进行边界数据交换。在4种不同的GPU与7、13、19、27点模板运算中,该框架能找到最优的参数配置。实验结果表明,对于Tesla V100-SXM2,以调优过的参数进行模板运算,该框架在单精度4种模板运算下的每秒万亿次浮点运算数(TFLOPs)分别为1.230、1.680、1.120、1.480,在双精度下分别为0.690、1.010、0.480、1.470,平均性能达到手工优化代码的98%,并且描述更简单,支持多GPU扩展。 展开更多
关键词 模板运算 统一计算设备架构 计算图 领域专用语言 代码生成 自动调优
下载PDF
稀疏矩阵向量乘的自动调优
9
作者 杜臻 谭光明 《计算物理》 CSCD 北大核心 2024年第1期33-39,共7页
分析稀疏矩阵向量乘(SpMV)程序优化的难点,介绍两个自动调优的代表性工作:基于预实现模板的SMAT和从头设计程序的AlphaSparse。详细介绍了它们的设计思路、实现细节、测试结果以及各自的优缺点。最后,对SpMV自动调优的发展趋势进行了分... 分析稀疏矩阵向量乘(SpMV)程序优化的难点,介绍两个自动调优的代表性工作:基于预实现模板的SMAT和从头设计程序的AlphaSparse。详细介绍了它们的设计思路、实现细节、测试结果以及各自的优缺点。最后,对SpMV自动调优的发展趋势进行了分析和预测。 展开更多
关键词 高性能科学计算 稀疏矩阵 自动调优 稀疏矩阵向量乘
原文传递
面向自动参数调优的动态负载匹配方法 被引量:4
10
作者 沈忱 邰凌翔 彭煜玮 《计算机应用》 CSCD 北大核心 2021年第3期657-661,共5页
针对OtterTune等自动参数调优方法采用静态负载描述不够准确的问题,提出了一种动态负载的时序描述方式和动态负载匹配方法。首先,提出一种动态负载描述方法来更准确地刻画负载变化;接着,对于负载匹配中序列不规则、欧氏距离算法不再适... 针对OtterTune等自动参数调优方法采用静态负载描述不够准确的问题,提出了一种动态负载的时序描述方式和动态负载匹配方法。首先,提出一种动态负载描述方法来更准确地刻画负载变化;接着,对于负载匹配中序列不规则、欧氏距离算法不再适用等问题,基于动态时间规整(DTW)算法提出了一种使用数据对齐思想的动态负载匹配算法;最后,将所提出的方法应用于OtterTune上从而形成了基于动态负载的调优工具D-OtterTune,并对其进行若干实验。实验结果表明,和OtterTune原方法相比,动态负载匹配方法对自动参数调优的负载匹配的准确度有稳定幅度的提升,使D-OtterTune准确度提升达到3%。可见在数据密集型应用中,D-OtterTune对整体业务性能可以产生明显影响。 展开更多
关键词 自动参数 动态负载描述 动态负载匹配 动态时间规整
下载PDF
MACO:基于访存视角的卷积网络自动代码优化
11
作者 张晓扬 肖俊敏 +1 位作者 姚家树 谭光明 《高技术通讯》 CAS 2023年第12期1253-1264,共12页
推理自动优化一直是人工智能(AI)与系统结构领域交叉的研究重点,但以访存为出发点的自动优化研究方案较少。本文从全局和局部两方面出发,针对数据布局和内核的自动优化问题,以访存的视角对卷积神经网络(CNN)自动代码优化中优化时间成本... 推理自动优化一直是人工智能(AI)与系统结构领域交叉的研究重点,但以访存为出发点的自动优化研究方案较少。本文从全局和局部两方面出发,针对数据布局和内核的自动优化问题,以访存的视角对卷积神经网络(CNN)自动代码优化中优化时间成本过高的问题进行研究。为有效分析访存,本文改进了经典的红蓝卵石访存模型的建模方法,提出了新的I/O下界估计方法,降低了多阶段复合算法的下界估计难度,并基于改进后的模型估计了卷积的I/O下界。根据卷积下界估计的结论,本文对数据流进行合理设计,有针对性地优化了自动模板生成技术下巨大的搜索空间,避免了大量无效搜索过程,使内核搜索效率较在未经优化的搜索空间中得到显著加速,并在一般性的卷积参数下较cuDNN有平均2.24倍的性能提升,保证了内核性能。同时本文借助神经网络实现了不同数据布局下的卷积性能预测,R2得分高于传统机器学习模型,且在ResNet-18、AlexNet和VGG-11模型中采用基于数据布局回溯算法和预测模型的混合布局策略较默认布局策略分别有1.28倍、1.32倍和1.29倍的性能提升。 展开更多
关键词 内存 人工智能(AI) 推理 数据布局 自动调优
下载PDF
Web文本分类中的标签权重自动优化研究 被引量:4
12
作者 钟旭东 黄章进 +1 位作者 顾乃杰 张旭 《小型微型计算机系统》 CSCD 北大核心 2016年第5期890-894,共5页
Web文本分类是Web数据挖掘的重要技术之一.为了利用HTML的半结构特性,现有的Web文本分类技术多采用手工指定的方法,决定不同标签的权重系数.这种方法完全根据个人经验,未能充分利用样本集的结构特性,识别效果提升并不明显.针对这一问题... Web文本分类是Web数据挖掘的重要技术之一.为了利用HTML的半结构特性,现有的Web文本分类技术多采用手工指定的方法,决定不同标签的权重系数.这种方法完全根据个人经验,未能充分利用样本集的结构特性,识别效果提升并不明显.针对这一问题,本文设计和实现了一种基于差分进化算法的Web文本标签权重系数自动寻优方案,并对差分优化算法进行了改进,以提高其局部搜索能力.实验结果表明,该方案能充分利用样本集的特性并能有效地提高分类的准确率. 展开更多
关键词 WEB文本分类 自动权重 差分进化算法 半结构特征
下载PDF
选择稀疏矩阵乘法最优存储格式的研究 被引量:10
13
作者 李佳佳 张秀霞 +1 位作者 谭光明 陈明宇 《计算机研究与发展》 EI CSCD 北大核心 2014年第4期882-894,共13页
稀疏矩阵向量乘法(sparse matrix vector multiplication,SpMV)是科学和工程领域中重要的核心子程序之一,也是稀疏基本线性代数子程序(basic linear algebra subprograms,BLAS)库的重要函数.目前很多SpMV的优化工作在不同程度上获... 稀疏矩阵向量乘法(sparse matrix vector multiplication,SpMV)是科学和工程领域中重要的核心子程序之一,也是稀疏基本线性代数子程序(basic linear algebra subprograms,BLAS)库的重要函数.目前很多SpMV的优化工作在不同程度上获得了性能提升,但大多数优化工作针对特定存储格式或一类具有特定特征的稀疏矩阵缺乏通用性,因此高性能的SpMV实现并没有广泛地应用于实际应用和数值解法器中.另外,稀疏矩阵具有众多存储格式,不同存储格式的SpMV存在较大性能差异.根据以上现象,提出一个SpMV的自动调优器(SpMV auto-tuner,SMAT).对于一个给定的稀疏矩阵,SMAT结合矩阵特征选择并返回其最优的存储格式,应用程序通过调用SMAT来得到合适的存储格式,从而获得性能提升,同时随着SMAT中存储格式的扩展,更多的SpMV优化工作可以将性能优势在实际应用中发挥作用.使用佛罗里达大学的2 366个稀疏矩阵作为测试集,在Intel上SMAT分别获得9.11GFLOPS(单精度)和2.44GFLOPS(双精度)的最高浮点性能,在AMD平台上获得了3.36GFLOPS(单精度)和1.52GFLOPS(双精度)的最高浮点性能.相比Intel的核心数学函数库(math kernel library,MKL)数学库,SMAT平均获得1.4~1.5倍的性能提升. 展开更多
关键词 SpMV 自动调优 数值解法器 稀疏矩阵 SpBLAS
下载PDF
基于机器学习的HBase配置参数优化研究 被引量:2
14
作者 徐江峰 谭玉龙 《计算机科学》 CSCD 北大核心 2020年第S01期474-479,484,共7页
HBase是一个分布式数据库管理系统,对于需要快速随机访问大量数据的应用程序,它正变得越来越流行。但是,它有许多性能关键配置参数,这些参数之间可能会以复杂的方式相互影响,这使得手动调整它们以获得最佳性能变得极其困难。文中提出了... HBase是一个分布式数据库管理系统,对于需要快速随机访问大量数据的应用程序,它正变得越来越流行。但是,它有许多性能关键配置参数,这些参数之间可能会以复杂的方式相互影响,这使得手动调整它们以获得最佳性能变得极其困难。文中提出了一种新的方法来自动调优给定HBase应用程序的配置参数,称为自动调优HBase。其关键是建立一个以配置参数为输入的低成本性能模型。为此,系统地研究了不同的建模技术,并决定采用集成学习算法来构建性能模型。随后,利用遗传算法通过性能模型为应用程序搜索最优配置参数。因此,它可以快速且自动地识别一组配置参数值,以使应用程序的性能达到最佳。实验测试了Yahoo!云服务基准的5个应用程序,结果表明,与默认配置相比,优化后的吞吐量平均提高41%,最高可达97%。与此同时,HBase操作的延迟平均降低了11.3%,最高可达57%。 展开更多
关键词 HBASE 自动调优 性能建模 性能 机器学习
下载PDF
一种基于遗传算法的BLAS库优化方法 被引量:2
15
作者 孙成国 兰静 姜浩 《计算机工程与科学》 CSCD 北大核心 2018年第5期798-804,共7页
基于OpenBLAS和BLIS开源线性代数基础算法库,对稠密矩阵乘法GEMM运算的性能优化展开研究。针对如何选取稠密矩阵分块并行算法的关键分块参数这一问题,建立性能优化模型。采用改进的遗传算法求解上述优化模型,将某一分块参数组合(种群个... 基于OpenBLAS和BLIS开源线性代数基础算法库,对稠密矩阵乘法GEMM运算的性能优化展开研究。针对如何选取稠密矩阵分块并行算法的关键分块参数这一问题,建立性能优化模型。采用改进的遗传算法求解上述优化模型,将某一分块参数组合(种群个体)所对应的稠密矩阵乘法的性能值作为该个体的适应度,通过不断迭代地进行选择、交叉、变异操作,找到最优的分块参数组合,使得稠密矩阵运算的性能值最优。数值实验表明,基于遗传算法求解得出最优分块参数下的GEMM性能值优于默认分块参数下的性能值,达到了优化的目的。 展开更多
关键词 BLAS GEMM 遗传算法 自动调优
下载PDF
一种基于TVM的算子生成加速策略
16
作者 高伟 李帅龙 +3 位作者 茆琳 王磊 李颖颖 韩林 《计算机工程》 CAS CSCD 北大核心 2024年第8期353-362,共10页
随着人工智能(AI)的飞速发展,新算子和底层硬件层出不穷,这给算子库的开发和维护带来了巨大的工作量。单纯基于手工优化来解决AI模型的性能和效率很容易出现瓶颈。TVM深度学习编译器通过代码的自动化生成减轻了手工优化的负担,但同时也... 随着人工智能(AI)的飞速发展,新算子和底层硬件层出不穷,这给算子库的开发和维护带来了巨大的工作量。单纯基于手工优化来解决AI模型的性能和效率很容易出现瓶颈。TVM深度学习编译器通过代码的自动化生成减轻了手工优化的负担,但同时也存在搜索时间长的问题。为此,针对TVM的自动化代码生成框架Ansor,提出基于梯度提升算法的新代价模型和基于预定义规则的调度空间剪枝优化2种优化策略,旨在加速TVM的自动化代码生成过程,实现模型快速落地与部署,并进一步为人工智能技术的应用提供更高效的解决方案。实验结果表明,通过应用优化后代价模型可以在不损失推理时间的前提下,使得在x86 CPU平台上模型的调优时间减少30%~35%,同时优化后算子性能最高可提升22%,使得在深度计算单元(DCU)平台上模型的调优时间减少20%左右,同时优化后算子平均性能提升5.7%,此外,基于预定义规则的剪枝策略可以有效提升代价模型的收敛速度,并且在原有最佳迭代次数下,模型推理时间可提高7.4%。 展开更多
关键词 深度学习编译器 代价模型 梯度提升算法 剪枝策略 自动调优
下载PDF
高性能稀疏矩阵向量乘的程序设计综述
17
作者 杜臻 谭光明 孙凝晖 《高技术通讯》 CAS 北大核心 2024年第8期807-823,共17页
稀疏矩阵向量乘(SpMV)广泛应用于科学计算、图计算、数据分析等领域,是自现代计算机诞生以来经久不衰且挑战依旧的研究热点。本文系统回顾了20世纪70年代以来稀疏矩阵向量乘程序设计的发展脉络和各阶段的代表性工作;分析比较了这一领域... 稀疏矩阵向量乘(SpMV)广泛应用于科学计算、图计算、数据分析等领域,是自现代计算机诞生以来经久不衰且挑战依旧的研究热点。本文系统回顾了20世纪70年代以来稀疏矩阵向量乘程序设计的发展脉络和各阶段的代表性工作;分析比较了这一领域4条技术路线,即人工程序设计、自动调优器、稀疏编译器和自动程序设计器,在当今的流行方法;并在此基础上对高性能稀疏矩阵向量乘程序设计的研究趋势做出预测,力图给学习者和研究者带来有益的知识与启示。 展开更多
关键词 稀疏矩阵向量乘(SpMV) 稀疏矩阵格式 自动调优 稀疏编译器 高性能计算 并行算法
下载PDF
基于深度学习的稀疏矩阵向量乘运算性能预测模型 被引量:3
18
作者 曹中潇 冯仰德 +5 位作者 王珏 闵维潇 姚铁锤 高岳 王丽华 高付海 《计算机工程》 CAS CSCD 北大核心 2022年第2期86-91,共6页
稀疏矩阵向量乘(SpMV)是求解稀疏线性方程组的计算核心,被广泛应用在经济学模型、信号处理等科学计算和工程应用中,对于SpMV及其调优技术的研究有助于提升解决相关领域问题的运算效率。传统SpMV自动调优方法基于硬件平台的体系结构参数... 稀疏矩阵向量乘(SpMV)是求解稀疏线性方程组的计算核心,被广泛应用在经济学模型、信号处理等科学计算和工程应用中,对于SpMV及其调优技术的研究有助于提升解决相关领域问题的运算效率。传统SpMV自动调优方法基于硬件平台的体系结构参数设置来提升SpMV性能,但巨大的参数设置量导致搜索空间变大且自动调优耗时大幅增加。采用深度学习技术,基于卷积神经网络,构建由双通道稀疏矩阵特征融合以及稀疏矩阵特征与体系结构特征融合组成的SpMV运算性能预测模型,实现快速自动调优。为提高SpMV运算时间的预测精度,选取特征数据并利用箱形图统计SpMV时间信息,同时在佛罗里达稀疏矩阵数据集上进行实验设计与验证,结果表明,该模型的SpMV运算时间预测准确率达到80%以上,并且具有较强的泛化能力。 展开更多
关键词 稀疏矩阵向量乘 自动调优 深度学习 卷积神经网络 特征融合
下载PDF
基于神经网络的循环分块大小预测 被引量:7
19
作者 池昊宇 陈长波 《计算机科学》 CSCD 北大核心 2020年第8期62-70,共9页
循环程序的优化一直是程序优化的重点,循环分块作为一种典型的循环程序优化技术已被广泛地研究和应用。分块大小的选择对循环程序的性能有着重要影响,分块大小的选择复杂多变且高度依赖程序和硬件。传统的静态分析和启发式经验搜索的人... 循环程序的优化一直是程序优化的重点,循环分块作为一种典型的循环程序优化技术已被广泛地研究和应用。分块大小的选择对循环程序的性能有着重要影响,分块大小的选择复杂多变且高度依赖程序和硬件。传统的静态分析和启发式经验搜索的人工和时间成本过高,缺少通用性和可移植性。为此,考虑使用有良好高维表示特性的神经网络方法来学习程序与硬件复杂交互过程中分块大小与程序性能的隐含关联。从问题规模、循环结构、循环内操作的局部性等方面抽取出一组新的29维特征,对问题规模为1024~2048的随机大小的6类内核程序(3维循环、2维数据)的数十万行示例进行实验。串行模型(TSS-T6)相比GCC-O2默认优化实现了6.64倍的平均加速比,相比穷尽搜索实现了98.5%的平均最大可用性能,相比Pluto默认分块优化实现了平均9.9%的性能提升。并行模型(TSSP-T6-Search)相比OpenMP默认优化实现了2.41倍的平均加速比,相比穷尽搜索实现了91.7%的平均最大可用性能,同时与Pluto默认分块并行优化相比得到了平均9%的性能提升。 展开更多
关键词 编译 自动调优 循环程序分块 人工神经网络 缓存
下载PDF
数控机床和伺服电机中应用扰动观测器的精度控制与补偿
20
作者 康琪 林军 《上海师范大学学报(自然科学版)》 2012年第5期475-482,共8页
计算机化数控机床CNC在制造业中是一种高度集成的机电一体化系统.然而,不确定因素却降低了它运动的准确性.为了估计系数变化和电流测量问题中的不确定性,针对速度和电流循环,提出了一种线性状态空间扰动观测器,通过对数控机床和伺服电... 计算机化数控机床CNC在制造业中是一种高度集成的机电一体化系统.然而,不确定因素却降低了它运动的准确性.为了估计系数变化和电流测量问题中的不确定性,针对速度和电流循环,提出了一种线性状态空间扰动观测器,通过对数控机床和伺服电机的建模,不断改变影响准确性的各项参数,同时应用自动调优程序对电动机多样性系数进行识别,实验结果表明:由于线性误差,外部扰动等不确定因素所造成的对于速度与电流的影响得到显著改善,并最终实现了对于转矩振动的抑制. 展开更多
关键词 CNC 伺服电机 线性状态空间扰动观测器 自动调优
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部