期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于差分进化和贪心策略的自定义指令选择算法研究 被引量:2
1
作者 周学海 纪金松 张敏 《电子学报》 EI CAS CSCD 北大核心 2009年第2期372-376,共5页
本文针对常见启发式算法中忽略指令与指令实例区别的问题,改进了一个已有启发式算法Greedy-Heur:根据指令实例的启发式函数值得出相应指令的权值,并根据指令的优先级关系以贪心策略进行指令实例选择.针对启发式算法无法找到最优解的问题... 本文针对常见启发式算法中忽略指令与指令实例区别的问题,改进了一个已有启发式算法Greedy-Heur:根据指令实例的启发式函数值得出相应指令的权值,并根据指令的优先级关系以贪心策略进行指令实例选择.针对启发式算法无法找到最优解的问题,本文引入基于群体搜索的差分进化算法,并结合贪心策略,提出了ISDE(Instruction Selection Based on Differential Evolution)算法.ISDE算法通过简单的编码和高效的适应度评价机制,快速地迭代搜索最优指令组合.实验结果表明,GreedyHeur和ISDE算法能快速有效地找到比已有启发式算法更优的候选指令组合. 展开更多
关键词 差分进化算法 贪心策略 指令集扩展 指令选择
下载PDF
遗传算法和关键事件禁忌搜索相融合的ARM/Thumb处理器指令选择
2
作者 吴圣宁 李思昆 《计算机学报》 EI CSCD 北大核心 2007年第4期680-685,共6页
面向嵌入式系统的编译器,往往需要同时考虑目标代码的性能、大小和功耗等相互冲突的目标.ARM双指令集处理器,在具备通常的32位ARM指令集基础上,还支持一个缩减的16位Thumb指令集,因而为代码优化提供了多个目标之间折衷的机会.由于同一... 面向嵌入式系统的编译器,往往需要同时考虑目标代码的性能、大小和功耗等相互冲突的目标.ARM双指令集处理器,在具备通常的32位ARM指令集基础上,还支持一个缩减的16位Thumb指令集,因而为代码优化提供了多个目标之间折衷的机会.由于同一个程序的Thumb代码比相应的ARM代码执行更多的指令,因此虽然前者常比后者占用更少的存储空间,但消耗更多的运行时间.针对这种现象,文中建议一个混合演化算法,通过把程序的不同部分有选择地编译成ARM或Thumb指令集代码,使得可灵活地权衡目标代码大小和运行时间.文中的方法基于遗传算法和关键事件禁忌搜索相融合,后者用来局部搜索.指令选择以函数为单位,从对程序动态行为的profiling分析求得程序运行时间.实验结果表明,文中的技术可有效地、灵活地权衡目标代码大小和性能,并且适用于其它的双指令集处理器. 展开更多
关键词 演化算法 指令选择 ARM/Thumb
下载PDF
一种基于代价子图的子字并行指令选择算法
3
作者 王淼 王志英 《计算机工程与科学》 CSCD 2008年第9期141-144,150,共5页
子字并行能够充分利用多媒体算法的数据精度小、内部循环处理形式规则的特点,是加速多媒体处理的有效方式。然而,如何充分挖掘多媒体应用中的子字并行仍然是一个难题。本文说明传统的并行技术可以有效地开发循环中的子字并行性,同时提... 子字并行能够充分利用多媒体算法的数据精度小、内部循环处理形式规则的特点,是加速多媒体处理的有效方式。然而,如何充分挖掘多媒体应用中的子字并行仍然是一个难题。本文说明传统的并行技术可以有效地开发循环中的子字并行性,同时提出一种基于代价子图的子字并行指令自动识别的方法。与其他方法相比,该方法利用代价模型对子字并行指令选择进行定量评估。本文在TTA体系结构框架下实现了这一方法。实验结果表明,该方法可以充分地提取循环中的子字并行性。 展开更多
关键词 子字并行 指令选择 代价子图
下载PDF
基于图神经网络的BWDSP指令选择方法优化研究 被引量:2
4
作者 侯璇 凤维杰 郑启龙 《小型微型计算机系统》 CSCD 北大核心 2021年第12期2672-2679,共8页
现阶段,现代处理器选用不同的策略处理编译完成的代码指令,而选用的指令影响后端代码的性能优化.指令选择所采用的策略依然与传统的基于宏扩展和基于图覆盖的方法相似,且不支持部分复杂的指令,无法充分利用复杂指令带来的高效率,因此也... 现阶段,现代处理器选用不同的策略处理编译完成的代码指令,而选用的指令影响后端代码的性能优化.指令选择所采用的策略依然与传统的基于宏扩展和基于图覆盖的方法相似,且不支持部分复杂的指令,无法充分利用复杂指令带来的高效率,因此也亟需一种新型且有效、可拓展、可移植的指令选择策略.近些年图神经网络GNN在处理非欧氏数据上取得了很多的突破.本文将GNN应用于基于BWDSP平台编译器后端的指令选择的处理过程中,基于图节点的分类、边属性的预测和图分类提出一种低耦合性的指令选择模型,通过实验验证并对比这种方法与传统方法的有效性.并且证明了一个高效的指令选择策略能够充分利用BWDSP的资源,降低程序执行的代价.在提高BWDSP指令选择能力的同时,也期望能将该方法应用到不同平台的指令集,或者编译优化的其它子领域和不同的编译器中. 展开更多
关键词 指令选择 图神经网络 BWDSP平台 编译优化
下载PDF
基于关联性启发的自定义指令选择算法
5
作者 薛辉 周学海 《计算机系统应用》 2010年第1期90-94,共5页
面向特定应用的自定义指令可以减小可执行代码的长度,提高执行效率和降低系统功耗。候选指令选择在自动指令集扩展问题上占用相当重要的作用,它直接影响了指令扩展的性能和效率。已有的启发式选择算法虽然有较优的时间性能,但在时间性... 面向特定应用的自定义指令可以减小可执行代码的长度,提高执行效率和降低系统功耗。候选指令选择在自动指令集扩展问题上占用相当重要的作用,它直接影响了指令扩展的性能和效率。已有的启发式选择算法虽然有较优的时间性能,但在时间性能和选择结果上还有改进的空间。由此,提出了一种基于扩展指令间关联性的启发式算法,实验结果证明,本算法能快速有效的找到比现有启发式算法更优的候选指令组合。 展开更多
关键词 启发式算法 关联性 指令集扩展 指令选择
下载PDF
一种跨基本块向量化指令选择方法
6
作者 徐金龙 赵荣彩 +2 位作者 韩林 刘鹏 张为华 《信息工程大学学报》 2016年第2期244-249,共6页
程序中的向量并行性不仅存在于循环中,也存在于基本块中。SLP向量化算法可以发掘基本块内的并行性。由于基本块之间将会涉及到大量的数据重用,当连续的多个基本块都被向量化时,仅考虑基本块内的向量化难以有效利用可重用数据。提出跨基... 程序中的向量并行性不仅存在于循环中,也存在于基本块中。SLP向量化算法可以发掘基本块内的并行性。由于基本块之间将会涉及到大量的数据重用,当连续的多个基本块都被向量化时,仅考虑基本块内的向量化难以有效利用可重用数据。提出跨基本块向量化指令选择方法来综合考虑基本块内与基本块间的语句关系,采用动态规划的方式确定收益较大的向量化策略,从而能够提升所生成代码的性能。实验结果表明,与基本块内的向量化方法相比,跨基本块向量化指令选择方法令测试程序性能平均提升20%。 展开更多
关键词 跨基本块 SIMD 指令选择 代价模型
下载PDF
GISEES:面向嵌入式系统的扩展指令集自动产生方法 被引量:2
7
作者 陈虎 陈书明 +2 位作者 陈胜刚 谷会涛 陈小文 《电子学报》 EI CAS CSCD 北大核心 2011年第9期2026-2033,共8页
面向应用的指令集处理器通过增加扩展指令可有效提升处理器的性能,满足上市时间要求.然而为嵌入式系统定制扩展指令需解决以下3个问题:设计空间随应用复杂度的增加指数增加,有限的片上资源限制了扩展指令的数量和复杂度,现有指令集扩展... 面向应用的指令集处理器通过增加扩展指令可有效提升处理器的性能,满足上市时间要求.然而为嵌入式系统定制扩展指令需解决以下3个问题:设计空间随应用复杂度的增加指数增加,有限的片上资源限制了扩展指令的数量和复杂度,现有指令集扩展算法复杂度高难以在嵌入式系统上运行.本文提出了一种快速的指令集扩展方法GISEES.该方法以应用的典型操作为中心产生扩展指令以裁剪了设计空间,并采用基于最大公共等价子串的资源共享策略减少资源开销和插入的多路选择器的数量.实验结果表明,该方法具有线性复杂度,可产生效率更高的扩展指令,更适合为嵌入式系统定制高效的扩展指令. 展开更多
关键词 扩展指令 指令识别 指令选择 资源共享
下载PDF
可重构指令集处理器的代码优化生成算法研究 被引量:1
8
作者 张惠臻 王超 +1 位作者 李曦 周学海 《计算机研究与发展》 EI CSCD 北大核心 2012年第9期2018-2026,共9页
可重构指令集处理器能够适应多变的计算任务在性能和灵活性两方面的要求,而传统的编译后端技术无法为其生成高效的可执行代码,需要有新的代码生成方法.针对传统编译后端代码生成三阶段方法进行扩展的代码混合优化生成算法正是这样一种方... 可重构指令集处理器能够适应多变的计算任务在性能和灵活性两方面的要求,而传统的编译后端技术无法为其生成高效的可执行代码,需要有新的代码生成方法.针对传统编译后端代码生成三阶段方法进行扩展的代码混合优化生成算法正是这样一种方法.该算法很大程度地复用了原有的三阶段代码生成过程,同时针对可重构指令集具有动态性的特点,根据系统硬件资源和重构配置,扩展了针对可重构指令代码生成的优化处理,从而能够获得切合可重构指令集处理器体系结构特性的可执行代码.相关实验与分析说明了该算法针对硬件重构得到的新平台所做的可重构指令代码生成是有效的,能够较好地提高应用程序在新平台上的执行性能. 展开更多
关键词 可重构指令集处理器 编译后端 代码生成 指令选择 指令调度 性能优化
下载PDF
嵌入式系统指令集检测策略
9
作者 陈俊良 鲁徐 胡瑞 《致富时代(下半月)》 2011年第2期191-191,共1页
嵌入式系统是时下各种电器操控设备和手持智能设备的核心应用架构,也是各大IT企业和数码公司重点的研究对象,而指令集兼容性问题正是嵌入式系统的重要研究方向。该文从系统背景,问题根源,指令集架构和检测策略四个方面阐述了指令集... 嵌入式系统是时下各种电器操控设备和手持智能设备的核心应用架构,也是各大IT企业和数码公司重点的研究对象,而指令集兼容性问题正是嵌入式系统的重要研究方向。该文从系统背景,问题根源,指令集架构和检测策略四个方面阐述了指令集兼容性问题的应对方法,希望能对嵌入式系统的进一步发展奠定良好的基础。 展开更多
关键词 嵌入式系统 指令 指令选择
下载PDF
可扩展处理器中最大凸自定义指令迭代识别研究
10
作者 王珊珊 刘万军 肖成龙 《计算机研究与发展》 EI CSCD 北大核心 2018年第7期1584-1596,共13页
由于可扩展处理器能够在设计周期、灵活性、性能以及功耗等方面提供良好的折中,近年来,可扩展处理器大量地在嵌入式系统和电子设备中使用.自定义指令自动识别是可扩展处理器设计的关键.针对自定义指令自动识别问题,提出并实现了从给定... 由于可扩展处理器能够在设计周期、灵活性、性能以及功耗等方面提供良好的折中,近年来,可扩展处理器大量地在嵌入式系统和电子设备中使用.自定义指令自动识别是可扩展处理器设计的关键.针对自定义指令自动识别问题,提出并实现了从给定的应用程序代码中自动识别最大凸自定义指令(maximal convex subgraphs,MCSs)的迭代设计流程.提出的设计流程解决了2个关键问题:MCSs自动枚举问题和MCSs自动选择问题.针对MCSs枚举问题,提出了一种夹心方式枚举所有候选最大凸自定义指令,该算法结合了自下而上和自顶向下方式的优点.与最新算法相比,提出的算法可以实现数量级的加速.针对MCSs选择问题,提出了一种利用候选指令之间的重叠关系建立兼容图,并应用非重叠规则来修剪大量的搜索空间的精确选择算法.实验结果表明:利用提出的精确算法,在大多数情况下可以找到用于最大化提升性能的MCSs. 展开更多
关键词 可扩展处理器 最大凸自定义指令 数据流图 自定义指令枚举 自定义指令选择
下载PDF
可扩展处理器的自定义指令自动识别综述
11
作者 肖成龙 王珊珊 +2 位作者 王心霖 林军 王晶玥 《电子学报》 EI CAS CSCD 北大核心 2020年第8期1655-1664,共10页
近年来,可扩展处理器越来越多地应用于嵌入式系统当中.在可扩展处理器周围使用自定义指令能够保证一定的灵活性,同时也能很好地满足嵌入式应用对高性能和低功耗的需求.自定义指令自动识别是可扩展处理器设计中的关键问题之一.针对可扩... 近年来,可扩展处理器越来越多地应用于嵌入式系统当中.在可扩展处理器周围使用自定义指令能够保证一定的灵活性,同时也能很好地满足嵌入式应用对高性能和低功耗的需求.自定义指令自动识别是可扩展处理器设计中的关键问题之一.针对可扩展处理器的应用领域和发展趋势,介绍近年来自定义指令自动识别的研究进展;在此基础上,对于自定义指令识别涉及的关键步骤:中间表示生成、自定义指令枚举、自定义指令选择和代码转换,分别进行总结和归纳,分析不同方法的优点和难点;按照不同应用领域,对可扩展处理器的应用进行了总结和分析;最后展望了自定义指令自动识别的未来发展趋势和研究方向. 展开更多
关键词 可扩展处理器 自定义指令识别 自定义指令枚举 自定义指令选择
下载PDF
GRU改进算法对实时策略游戏中指令类型的预测
12
作者 郭鸿村 臧兆祥 +1 位作者 张震 田佩 《电脑编程技巧与维护》 2021年第8期3-6,共4页
从人工智能技术的角度来看,实时性策略(RTS,Real-Time Strategy)游戏是最复杂和最具挑战性的领域之一。一些实时策略游戏不仅具有状态动作空间巨大、环境部分可观测和即时性的特点,而且具有稀疏决策的特征。为了解决在实时策略游戏中决... 从人工智能技术的角度来看,实时性策略(RTS,Real-Time Strategy)游戏是最复杂和最具挑战性的领域之一。一些实时策略游戏不仅具有状态动作空间巨大、环境部分可观测和即时性的特点,而且具有稀疏决策的特征。为了解决在实时策略游戏中决策比较稀疏的条件下进行指令类型的选择问题,引入了一种使用带权重的交叉熵损失函数的GRU神经网络模型。为验证所提方法的有效性,实验在游戏仿真平台上对GRU神经网络模型进行了综合评估。实验结果表明,对实时策略游戏中决策稀疏条件下的指令类型选择,改进的GRU网络模型是有效且稳定的。 展开更多
关键词 RTS游戏 AGENT软件 不平衡数据集 指令类型选择 稀疏指令
下载PDF
基于IEEE标准的IJTAG单层网络测试方法
13
作者 黄新 宋博源 +1 位作者 郭晓敏 林洁沁 《现代电子技术》 2022年第1期161-165,共5页
为利用传统JTAG接口实现对SOC内部大量特定IP测试仪器进行测试控制,提出并创新设计了一种基于传统JTAG接口的可通用、可移植的IEEE 1687标准单层网络测试方法。该方法通过结合IEEE 1149.1标准中TAP控制器结构,提出由改进TAP控制器和改... 为利用传统JTAG接口实现对SOC内部大量特定IP测试仪器进行测试控制,提出并创新设计了一种基于传统JTAG接口的可通用、可移植的IEEE 1687标准单层网络测试方法。该方法通过结合IEEE 1149.1标准中TAP控制器结构,提出由改进TAP控制器和改进IR组成IJTAG结构,实现对嵌入式仪器测试访问片内硬件通用接口的设计验证;该测试方法中涵盖了IEEE 1687标准中定义的SIB访问机制和硬件结构,通过外部测试模式选择信号对IR中内置指令进行选择,实现特定SIB打开接入对应测试仪器。该测试方法通过仿真验证了可行性,从而解决了对SOC内部各种测试仪器进行统一测试的控制网络问题,该方法支持常用测试接口标准,同时提出通用操作指令,具有较高的通用性和可移植性。 展开更多
关键词 单层网络测试 IJTAG IEEE标准 测试控制 SOC测试 内置指令选择 设计验证
下载PDF
基于LLVM编译器的节点融合优化方法 被引量:3
14
作者 胡浩 沈莉 +1 位作者 周清雷 巩令钦 《计算机科学》 CSCD 北大核心 2020年第S01期561-566,595,共7页
LLVM是以C++编写的架构编译器的框架系统,支持多后端和交叉编译,用于优化程序的编译时间、链接时间、运行时间和空闲时间。节点融合是一种简单有效的优化方法,其基本思想为将多个节点优化为一个高效的融合节点,减少诸如指令、寄存器、... LLVM是以C++编写的架构编译器的框架系统,支持多后端和交叉编译,用于优化程序的编译时间、链接时间、运行时间和空闲时间。节点融合是一种简单有效的优化方法,其基本思想为将多个节点优化为一个高效的融合节点,减少诸如指令、寄存器、时钟周期和访存等开销,以达到减少程序运行时间,提升访存效率等目的。为了提升LLVM编译器的性能,文中在LLVM编译流程的中间表示阶段和DAG合并阶段、指令选择阶段提出了节点融合优化方法。在国产平台申威处理器下,以CLANG和FLANG为编译器前端,LLVM为编译器后端,基于SPEC CPU2006测试集进行了评估,实验结果表明,节点融合优化有利于提高编译器性能和减少程序运行时间,优化后最大加速比为1.59,平均加速比为1.13。 展开更多
关键词 LLVM 节点融合 中间表示 DAG合并 指令选择 国产平台
下载PDF
2000年的厨房用具
15
作者 张健 《科技信息》 1998年第11期26-26,共1页
前不久,美国举办了一个2000年厨房用具展览,设计者对厨房用具提出了新的美学标准,呈现在人们面前的是一个全新的概念。 无门冰箱 这种冰箱两侧均开口无门,采用垂直喷气流将冰箱与室内的湿热空气隔绝。
关键词 厨房用具 2000年 美学标准 湿热空气 磁感应原理 垃圾处理机 喷气流 选择指令 切削过程 设计者
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部