期刊文献+
共找到2,484篇文章
< 1 2 125 >
每页显示 20 50 100
基于VSM的数据并行FORTRAN编译器对共享数据的处理 被引量:1
1
作者 曾丽芳 胡子昂 《计算机工程与应用》 CSCD 北大核心 1997年第7期42-46,共5页
针对虚拟共享主存的特点,本文讨论了在具有虚拟共享主存的并行计算机上设计并实现并行FORTRAN编译器的关键技术:共享数据的存储分配、共享数组的下标地址计算和过程调用中共享数据参数传递及引用3大问题。
关键词 虚拟共享主存 并行计算机 fortran编译器
下载PDF
基于软件共享存储的Co-Array Fortran编译器实现 被引量:1
2
作者 黄春 《计算机科学》 CSCD 北大核心 2012年第1期287-289,304,共4页
Co-Array Fortran(CAF)已经成为Fortran语言标准的一部分,在科学计算领域逐渐被接受。基于软件共享存储实现了一个CAF编译器,其通过直接的数组赋值实现Co-array数据通信,利用数据垫塞技术提高数据局部性,减少伪共享,优化CAF程序性能。... Co-Array Fortran(CAF)已经成为Fortran语言标准的一部分,在科学计算领域逐渐被接受。基于软件共享存储实现了一个CAF编译器,其通过直接的数组赋值实现Co-array数据通信,利用数据垫塞技术提高数据局部性,减少伪共享,优化CAF程序性能。典型科学计算程序测试表明,CAF能够获得和MPI相当的性能。 展开更多
关键词 Co-Array fortran 映像 协同数组 数据垫塞
下载PDF
MSC小巨机及其FORTRAN编译器中的标准化
3
作者 沈雁 廖瑛 《计算机工程与科学》 CSCD 1994年第4期46-52,共7页
本文分析了目前国内外标准化现状和标准化中的各种关系,结合MSC小巨机的标准化模式阐述了国际标准(ISO/IEC)、国家标准(GB)、国家军用标准(GJ8)及部颁标准的特点和不同之处,最后论述了标准与安全保密的关系。
关键词 标准化 标准 编译器 小型 巨型计算机
下载PDF
纳格资讯推出最先进的Fortran编译器NAG Fortran Builder 5.2版
4
《电子与电脑》 2010年第9期83-83,共1页
对于那些希望自己开发的Fortran程序,能够同时具备速度、正确性以及可移植性的科学家、计量分析师与研究人员们,现在可以自英商纳格资讯公司取得具有全世界最佳调试能力的Fortran编译器Fortran Builder 5.2最新版。
关键词 fortran编译器 BUILDER 资讯 NAG fortran程序 可移植性 研究人员 计量分析
下载PDF
PGI和英伟达合作开发CUDA Fortran编译器
5
《电子与电脑》 2009年第7期98-98,共1页
意法半导体全资子公司.世界领先的高性能计算机(HPC)编译器提供商Portland Group宣布与英伟达公司(NVIDIA)达成合作开发协议,两家公司计划为CUDA图形处理器(GPU)开发新的Fortran语言编译器。
关键词 fortran编译器 合作开发 fortran语言 高性能计算机 意法半导体 图形处理器 提供商 子公司
下载PDF
Co-array Fortran编译器的设计与实现 被引量:1
6
作者 唐沛蓉 黄春 +1 位作者 杨学军 王桂彬 《计算机工程》 CAS CSCD 北大核心 2007年第23期84-86,共3页
基于GUN Fortran编译器,设计并实现了co-array Fortran(CAF)编译器。通过源到源的转换将CAF代码转换为带有运行库调用的Fortran 90程序。典型用例的测试表明,CAF具有较好的可编程性,且CAF程序通过对数据分布的显式控制可获得比OpenMP程... 基于GUN Fortran编译器,设计并实现了co-array Fortran(CAF)编译器。通过源到源的转换将CAF代码转换为带有运行库调用的Fortran 90程序。典型用例的测试表明,CAF具有较好的可编程性,且CAF程序通过对数据分布的显式控制可获得比OpenMP程序更为高效的执行性能。 展开更多
关键词 co-array fortran 映像 源到源转换
下载PDF
编译技术与编译器设计专题前言
7
作者 冯晓兵 郝丹 +1 位作者 高耀清 左志强 《软件学报》 EI CSCD 北大核心 2024年第6期2583-2584,共2页
编译器作为重要的基础软件,是连接上层应用与底层系统的桥梁,在整个计算机系统软件栈中具有举足轻重的作用.编译技术与编译器设计,一方面作为国家亟待增强和突破的研究领域,迫切需要开展独立自主的科研与创新,另一方面一系列崭新领域的... 编译器作为重要的基础软件,是连接上层应用与底层系统的桥梁,在整个计算机系统软件栈中具有举足轻重的作用.编译技术与编译器设计,一方面作为国家亟待增强和突破的研究领域,迫切需要开展独立自主的科研与创新,另一方面一系列崭新领域的应用需求(如人工智能、异构计算、云计算等)也不断催生新的编译技术创新与突破.因此,编译技术与编译器设计一直是国内外学者的关注点和研究热点.本专题聚焦编译优化、编译器设计、以及编译器可信与安全等基础性问题,重点关注在相关研究领域具有创新性、突破性的高水平研究成果,探讨编译基础理论、关键技术以及编译器研发过程中关于系统设计原理、架构、经验等方面的实质性进展,及其在我国基础软件产业中的应用前景. 展开更多
关键词 编译技术 计算机系统软件 编译器 人工智能 编译优化 异构计算 云计算 软件产业
下载PDF
深度学习编译器模型训练负载均衡优化方法
8
作者 王丽 高开 +3 位作者 赵雅倩 李仁刚 曹芳 郭振华 《计算机科学与探索》 CSCD 北大核心 2024年第1期111-126,共16页
对于计算密集型的人工智能(AI)训练应用,其计算图网络结构更加复杂,数据加载、计算图的任务划分以及任务调度的负载均衡性都会成为影响计算性能的关键因素。为了使深度学习编译器中模型训练应用的任务调度达到负载均衡的状态,提出了三... 对于计算密集型的人工智能(AI)训练应用,其计算图网络结构更加复杂,数据加载、计算图的任务划分以及任务调度的负载均衡性都会成为影响计算性能的关键因素。为了使深度学习编译器中模型训练应用的任务调度达到负载均衡的状态,提出了三种计算图负载均衡优化方法:第一,通过自动建立数据加载与模型训练的高效流水实现中央处理器和后端计算设备的负载均衡,提高了系统整体能效;第二,通过计算图的分层优化技术,实现计算图在后端设备执行调度时的负载均衡;最后,通过自动建立层间的高效流水提高后端设备的资源利用率。实验结果表明,计算图负载均衡优化方法实现了训练任务到底层硬件设备自动映射过程中系统的负载均衡,与Tensorflow、nGraph等传统的深度学习框架和编译器相比,在不同模型训练中通过任务调度负载均衡优化技术分别获得了2%~10%的性能提升,同时能够使系统整体的能耗降低10%以上。 展开更多
关键词 模型训练 编译器优化 负载均衡 分层调度 自动流水
下载PDF
面向龙芯处理器的一种CompCert可信编译器重定向实现
9
作者 胡少儒 王隽伟 王生原 《计算机科学》 CSCD 北大核心 2024年第S02期747-755,共9页
CompCert是著名的C语言可信编译器,它借助于交互式定理证明工具Coq实现,能够确保生成的目标汇编代码保持源代码的语义,具有极高的可信度,近年来被广泛应用于学术界和工业界的许多安全攸关任务的研发工作中。CompCert编译器的当前版本支... CompCert是著名的C语言可信编译器,它借助于交互式定理证明工具Coq实现,能够确保生成的目标汇编代码保持源代码的语义,具有极高的可信度,近年来被广泛应用于学术界和工业界的许多安全攸关任务的研发工作中。CompCert编译器的当前版本支持多种目标机结构,然而目前尚缺乏针对国内自主研发处理器的版本,如龙芯(Loongson)处理器体系结构(LoongArch)。将CompCert重定向到龙芯等国产处理器,对我国安全攸关软件领域的发展大有裨益。本文对CompCert编译器的设计理念、框架结构和龙芯架构的特点进行分析,改造CompCert编译器的后端,使其可以生成能在龙芯处理器上运行的汇编代码,并细致阐述不同模块的工作内容。重定向到龙芯处理器的CompCert编译器具有接近GCC-O1的性能,可满足许多场景的使用。 展开更多
关键词 CompCert 编译器 编译器重定向 龙芯架构 形式化验证的编译器 COQ
下载PDF
面向国产高性能加速器的LLVM编译器设计及优化
10
作者 宋强 唐俊龙 +4 位作者 陈照云 时洋 谭期轩 肖紫阳 邹望辉 《计算机工程》 CAS CSCD 北大核心 2024年第4期321-331,共11页
国防科技大学自主研制的高性能加速器采用中央处理器(CPU)+通用数字信号处理器(GPDSP)的片上异构融合架构,使用超长指令集(VLIW)+单指令多数据流(SIMD)的向量化结构的GPDSP是峰值性能主要支撑的加速核。主流编译器在密集的数据计算指令... 国防科技大学自主研制的高性能加速器采用中央处理器(CPU)+通用数字信号处理器(GPDSP)的片上异构融合架构,使用超长指令集(VLIW)+单指令多数据流(SIMD)的向量化结构的GPDSP是峰值性能主要支撑的加速核。主流编译器在密集的数据计算指令排布、为指令静态分配硬件执行单元、GPDSP特有的向量指令等方面不能很好地支持高性能加速器。基于低级虚拟器(LLVM)编译框架,在前寄存器分配调度阶段,结合峰值寄存器压力感知方法(PERP)、蚁群优化(ACO)算法与GPDSP结构特点,优化代价模型,设计支持寄存器压力感知的指令调度模块;在后寄存器分配阶段提出支持静态功能单元分配的指令调度策略,通过冲突检测机制保证功能单元分配的正确性,为指令并行执行提供软件基础;在后端封装一系列丰富且规整的向量指令接口,实现对GPDSP向量指令的支持。实验结果表明,所提出的LLVM编译架构优化方法从功能和性能上实现了对GPDSP的良好支撑,GCC testsuite测试整体性能平均加速比为4.539,SPEC CPU 2017浮点测试整体性能平均加速比为4.49,SPEC CPU 2017整型测试整体性能平均加速比为3.24,使用向量接口的向量程序实现了平均97.1%的性能提升率。 展开更多
关键词 通用数字信号处理器 低级虚拟器 编译器 指令调度 向量指令接口
下载PDF
基于JSR 269的安全多方计算编译器
11
作者 刘芹 汪鹏程 +1 位作者 崔竞松 涂航 《计算机应用与软件》 北大核心 2024年第7期302-308,共7页
随着多种通用安全多方计算协议的提出,在这些协议上构建的框架、领域特定语言层出不穷,但都有着易用性差、现有编程语言难以交互等问题。因此,针对这些问题,设计一种基于JSR 269的安全多方计算编译器构建方案。该方案将经过了安全多方... 随着多种通用安全多方计算协议的提出,在这些协议上构建的框架、领域特定语言层出不穷,但都有着易用性差、现有编程语言难以交互等问题。因此,针对这些问题,设计一种基于JSR 269的安全多方计算编译器构建方案。该方案将经过了安全多方计算相关的注解标注的Java源代码,通过编译器插件编译为安全多方计算应用,并且可以和Java语言进行交互。通过实验及结果分析,该方案可保留Java语言的高级语言特性,以高度抽象的方式进行安全多方计算应用逻辑的编写。 展开更多
关键词 JSR 269 安全多方计算 编译器
下载PDF
基于存储器编译器的敏捷生成技术研究
12
作者 刘孙辰星 蔡浩 《集成电路与嵌入式系统》 2024年第1期19-24,共6页
磁随机存储器作为一种新型非易失性存储,因其优良的读写速度与耐久度特性,在嵌入式存储领域具有广阔的应用前景。然而,由于磁随机存储器的定制化设计通常需要数月完成,具有较长的设计周期,这与片上系统较快的设计迭代需求存在一定矛盾... 磁随机存储器作为一种新型非易失性存储,因其优良的读写速度与耐久度特性,在嵌入式存储领域具有广阔的应用前景。然而,由于磁随机存储器的定制化设计通常需要数月完成,具有较长的设计周期,这与片上系统较快的设计迭代需求存在一定矛盾。存储器编译器作为一种快速生成存储器设计的工具,是解决这一矛盾的有效手段。本文从磁随机存储器的全定制设计流程出发,同时对各类存储器编译器的研究现状开展调研,总结了目前存储器编译器工作的现状与挑战,最终讨论了磁随机存储器编译器的设计方法学。 展开更多
关键词 存储器编译器 磁随机存储器 电子设计自动化 敏捷设计
下载PDF
车磨复合数控系统的编译器与衔接速度算法的研究与实现
13
作者 刘松良 《机电产品开发与创新》 2024年第2期189-192,共4页
针对复合型车磨数控系统的特点,本文介绍的编译器在传统NC程序编译的基础上增加了编译缓冲、指令分流、并行编译、构建编译、语句编译等功能,有效地提高了NC程序的编译效率;同时,本文阐述了车磨复合数控系统在切削加工过程中,采用高速... 针对复合型车磨数控系统的特点,本文介绍的编译器在传统NC程序编译的基础上增加了编译缓冲、指令分流、并行编译、构建编译、语句编译等功能,有效地提高了NC程序的编译效率;同时,本文阐述了车磨复合数控系统在切削加工过程中,采用高速衔接方式时编译器的衔接速度算法,与传统的连续平滑过渡模式或减速到零模式相比,该算法极大地提高了系统的加工效率和精度。试验结果表明,该编译器具有良好的可移植性和较强的译码功能。 展开更多
关键词 车磨复合数控系统 NC程序 编译器 衔接速度算法 译码
下载PDF
结构化FORTRAN语言形式及功能扩展——编译器CHTRF与CC语言 被引量:3
14
作者 朱靖华 薛惠钰 《苏州大学学报(自然科学版)》 CAS 1990年第4期477-481,共5页
本文应用“自展式”技术,部分地吸收了DITSF、COBOL、ALGOL、PASCAL等语言特长,通过前处理编译程序CHTRF,定义了同FORTRAN77兼容的CC语言。
关键词 fortran语言 CC语言 编译器
下载PDF
动态模糊逻辑程序设计语言编译器的实现
15
作者 赵小芳 窦全胜 姜云霄 《吉林大学学报(信息科学版)》 CAS 2023年第3期503-511,共9页
动态模糊逻辑程序设计语言的独特优势在于可以处理动态模糊数据,但现存的编译器很难有效解析动态模糊数据。针对此问题,通过扩展监督命令程序结构,引入对动态模糊性的形式化描述,设计一种新型的动态模糊逻辑程序设计语言编译器。通过实... 动态模糊逻辑程序设计语言的独特优势在于可以处理动态模糊数据,但现存的编译器很难有效解析动态模糊数据。针对此问题,通过扩展监督命令程序结构,引入对动态模糊性的形式化描述,设计一种新型的动态模糊逻辑程序设计语言编译器。通过实例验证,该编译器能正确解析动态模糊数据,降低了动态模糊逻辑程序调试难度,提高了动态模糊逻辑程序开发效率。 展开更多
关键词 编译器 动态模糊逻辑程序设计语言 动态模糊算子 词法分析器 语法分析器
下载PDF
NDP Fortran-386编译器简介
16
作者 白人海 《黑龙江气象》 1994年第4期F003-F003,共1页
NDPFortran-386编译器简介白人海微型计算机技术的发展使32位386微型计算机的性能指标已达到了小型计算机的水平。386微机在我省也开始普遍为广大台站所采用。但是专门为386开发的软件相对较少,以至无法充分... NDPFortran-386编译器简介白人海微型计算机技术的发展使32位386微型计算机的性能指标已达到了小型计算机的水平。386微机在我省也开始普遍为广大台站所采用。但是专门为386开发的软件相对较少,以至无法充分发挥它的卓越性能,只能降级为快速2... 展开更多
关键词 编译器 微机 编译程序
下载PDF
基于Fortran语言的地球外辐射带电子三维数据同化建模
17
作者 罗陶荣 曹兴 +4 位作者 马新 付松 倪彬彬 王晓宇 雷源 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2024年第4期1285-1298,共14页
开发地球电子辐射带的数据同化模型,对于理解辐射带电子的动态演化过程和辐射带空间天气预报具有重要意义.结合范阿伦卫星的辐射带电子观测数据和外辐射带三维扩散模型,采用卡尔曼滤波算法,本文开发了基于Fortran语言的外辐射带电子三... 开发地球电子辐射带的数据同化模型,对于理解辐射带电子的动态演化过程和辐射带空间天气预报具有重要意义.结合范阿伦卫星的辐射带电子观测数据和外辐射带三维扩散模型,采用卡尔曼滤波算法,本文开发了基于Fortran语言的外辐射带电子三维数据同化模型(Three-dimensional Data Assimilative Model of Outer Radiation belt Electrons,简称TDAMORE),实现对L^(*)=3~7、能量范围为0.1~5 MeV、投掷角范围为5°~90°的外辐射带电子时空变化过程的三维重构.通过对2018年8月期间外辐射带电子通量演化过程的重构,证实TDAMORE模型可以较好地重现不同能量和不同投掷角电子通量在磁暴前后的演化特征.通过分析电子通量的观测和同化结果之间的相关系数、平均误差、平均绝对误差和均方误差,发现对于能量低于4 MeV的电子,观测与同化结果之间的相关系数基本大于0.8且误差相对较低.而对于更高能量的电子,观测与同化结果之间的误差相对较高,这可能是同化模型忽略了电磁离子回旋波对电子的散射损失导致的. 展开更多
关键词 地球外辐射带 电子通量 三维数据同化 范阿伦卫星 fortran语言
下载PDF
Fortran内存泄漏静态检测方法研究
18
作者 罗坤 金大海 宫云战 《小型微型计算机系统》 CSCD 北大核心 2024年第7期1778-1786,共9页
内存泄漏在没有垃圾回收机制的语言中是常见的问题,虽然Fortran95引入ALLOCATABLE数组解决了部分泄漏问题,但是通过指针申请内存资源仍然会造成泄漏,现有研究对Fortran内存泄漏的检测流程适配度不高且面向Fortran内存状态分析的效率和... 内存泄漏在没有垃圾回收机制的语言中是常见的问题,虽然Fortran95引入ALLOCATABLE数组解决了部分泄漏问题,但是通过指针申请内存资源仍然会造成泄漏,现有研究对Fortran内存泄漏的检测流程适配度不高且面向Fortran内存状态分析的效率和精确度上仍存在优化空间.针对这一问题,本文提出了一种面向Fortran指针引发的内存泄漏静态检测方法.首先引入指针引用控制流图(PR-CFG,Pointer Reference-Control Flow Graph)来精简程序模型,并符号化程序节点的内存状态信息,依据数据流生成路径敏感的符号化函数摘要作用于过程间分析,最终通过PR-CFG节点上由抽象内存状态计算得到的内存状态集进行故障模式状态机的状态转化来实现内存泄漏的检测.实验表明,本方法提高了Fortran指针引发内存泄漏的检测精度和效率,降低了检测的误报率. 展开更多
关键词 fortran指针 内存泄漏检测 PR-CFG 符号化函数摘要 抽象内存状态计算
下载PDF
AutoConfig:面向深度学习编译优化的自动配置机制
19
作者 张洪滨 周旭林 +2 位作者 邢明杰 武延军 赵琛 《软件学报》 EI CSCD 北大核心 2024年第6期2668-2686,共19页
随着深度学习模型和硬件架构的快速发展,深度学习编译器已经被广泛应用.目前,深度学习模型的编译优化和调优的方法主要依赖基于高性能算子库的手动调优和基于搜索的自动调优策略.然而,面对多变的目标算子和多种硬件平台的适配需求,高性... 随着深度学习模型和硬件架构的快速发展,深度学习编译器已经被广泛应用.目前,深度学习模型的编译优化和调优的方法主要依赖基于高性能算子库的手动调优和基于搜索的自动调优策略.然而,面对多变的目标算子和多种硬件平台的适配需求,高性能算子库往往需要为各种架构进行多次重复实现.此外,现有的自动调优方案也面临着搜索开销大和缺乏可解释性的挑战.为了解决上述问题,提出AutoConfig,一种面向深度学习编译优化的自动配置机制.针对不同的深度学习计算负载和特定的硬件平台,AutoConfig可以构建具备可解释性的优化算法分析模型,采用静态信息提取和动态开销测量的方法进行综合分析,并基于分析结果利用可配置的代码生成技术自动完成算法选择和调优.AutoConfig创新性地将优化分析模型与可配置的代码生成策略相结合,不仅能保证性能加速效果,还能减少重复开发的开销,同时可以简化调优过程.在此基础上,进一步将AutoConfig集成到深度学习编译器Buddy Compiler中,对矩阵乘法和卷积的多种优化算法建立分析模型,并将自动配置的代码生成策略应用在多种SIMD硬件平台上进行评估.实验结果可验证AutoConfig在代码生成策略中完成参数配置和算法选择的有效性.与经过手动或自动优化的代码相比,由AutoConfig生成的代码可达到相似的执行性能,并且无需承担手动调优的重复实现开销和自动调优的搜索开销. 展开更多
关键词 深度学习编译器 编译优化 代码生成 自动配置机制
下载PDF
基于查询编译的SQL执行技术研究进展
20
作者 潘青峰 徐辰 《计算机研究与发展》 EI CSCD 北大核心 2024年第7期1754-1770,共17页
信息系统通常会借助数据管理系统来进行数据管理,其中SQL凭借良好的易用性和灵活性一直作为数据管理的主流查询语言,用户将编写的SQL语句交由数据管理系统执行后便可得到查询结果.执行模型的高效与否决定了系统能否快速响应用户的查询请... 信息系统通常会借助数据管理系统来进行数据管理,其中SQL凭借良好的易用性和灵活性一直作为数据管理的主流查询语言,用户将编写的SQL语句交由数据管理系统执行后便可得到查询结果.执行模型的高效与否决定了系统能否快速响应用户的查询请求,现有执行模型主要采用解释执行和编译执行2种方式.解释执行具有良好的拓展性、可维护性等因而被大多数系统采用.不同于解释执行,编译执行为原本需要解释执行的查询生成高效的定制化代码来加速查询,带来的显著性能提升吸引了一众数据管理系统开始实现相应技术.然而,如何针对查询生成其对应的定制化代码是一个复杂的过程,在实现时需要考虑诸多方面,甚至在某些情况下,采用编译执行的查询性能可能还不及传统的火山模型.从概念、技术等角度系统地综述了编译执行技术的研究进展.首先,概述了编译执行的基本概念,对相关术语和背景知识进行了介绍;其次,分别从中间代码生成、中间表示、机器码生成与运行3个角度介绍了相关技术;最后,结合当前数据管理系统的研究趋势以及近期研究工作展望了编译执行未来的发展方向. 展开更多
关键词 数据管理系统 查询执行 代码生成 编译器 即时编译
下载PDF
上一页 1 2 125 下一页 到第
使用帮助 返回顶部