期刊文献+
共找到331篇文章
< 1 2 17 >
每页显示 20 50 100
Shrek:a dynamic object-oriented programming language 被引量:1
1
作者 曹璟 徐宝文 周毓明 《Journal of Southeast University(English Edition)》 EI CAS 2009年第1期31-35,共5页
From a perspective of theoretical study, there are some faults in the models of the existing object-oriented programming languages. For example, C# does not support metaclasses, the primitive types of Java and C# are ... From a perspective of theoretical study, there are some faults in the models of the existing object-oriented programming languages. For example, C# does not support metaclasses, the primitive types of Java and C# are not objects, etc. So, this paper designs a programming language, Shrek, which integrates many language features and constructions in a compact and consistent model. The Shrek language is a class-based purely object-oriented language. It has a dynamical strong type system, and adopts a single-inheritance mechanism with Mixin as its complement. It has a consistent class instantiation and inheritance structure, and the ability of intercessive structural computational reflection, which enables it to support safe metaclass programming. It also supports multi-thread programming and automatic garbage collection, and enforces its expressive power by adopting a native method mechanism. The prototype system of the Shrek language is implemented and anticipated design goals are achieved. 展开更多
关键词 dynamic typing metaclass programming computational reflection native method object-oriented programming language
下载PDF
Object-oriented software tools for parallel PDE solvers
2
作者 Michael Thune(Uppsala University, Dept. of Scientific Computing, Box 12O, S-751 04, Uppsala, Sweden.E-mail: ndchael@tdb.uu.se) 《Wuhan University Journal of Natural Sciences》 CAS 1996年第Z1期420-429,共10页
An object-oriented approach is taken to the problem of formulating portable, easy-to-modify PDE solvers for realistic problems in three space dimensions. The resulting software library, Cogito, contains tools for writ... An object-oriented approach is taken to the problem of formulating portable, easy-to-modify PDE solvers for realistic problems in three space dimensions. The resulting software library, Cogito, contains tools for writing programs to be executed on MIMD computers with distributed memory. Difference methods on composite, structured grids are supported. Most of the Cogito classes have been implemented in Fortran 77, in such a way that the object-oriented design is visible. With respect to parallel performance, these tools yield code that is comparable to parallel solvers written in plain Fortran 77. The resulting programs are can be executed without modification on a large number of multicomputer platforms, and also on serial computers. The uppermost level of abstraction in Cogito concerns the problem of decoupling the numerical method from the PDE problem. The validity of these tools has been preliminarily demonstrated with a C++ implementation for one-dimensional problems. 展开更多
关键词 object-oriented software tool parallel computer PDE composite grid difference method
下载PDF
A High Speed Signal Processing Machine -Its Architecture, Language and Compiler
3
作者 Wang Yufei and Yu ShiqiBeijing Institute of Data Processing Technology, P.O.Box 3927, Beijing 100039, China 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 1991年第1期119-128,共10页
A systolic array architecture computer (FXCQ) has been designed for signal processing. R can handle floating point data at very high speed. It is composed of 16 processing cells and a cache that are connected linearly... A systolic array architecture computer (FXCQ) has been designed for signal processing. R can handle floating point data at very high speed. It is composed of 16 processing cells and a cache that are connected linearly and form a ring structure. All processing cells are identical and programmable. Each processing cell has the peak performance of 20 million floating-point operations per second (20MFLOPS). The machine therefore has a peak performance of 320 M FLOPS. It is integrated as an attached processor into a host system through VME bus interface. Programs for FXCQ are written in a high-level language -B language, which is supported by a parallel optimizing compiler. This paper describes the architecture of FXCQ, B language and its compiler. 展开更多
关键词 parallel processing Systolic array processor parallel language Compiler.
下载PDF
An Object-Oriented Robot Programming and Simulation System
4
作者 赵春霞 付宜立 +2 位作者 王树国 吴菁 蔡鹤皋 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 1995年第4期38-41,共4页
AnObject-OrientedRobotProgrammingandSimulationSystemZHAOChunxia;FUYili;WANGShuguo;WUJing;CAIHegao赵春霞,付宜立,王树国... AnObject-OrientedRobotProgrammingandSimulationSystemZHAOChunxia;FUYili;WANGShuguo;WUJing;CAIHegao赵春霞,付宜立,王树国,吴菁,蔡鹤皋(RobotRese... 展开更多
关键词 ss:object-oriented PROGRAMMING language simulation OFF-LINE PROGRAMMING computer GRAPHICS
下载PDF
Automatic Generation of UML Class Diagrams for Object-oriented Design and Programing Course
5
作者 Chunyan Ma Jing Chen +1 位作者 Zheng Chang Jiangbin Zheng 《计算机教育》 2021年第12期157-165,共9页
UML Class diagram generation from textual requirements is an important task in object-oriented design and programing course.This study proposes a method for automatically generating class diagrams from Chinese textual... UML Class diagram generation from textual requirements is an important task in object-oriented design and programing course.This study proposes a method for automatically generating class diagrams from Chinese textual requirements on the basis of Natural Language Processing(NLP)and mapping rules for sentence pattern matching.First,classes are identified through entity recognition rules and candidate class pruning rules using NLP from requirements.Second,class attributes and relationships between classes are extracted using mapping rules for sentence pattern matching on the basis of NLP.Third,we developed an assistant tool integrated into a precision micro classroom system for automatic generation of class diagram,to effectively assist the teaching of object-oriented design and programing course.Results are evaluated with precision,accuracy and recall from eight requirements of object-oriented design and programing course using truth values created by teachers.Our research should benefit beginners of object-oriented design and programing course,who may be students or software developers.It helps them to create correct domain models represented in the UML class diagram. 展开更多
关键词 UML class diagram Natural language Processing(NLP) object-oriented design and programming course automatic generation
下载PDF
Object-Oriented Finite Element Analysis of Metal Working Processes
6
作者 Surendra Kumar 《Journal of Software Engineering and Applications》 2010年第6期572-579,共8页
Recently an object-oriented approach has been applied in the fields of finite element analysis with a view to treating the various complexities within these. It has been demonstrated that finite element software desig... Recently an object-oriented approach has been applied in the fields of finite element analysis with a view to treating the various complexities within these. It has been demonstrated that finite element software designed using an object-oriented approach can be significantly more robust than traditional codes. This paper describes a special kind of implementation of object-oriented programming which is rather hybrid in nature, in the development of a finite element code for engineering analysis of metal working problems using C++, and discusses the advantages of this approach. 展开更多
关键词 FINITE Element Method Data ABSTRACTION Techniques object-oriented PROGRAMMING C++ PROGRAMMING language METAL Working
下载PDF
对言的元语表达式“一……一” 被引量:2
7
作者 沈家煊 《常熟理工学院学报》 2024年第3期1-12,共12页
基于对话的“对言语法”以对言格式为语言组织结构的主干。对言语法和对言格式消解主语和谓语的异质对立,视二者为对等项。对言格式是“平行对”和“链接对”的纵横交织,以“二元倚变”和“二元共享”为逻辑要素。本文有两个相关联的重... 基于对话的“对言语法”以对言格式为语言组织结构的主干。对言语法和对言格式消解主语和谓语的异质对立,视二者为对等项。对言格式是“平行对”和“链接对”的纵横交织,以“二元倚变”和“二元共享”为逻辑要素。本文有两个相关联的重点:一是建议把“一……一”式以及延伸的“一……一……一”式当作对言的“元语”表达式,理由是它不仅具有广泛的代表性,而且象征二项呼应互文的对等性,便于对言格式的符号化、数字化;二是通过“一……一”式和英语“one……the other”式的比较,说明“一种语言一种思维习惯”。 展开更多
关键词 对言格式 “一……一”式 元语表达式 思维习惯
下载PDF
“大语法”关照下汉外词汇比较 被引量:2
8
作者 沈家煊 《辞书研究》 2024年第1期1-13,I0001,共14页
汉语“大语法”超越主谓结构,以对话为基础,以对言格式为主干。韵律和词汇都是大语法的有机组成部分。词汇的汉外比较有利于真切认识汉语的词汇特色和构造运作之道。与英语相比较,逻辑要素在汉语里的习惯表达倾向于成对的语词,这一比较... 汉语“大语法”超越主谓结构,以对话为基础,以对言格式为主干。韵律和词汇都是大语法的有机组成部分。词汇的汉外比较有利于真切认识汉语的词汇特色和构造运作之道。与英语相比较,逻辑要素在汉语里的习惯表达倾向于成对的语词,这一比较更能揭示汉语大语法“对言对思”的特性。“语义的不确定性”是语言的正常特性,符合语言交际和语言演化的一般规律。从词汇意义和语法意义的“不确定性”出发,确立汉语词汇和语法共同的“名动包含”的格局,这就开启了把名词和动词视为“对等项”的可能,为汉语大语法超越主谓结构创造了学理条件。确立汉语“名动包含”格局还有助于我们从汉语出发反观印欧语,从而加深人们对人类语言本质的认识。 展开更多
关键词 大语法 词汇汉外比较 对言格式 语义不确定性 名动包含
下载PDF
从基础智能到通用智能:基于大模型的GenAI和AGI之现状与展望 被引量:7
9
作者 缪青海 王兴霞 +10 位作者 杨静 赵勇 王雨桐 陈圆圆 田永林 俞怡 林懿伦 鄢然 马嘉琪 那晓翔 王飞跃 《自动化学报》 EI CAS CSCD 北大核心 2024年第4期674-687,共14页
本文对生成式AI(Generative artificial intelligence,GenAI)的国内外发展现状进行了概述,重点分析了中美之间在算力、数据、算法、生态等方面存在的差距.为改变我国在生成式AI领域的落后现状,提出高能效算力建设、联邦数据、专业领域... 本文对生成式AI(Generative artificial intelligence,GenAI)的国内外发展现状进行了概述,重点分析了中美之间在算力、数据、算法、生态等方面存在的差距.为改变我国在生成式AI领域的落后现状,提出高能效算力建设、联邦数据、专业领域模型、基于TAO的联邦生态等应对策略,对大模型时代AI安全治理进行了论述,对通用人工智能(Artificial general intelligence,AGI)的未来发展进行了展望. 展开更多
关键词 生成式人工智能 大语言模型 基础模型 通用人工智能 基础智能 平行智能 SORA
下载PDF
平行药物系统:基于大语言模型和三类人的框架与方法 被引量:4
10
作者 林飞 王飞跃 +4 位作者 田永林 丁显廷 倪清桦 王静 申乐 《智能科学与技术学报》 CSCD 2024年第1期88-99,共12页
近年来,随着物联网、大语言模型、多模态交互等新一代人工智能技术的迅猛发展,传统的药物研发、生产加工等过程面临着智能化转型的挑战。为此,以平行智能为理念,基于ACP方法和大语言模型提出了虚实交互的平行药物系统,并将三类人(数字... 近年来,随着物联网、大语言模型、多模态交互等新一代人工智能技术的迅猛发展,传统的药物研发、生产加工等过程面临着智能化转型的挑战。为此,以平行智能为理念,基于ACP方法和大语言模型提出了虚实交互的平行药物系统,并将三类人(数字人、机器人和生物人)的概念引入系统中,详细阐述了该系统的理论框架与构建方法。平行药物系统涵盖医药产业的全流程,药物研发阶段考虑了药物发现、实验室研究、临床试验等过程;药物生产加工阶段考虑了制药工厂运行、系统分析预测等方面;药物医疗保健阶段考虑了个性化用药咨询、增强现实用药指导、隐私安全等内容。平行药物系统打造了一个数字化的“药物空间”,旨在建立药物系统的新范式,推动智能化药物的革命。 展开更多
关键词 平行智能 ACP方法 大语言模型 三类人 平行药物系统 药物研发 药物生产加工 药物医疗保健
下载PDF
面向国产异构众核系统的Parallel C语言设计与实现 被引量:10
11
作者 何王全 刘勇 +2 位作者 方燕飞 魏迪 漆锋滨 《软件学报》 EI CSCD 北大核心 2017年第4期764-785,共22页
异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战.因此,研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、... 异构众核架构具有超高的性能功耗比,已成为超级计算机体系结构的重要发展方向.但众核系统更为复杂的并行层次和存储层次,给编程和优化带来了极大的挑战.因此,研究面向众核系统的并行编程技术,对于降低国产众核系统并行应用的编程难度、提升并行程序的性能都具有重要的意义.提出统一架构的多模式并行编程模型,包括异构融合的加速运算模型和按同构方式编程的自主运算模型,根据编程模型设计了Parallel C语言,能够有效地描述国产众核系统的异构并行性.与其他众核系统上MPI+X的使用模式相比,编程和系统优化都具有全局视角,在多级局部性描述、单边消息、兼容已有多核应用等方面具有特色;基于Open64构建了Parallel C编译系统,全面支持加速运算模型和自主运算模型,提出并实现了数据布局与自动DMA、编译指导的线程代理和拓扑位置感知的集合通信等优化.Micro Benchmark和实际应用在神威太湖之光计算机系统上的测试数据结果表明:Parallel C语言和编译系统具有良好的性能和可扩展性,能够有效支撑大型应用. 展开更多
关键词 异构众核 编程模型 并行语言 parallel C 编译器 消息传递
下载PDF
OrthoGPT:面向精准诊疗的多模态骨科大模型
12
作者 张志成 王静 +4 位作者 张阳 田永林 张濛濛 吕宜生 王飞跃 《智能科学与技术学报》 CSCD 2024年第3期338-346,共9页
针对骨科疾病诊疗面临的非医院场景下应急处理困难、手术规划复杂且风险高以及康复治疗个性化需求强等诸多挑战,提出了面向骨科精准诊疗的多模态骨科大模型——OrthoGPT。该模型充分利用多模态特征对齐与融合技术和多场景个性化诊疗方... 针对骨科疾病诊疗面临的非医院场景下应急处理困难、手术规划复杂且风险高以及康复治疗个性化需求强等诸多挑战,提出了面向骨科精准诊疗的多模态骨科大模型——OrthoGPT。该模型充分利用多模态特征对齐与融合技术和多场景个性化诊疗方案生成技术,结合基于平行理论的骨科世界模型和多Agent智能交互方法,为非医院场景提供初步诊断和应急指导,模拟和预测个性化术后治疗效果,辅助医生进行手术规划,并提供个性化康复治疗建议。该模型旨在探讨OrthoGPT在骨科疾病诊疗中的应用潜力,以期提高诊疗效率和提升效果,改善患者体验,推动人工智能技术在骨科疾病诊疗的发展和应用。 展开更多
关键词 骨科 大模型 智慧医疗 平行医疗
下载PDF
平行旅游:基础智能驱动的智慧出游服务
13
作者 张腾超 田永林 +7 位作者 林飞 倪清桦 宋平 戴星原 李娟娟 伍乃騏 Timothy J.Lee 王飞跃 《智能科学与技术学报》 CSCD 2024年第2期164-178,共15页
旅游作为一种满足人们对不同生活体验和知识需求的活动,对经济、文化等领域都产生了深远影响。随着物联网、多模态大语言模型等技术的迅速发展,传统的旅游业难以满足人们智能化以及个性化的旅游需求。为此,以平行智能为理念,基于ACP方... 旅游作为一种满足人们对不同生活体验和知识需求的活动,对经济、文化等领域都产生了深远影响。随着物联网、多模态大语言模型等技术的迅速发展,传统的旅游业难以满足人们智能化以及个性化的旅游需求。为此,以平行智能为理念,基于ACP方法与多模态大语言模型提出了虚实交互的个性化旅游服务系统,通过构建旅游大模型,并结合检索增强生成方法和多智能体协作系统,打造个性化旅游服务的新范式。此外,探讨了平行旅游的应用生态,从“行”“住”“食”“衣”4个方面对整个旅游生态进行拓展,分析了其他行业与个性化旅游服务的融合。平行旅游将为旅游行服务业的发展带来全新可能。 展开更多
关键词 平行旅游 平行系统 ACP方法 多模态大语言模型 检索增强生成 元宇宙
下载PDF
基于伪触发词的并行预测篇章级事件抽取方法
14
作者 秦海涛 线岩团 +1 位作者 相艳 黄于欣 《电子技术应用》 2024年第4期67-74,共8页
篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能按照预定义的... 篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能按照预定义的事件顺序及预定义的角色顺序预测事件论元,使得先抽取的事件并没有考虑到后面抽取的事件。针对以上问题提出一种多任务联合的并行预测事件抽取框架。首先,使用预训练语言模型作为文档句子的编码器,检测文档中存在的事件类型,并使用结构化自注意力机制获取伪触发词特征,预测每种事件类型的事件数量;然后将伪触发词特征与候选论元特征进行交互,并行预测每个事件对应的事件论元,在大幅缩减模型训练时间的同时获得与基线模型相比更好的性能。最终事件抽取结果F1值为78%,事件类型检测子任务F1值为98.7%,事件数量预测子任务F1值为90.1%,实体识别子任务F1值为90.3%。 展开更多
关键词 篇章级事件抽取 多任务联合 预训练语言模型 结构化自注意力机制 并行预测
下载PDF
轻量级卷积神经网络的硬件加速方法
15
作者 吕文浩 支小莉 童维勤 《计算机工程与设计》 北大核心 2024年第3期699-706,共8页
为提升轻量级卷积神经网络在硬件平台的资源利用效率和推理速度,基于软硬件协同优化的思想,提出一种面向FPGA平台的轻量级卷积神经网络加速器,并针对网络结构的特性设计专门的硬件架构。与多级并行策略结合,设计一种统一的卷积层计算单... 为提升轻量级卷积神经网络在硬件平台的资源利用效率和推理速度,基于软硬件协同优化的思想,提出一种面向FPGA平台的轻量级卷积神经网络加速器,并针对网络结构的特性设计专门的硬件架构。与多级并行策略结合,设计一种统一的卷积层计算单元。为降低模型存储成本、提高加速器的吞吐量,提出一种基于可微阈值的选择性移位量化方案,使计算单元能够以硬件友好的形式执行计算。实验结果表明,在Arria 10 FPGA平台上部署的MobileNetV2加速器能够达到311 fps的推理速度,相比CPU版本实现了约9.3倍的加速比、GPU版本约3倍的加速比。在吞吐量方面,加速器能够实现98.62 GOPS。 展开更多
关键词 软硬件协同优化 现场可编程门阵列 轻量级卷积神经网络 移位量化 并行计算 硬件加速 开放式计算语言
下载PDF
基于异构平台的图像中值滤波的OpenCL加速算法 被引量:1
16
作者 肖诗洋 王镭 +1 位作者 杜莹 肖汉 《河北大学学报(自然科学版)》 CAS 北大核心 2024年第1期92-103,共12页
图像噪声降低了图像信噪比和质量,去噪是图像处理工作的重要环节之一.本文提出了一种基于开放式计算语言(OpenCL)架构的图像中值滤波快速降噪并行算法.介绍了OpenCL体系结构特点和中值滤波处理流程.根据图形处理器(GPU)的并发结构特点,... 图像噪声降低了图像信噪比和质量,去噪是图像处理工作的重要环节之一.本文提出了一种基于开放式计算语言(OpenCL)架构的图像中值滤波快速降噪并行算法.介绍了OpenCL体系结构特点和中值滤波处理流程.根据图形处理器(GPU)的并发结构特点,对图像中值滤波功能模块进行了并行优化,降低了算法复杂度.通过充分激活NDRange索引空间中的工作组和工作项来提高数据访问效率,优化内核工作组配置参数,实现了中值滤波器的并行处理.实验结果表明,在图像质量保持不变的情况下,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,图像中值滤波并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获得了29.74、17.29、1.15倍的加速比.验证了算法的有效性和平台的可移植性,基本满足应用的实时性处理要求. 展开更多
关键词 中值滤波 椒盐噪声 图形处理器 开放式计算语言 并行算法
下载PDF
Parallel C语言级容错机制的设计与实现
17
作者 何王全 方燕飞 +2 位作者 魏迪 董恩铭 漆锋滨 《计算机工程与应用》 CSCD 北大核心 2018年第17期41-49,61,共10页
大规模异构众核计算机系统具有计算能力强、性能功耗比高等突出优点,已成为超级计算机的发展方向,但其复杂的异构结构和庞大的系统规模,也使系统的可用性面临巨大挑战,因此研究面向大规模异构众核系统的轻量级容错技术具有重要意义。针... 大规模异构众核计算机系统具有计算能力强、性能功耗比高等突出优点,已成为超级计算机的发展方向,但其复杂的异构结构和庞大的系统规模,也使系统的可用性面临巨大挑战,因此研究面向大规模异构众核系统的轻量级容错技术具有重要意义。针对传统基于检查点的系统级容错开销过大的问题,在Parallel C语言中设计并实现了故障局部感知的轻量级降级、编译指导与自动分析的检查点等语言支持的容错机制,兼顾了好用性和高效性。局部故障感知的轻量级降级结合动态任务调度框架实现,支持众核系统,可扩展到百万以上并行规模;编译指导与自动分析的检查点通过程序员插入简单的编译指示,由编译器进行分析,提示不需要保留的数据,可有效降低保留恢复的数据量。神威太湖之光超级计算机上的测试数据表明,两种容错措施相对于传统容错方法效果良好,轻量级降级的容错开销小于1%,相对于传统回卷容错方法单次故障执行时间可减少3.5%以上,编译指导与自动分析的检查点在典型应用中最多可将保留量降低至1/10,具有很好的实用性。 展开更多
关键词 容错 降级 检查点 parallel C语言
下载PDF
并行RNN分组策略研究
18
作者 易也难 卞艺杰 《智能计算机与应用》 2024年第3期133-139,共7页
并行RNN结构或者分组RNN结构可以显著减少模型中的参数总量,从而有效地降低模型的训练成本并提高训练效率。本文提出一种高效的并行RNN分组策略,该策略不需要对输入数据进行拆分和重组操作,并且可以降低梯度反向传播的不稳定性对于模型... 并行RNN结构或者分组RNN结构可以显著减少模型中的参数总量,从而有效地降低模型的训练成本并提高训练效率。本文提出一种高效的并行RNN分组策略,该策略不需要对输入数据进行拆分和重组操作,并且可以降低梯度反向传播的不稳定性对于模型训练造成的负面影响。在语言建模和命名实体识别的任务中的实验结果表明,本文所提出的并行RNN分组策略,模型的参数计算总量大幅度减少,在2个任务中的表现显著提升。 展开更多
关键词 并行RNN 分组策略 语言建模 命名实体识别
下载PDF
申威众核处理器访存与通信融合编译优化
19
作者 方燕飞 李雁冰 +2 位作者 董恩铭 王云飞 刘齐 《软件学报》 EI CSCD 北大核心 2024年第6期2648-2667,共20页
申威众核片上多级存储层次是缓解众核“访存墙”的重要结构.完全由软件管理的SPM结构和片上RMA通信机制给应用性能提升带来很多机会,但也给应用程序开发优化与移植提出了很大挑战.为充分挖掘片上存储层次特点提升应用程序性能,同时减轻... 申威众核片上多级存储层次是缓解众核“访存墙”的重要结构.完全由软件管理的SPM结构和片上RMA通信机制给应用性能提升带来很多机会,但也给应用程序开发优化与移植提出了很大挑战.为充分挖掘片上存储层次特点提升应用程序性能,同时减轻用户编程优化负担,提出一种多级存储层次访存与通信融合的编译优化方法.该方法首先设计融合编译指示,将程序高层信息传递给编译器.其次构建编译优化收益模型并设计启发式循环优化方案迭代求解框架,并由编译器完成循环优化方案的求解和优化代码的变换.通过编译生成的DMA和RMA批量数据传输操作,将较低存储层次空间中高访问延迟的核心数据批量缓冲进低访问延迟的更高存储层次空间中.在3个典型测试用例上进行优化实验测试与分析,结果表明所提出的优化在性能上与手工优化相当,较未优化版程序性能有显著提升. 展开更多
关键词 申威众核处理器 多级存储层次 RMA通信 并行语言 编译优化
下载PDF
可重构OCS技术在大模型预训练中的应用(特邀)
20
作者 朱宸 周谞 王佩龙 《光通信研究》 北大核心 2024年第5期25-34,共10页
【目的】相比于电子分组交换机(EPS),全光电路交换(OCS)在时延、功耗、成本和稳定性等各个方面都体现出了优势,文章通过分析大模型预训练中的并行切分策略、集合通信需求、流量模式和现今的网络架构,讨论了基于OCS在训练组网中的可行的... 【目的】相比于电子分组交换机(EPS),全光电路交换(OCS)在时延、功耗、成本和稳定性等各个方面都体现出了优势,文章通过分析大模型预训练中的并行切分策略、集合通信需求、流量模式和现今的网络架构,讨论了基于OCS在训练组网中的可行的应用方式,以在训练任务中充分利用OCS的优势。【方法】文章提出在故障快速恢复中采用多个小端口OCS进行网络设备冗余保护的机制,可在机顶(ToR)交换机故障时快速切换不中断训练任务。此外,文章还提出OCS只为数据并行(DP)服务,且仅在任务开始前进行配置。【结果】文章提出了多种可行的光电组网架构,以及在不同AllReduce算法下的具体配置,采用包括集合通信算法和架构设计联合优化的方式达到更优的带宽利用率。【结论】只要充分结合训练任务的流量模型,OCS可以很好地融入现有EPS网络架构,从成本、低功耗、低时延以及高稳定性等各方面对大模型预训练进行优化。 展开更多
关键词 全光电路交换 可重构 光电混合网络架构 大模型预训练 集合通信 并行训练
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部