期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
应用双带产生式进行并行代码生成
1
作者 姚新宇 戴金海 《计算机工程与科学》 CSCD 1999年第5期77-82,共6页
本文基于YH-F2系统编译程序设计,为最大程度地开发YH-F2对复杂算术表达式的并行计算能力, 引入二维文法及双带产生式系统描述算术表达式, 并据此设计双带产生式的SLR制导翻译方法,对复杂表达式进行并行代码生成。
关键词 表达式 产生式 YH-F2 编译程序 并行代码
下载PDF
基于领域分析的结构线性静力软件串并行一致化方法
2
作者 唐德泓 杨浩 +1 位作者 文龙飞 徐正秋 《计算机科学》 CSCD 北大核心 2024年第9期87-95,共9页
并行CAE软件的计算结果串并行一致性是其计算结果可信的必要条件。然而,软件研发时常引入串并行不一致缺陷,其形式众多,现象相互耦合,散布于海量代码中,成为实现CAE软件串并行一致性的挑战。文中以结构线性静力软件的串并行一致性需求... 并行CAE软件的计算结果串并行一致性是其计算结果可信的必要条件。然而,软件研发时常引入串并行不一致缺陷,其形式众多,现象相互耦合,散布于海量代码中,成为实现CAE软件串并行一致性的挑战。文中以结构线性静力软件的串并行一致性需求为切入点,针对现有的“专家知识法”与“缺陷定位法”应用于CAE软件串并行一致化时存在的粒度粗、准度差、成本高和缺乏系统性问题,引入领域分析方法,并与专家知识和数据流状态比对结合,提出了一种适用于结构线性静力的串并行一致化方法,实现了结构线性静力软件串并行不一致缺陷的细粒度、高准度与低成本系统性识别与修复。基于前述方法形成相关工具,并将方法与工具应用于SSTA的串并行一致化,识别并修复其中8处串并行不一致缺陷,使其通过90余真实模型的串并行一致考核,并实现串并行结果严格一致;同时,该方法与工具还将串并行不一致缺陷定位耗时由平均大于两人天降低至数人时。 展开更多
关键词 并行一致化 结构线性静力软件 串行代码并行 领域分析 缺陷定位
下载PDF
一种基于代码并行化和虚拟机多样化的软件保护方法 被引量:8
3
作者 谢鑫 刘粉林 +1 位作者 芦斌 向飞 《小型微型计算机系统》 CSCD 北大核心 2015年第11期2588-2593,共6页
考虑到并行和多虚拟机保护的程序逆向分析难度大大高于串行和单虚拟保护的程序,针对嵌套虚拟机为实现高强度保护而引入的高开销问题,提出一种基于代码并行化和虚拟机多样化的软件保护方法,基于程序依赖图运用切片技术对代码进行并行划分... 考虑到并行和多虚拟机保护的程序逆向分析难度大大高于串行和单虚拟保护的程序,针对嵌套虚拟机为实现高强度保护而引入的高开销问题,提出一种基于代码并行化和虚拟机多样化的软件保护方法,基于程序依赖图运用切片技术对代码进行并行划分,设计多种虚拟指令集及其对应的编译器和解释器,将划分后的代码编译成多样化字节码序列,并和虚拟指令解释器共同嵌入程序.实验分析表明:逆向攻击者需分析不同虚拟机机制和并行代码集才能获取受保护程序语义,在降低时间开销的同时极大增加了逆向分析的难度. 展开更多
关键词 软件保护 代码混淆 代码并行 虚拟机多样化
下载PDF
并行信息认证代码在分组密码中的应用(英文)
4
作者 吴桂华 孙宝林 《中南民族大学学报(自然科学版)》 CAS 2003年第2期63-67,共5页
指出了信息认证代码 (MAC)是一个确定的、并行的以及使用 [|M|/ n]个分组密码调用的一个非空串 M,介绍了一个简单和完整的并行分组密码模型 ,其信息认证算法在常规序列环境下 CBA MAC的所占费用是非常少的 .PMAC使用一个 n比特的 [|M|/... 指出了信息认证代码 (MAC)是一个确定的、并行的以及使用 [|M|/ n]个分组密码调用的一个非空串 M,介绍了一个简单和完整的并行分组密码模型 ,其信息认证算法在常规序列环境下 CBA MAC的所占费用是非常少的 .PMAC使用一个 n比特的 [|M|/ n]分组密码串 M∈ { 0 ,1 } * ,证明 PMAC是安全的 。 展开更多
关键词 分组密码模型 信息认证代码 并行信息认证代码 安全可证性
下载PDF
并行编译中对维内通信的通信优化 被引量:1
5
作者 丁锐 赵荣彩 梁玲 《计算机工程与应用》 CSCD 北大核心 2010年第14期45-47,65,共4页
代码生成作为并行编译器的后端,其生成代码的优劣直接影响着并行程序的执行效率。并行分解的维内存在偏移会产生维内通信,传统算法生成的维内通信代码不够精确,会产生冗余通信。提出了通过合并数组变量生成通信链,并按照通信链生成通信... 代码生成作为并行编译器的后端,其生成代码的优劣直接影响着并行程序的执行效率。并行分解的维内存在偏移会产生维内通信,传统算法生成的维内通信代码不够精确,会产生冗余通信。提出了通过合并数组变量生成通信链,并按照通信链生成通信代码的维内通信优化算法来消除此类冗余,对传统算法进行了改进和优化。测试结果表明该算法对维内通信的优化效果明显。 展开更多
关键词 并行代码自动生成 并行分解 维内通信 优化
下载PDF
MPI通信代码自动生成算法 被引量:5
6
作者 杜澎 赵荣彩 董春丽 《计算机应用》 CSCD 北大核心 2007年第3期759-761,共3页
对于高性能并行计算机而言,如何由给出的计算、数据划分信息及精确数组数据流分析信息自动生成并行化代码是实现串行程序并行化的一个重要问题。根据SamanP.Amarasinghe和Lam的定理,实现了一种并行化识别工具中MPI(MessagePassingInterf... 对于高性能并行计算机而言,如何由给出的计算、数据划分信息及精确数组数据流分析信息自动生成并行化代码是实现串行程序并行化的一个重要问题。根据SamanP.Amarasinghe和Lam的定理,实现了一种并行化识别工具中MPI(MessagePassingInterface)并行化代码自动生成技术的算法,并对该算法的性能进行分析。 展开更多
关键词 并行编译 并行代码自动生成 并行识别工具
下载PDF
基于R的并行优化环境设计
7
作者 姜海韬 羊帆 +2 位作者 陈媛媛 付继发 张辉国 《科技创新与应用》 2018年第23期37-39,41,共4页
文章对R语言已有的并行计算框架进行系统分类、比较,分析了适用于基于R+MPI与基于R+Hadoop的应用场景。在此基础上,结合两者优势提出了一种基于R+MPI的优化计算环境,该环境可以使用户仅修改少量代码就可以将原有的串行程序并行执行。最... 文章对R语言已有的并行计算框架进行系统分类、比较,分析了适用于基于R+MPI与基于R+Hadoop的应用场景。在此基础上,结合两者优势提出了一种基于R+MPI的优化计算环境,该环境可以使用户仅修改少量代码就可以将原有的串行程序并行执行。最后,通过一个多元线性回归模型的代码实例展示编程的便捷性,通过与现有工具包的速度比较验证了其有效性。 展开更多
关键词 代码并行 分布式算法 MPI HADOOP 多元线性回归
下载PDF
基于Define-Use分析的冗余通信消除算法 被引量:1
8
作者 王军委 赵荣彩 李妍 《计算机工程》 CAS CSCD 北大核心 2009年第4期85-87,共3页
针对并行代码自动生成过程中产生的大量冗余通信代码,提出基于Define-Use分析的冗余通信消除算法。将中间代码的每一个过程划分为不同的块,同时收集各块中对数组变量的定义和引用信息。以块为节点,按控制流关系构造控制流图。以控制流... 针对并行代码自动生成过程中产生的大量冗余通信代码,提出基于Define-Use分析的冗余通信消除算法。将中间代码的每一个过程划分为不同的块,同时收集各块中对数组变量的定义和引用信息。以块为节点,按控制流关系构造控制流图。以控制流图为基础,根据块间各数组变量的Define-Use关系,确定需要通信的位置,从而消除冗余通信代码,达到优化通信的目的。测试结果表明,该算法可有效提高并行程序的执行效率。 展开更多
关键词 并行代码 冗余通信 优化
下载PDF
基于线性不等式消元实现的通信优化 被引量:1
9
作者 刘磊 赵荣彩 龚雪容 《计算机工程》 CAS CSCD 北大核心 2008年第7期59-60,63,共3页
若自动生成的并行化代码中包含过多的冗余代码,将导致代码膨胀,同时增加不必要的时间开销。该文通过对计算划分不等式和依赖关系不等式进行傅立叶消元,消除并行化代码中的冗余通信部分,实现通信优化。测试结果表明,与通信优化前的代码相... 若自动生成的并行化代码中包含过多的冗余代码,将导致代码膨胀,同时增加不必要的时间开销。该文通过对计算划分不等式和依赖关系不等式进行傅立叶消元,消除并行化代码中的冗余通信部分,实现通信优化。测试结果表明,与通信优化前的代码相比,消除后的并行代码量减少了10%~30%,处理器数目相同的情况下加速比平均达到1.12。 展开更多
关键词 并行代码自动生成 冗余通信消除 线性不等式 通信优化
下载PDF
AN IMPROVED SOVA-BASED DECODING SCHEME FOR TURBO-STCM
10
作者 李颖慧 徐大专 《Transactions of Nanjing University of Aeronautics and Astronautics》 EI 2003年第1期108-111,共4页
Parallel concatenated spa ce time trellis code modulation, called Turbo STCM, can efficiently increase the coding gains of the space time codes. However, the complexity of the iterat iv e decoding restricts its ap... Parallel concatenated spa ce time trellis code modulation, called Turbo STCM, can efficiently increase the coding gains of the space time codes. However, the complexity of the iterat iv e decoding restricts its application. This paper introduces a lower complex deco ding algorithm based on soft output Viterbi algorithm (SOVA) for Turbo STCM. S imulational results show that the new SOVA algorithm for the Turbo STCM outperf orms the original space time trellis code (STTC) by 4~6 dB. At the same time, compared with the Max Log MAP (maximum a posteriori) algorithm, the new scheme requires a lower complexity and approaches the performance of Turbo STCM decod ing w ith Max Log MAP. 展开更多
关键词 decoding algorithm spa ce time trellis codes SOVA algorithm
下载PDF
Cluster parallel rendering based on encoded mesh 被引量:3
11
作者 QIN Ai-hong XIONG Hua +2 位作者 PENG Hao-yu LIU Zhen SHI Jiao-ying 《Journal of Zhejiang University-Science A(Applied Physics & Engineering)》 SCIE EI CAS CSCD 2006年第7期1124-1133,共10页
Use of compressed mesh in parallel rendering architecture is still an unexplored area, the main challenge of which is to partition and sort the encoded mesh in compression-domain. This paper presents a mesh compressio... Use of compressed mesh in parallel rendering architecture is still an unexplored area, the main challenge of which is to partition and sort the encoded mesh in compression-domain. This paper presents a mesh compression scheme PRMC (Parallel Rendering based Mesh Compression) supplying encoded meshes that can be partitioned and sorted in parallel rendering system even in encoded-domain. First, we segment the mesh into submeshes and clip the submeshes’ boundary into Runs, and then piecewise compress the submeshes and Runs respectively. With the help of several auxiliary index tables, compressed submeshes and Runs can serve as rendering primitives in parallel rendering system. Based on PRMC, we design and implement a parallel rendering architecture. Compared with uncompressed representation, experimental results showed that PRMC meshes applied in cluster parallel rendering system can dramatically reduce the communication requirement. 展开更多
关键词 CLUSTER Parallel rendering RENDERING Compression algorithm Mesh coding Mesh segmentation
下载PDF
A NOVEL ITERATIVE SCHEME FOR PARALLEL INTER-SYMBOL INTERFERENCE CHANNELS
12
作者 Cheng Xiang Yuan Dongfeng 《Journal of Electronics(China)》 2007年第1期50-53,共4页
In this paper,we propose a novel iterative scheme for exploiting transmit diversity using parallel independent Inter-Symbol Interference (ISI) channels. In this adaptive iterative scheme,we use EXtrinsic Information T... In this paper,we propose a novel iterative scheme for exploiting transmit diversity using parallel independent Inter-Symbol Interference (ISI) channels. In this adaptive iterative scheme,we use EXtrinsic Information Transfer (EXIT) chart tool to choose appropriate iterative method from Itera-tive Combining (IC),used as parallel concatenation turbo-like scheme,and Turbo Equalization (TE),used as serial concatenation turbo-like scheme. It is show that the proposed iterative scheme provides excellent performance both analytically and through simulations without any compute complexity increase comparable to IC. 展开更多
关键词 iterative method Turbo Equalization (TE) Iterative Combining (IC) EXtrinsic Information Transfer (EXIT) chart Inter-Symbol Interference (ISI)
下载PDF
Decomposition Method for Complex 3D Problems in Electron Optics
13
作者 Valentin Ivanov 《Journal of Physical Science and Application》 2015年第2期96-100,共5页
The decomposition method was successfully used in solving of 3D problems with complex geometry shape in electron optics for the FDM (Finite Difference Method) and FEM (Finite Element Method) mostly to implement fa... The decomposition method was successfully used in solving of 3D problems with complex geometry shape in electron optics for the FDM (Finite Difference Method) and FEM (Finite Element Method) mostly to implement fast and robust parallel algorithms and computer codes. We suggest a new version of similar approach for the BEM (Boundary Element Method) based on the alternating method by Schwartz. This approach substantially reduce the dimension of dense global matrix of algebraic system produced by BEM algorithm to solve a complex problem on as single CPU (Central Processor Unit) desktop computer. New algorithm is iterative one, but exponential convergence for the Schwatlz's algorithm creates the fast numerical procedures. We describe the results of numerical simulation for a multi electrode ion transport system. The algorithms were implemented in the computer code "POISSON-3". 展开更多
关键词 Electron optics decomposition method numerical-analytical technique boundary element method.
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部