期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
一种面向CPU-GPU异构系统的容错方法 被引量:6
1
作者 徐新海 杨学军 +2 位作者 林宇斐 林一松 唐滔 《软件学报》 EI CSCD 北大核心 2011年第10期2538-2552,共15页
近年来,为了缓解日益严重的功耗问题,异构并行体系结构已成为超级计算机发展的一个重要趋势.图形处理器(graphics processing unit,简称GPU)凭借其超高的计算性能和性能功耗比,作为一种高效的加速部件已被广泛应用于高性能计算领域.但是... 近年来,为了缓解日益严重的功耗问题,异构并行体系结构已成为超级计算机发展的一个重要趋势.图形处理器(graphics processing unit,简称GPU)凭借其超高的计算性能和性能功耗比,作为一种高效的加速部件已被广泛应用于高性能计算领域.但是,GPU先天的可靠性缺陷势必加剧超级计算机的可靠性问题.目前,国际上关于CPU-GPU异构系统容错技术的研究工作主要将GPU从异构系统中独立出来,以每次调用为粒度对其进行容错处理.设计了一种面向CPU-GPU异构系统的Lazy容错方法,给出了基于编译指导命令的容错框架及其约束,并讨论了相关的编译实现和优化方法,最后通过实验验证了该方法的正确性.实验结果表明,与现有的容错方法相比,利用所设计的LazyFT容错方法对GPGPU(general purpose computation on graphics hardware)程序进行容错处理,可以明显降低容错代价. 展开更多
关键词 GPGPU 异构系统 容错 Lazy策略 检查点
下载PDF
CPU-GPGPU异构体系结构相关技术综述 被引量:10
2
作者 徐新海 林宇斐 易伟 《计算机工程与科学》 CSCD 北大核心 2009年第A01期24-26,87,共4页
随着GPU的发展,其计算能力和访存带宽都超过了CPU,在GPU上进行通用计算也变得越来越流行,这样就构成了CPU-GPGPU的新型异构体系结构。虽然这种新型体系结构表现出了强大的性能优势并受到了学术界和产业界的广泛关注,但如何更好地在这种... 随着GPU的发展,其计算能力和访存带宽都超过了CPU,在GPU上进行通用计算也变得越来越流行,这样就构成了CPU-GPGPU的新型异构体系结构。虽然这种新型体系结构表现出了强大的性能优势并受到了学术界和产业界的广泛关注,但如何更好地在这种结构上高效地编写和运行程序仍然存在很大的挑战。本文综述了针对这一体系结构现有的可编程性技术、可靠性技术和低功耗技术,并结合这些技术展望了CPU-GPGPU这种异构系统的发展趋势。 展开更多
关键词 通用图像处理器 异构体系结构 可编程性 可靠性 低功耗
下载PDF
跨专业并行计算基础课程教学设计 被引量:7
3
作者 徐新海 唐玉华 林宇斐 《计算机教育》 2014年第23期106-109,共4页
针对当前大学在并行计算教育方面的不足,提出面向跨专业高年级本科学生或低年级研究生的并行计算基础课程小班教学总体规划。在坚持面向并行计算实际需求和跨专业知识背景的原则下,确定"讲授+实验+研讨+论文"的教学形式,采用... 针对当前大学在并行计算教育方面的不足,提出面向跨专业高年级本科学生或低年级研究生的并行计算基础课程小班教学总体规划。在坚持面向并行计算实际需求和跨专业知识背景的原则下,确定"讲授+实验+研讨+论文"的教学形式,采用并行计算系统知识与MPI编程知识并重的知识点讲授内容、基础+领域的实验安排和以利用并行计算解决实际问题为核心导向的考核标准。 展开更多
关键词 并行计算 跨专业 教学设计 MPI
下载PDF
注重计算思维的启发式C语言语法教学 被引量:14
4
作者 徐新海 林宇斐 《计算机教育》 2014年第17期1-4,共4页
针对C语言教学重算法实践、轻语法讲解的现象,提出通过使用启发式方法讲解C语言语法,从而培养学生计算思维的教学方法。在强调语法教学重要性的同时,从最基本的语法出发,通过设计相应案例,在课上与学生互动,启发学生思考语法背后的动因... 针对C语言教学重算法实践、轻语法讲解的现象,提出通过使用启发式方法讲解C语言语法,从而培养学生计算思维的教学方法。在强调语法教学重要性的同时,从最基本的语法出发,通过设计相应案例,在课上与学生互动,启发学生思考语法背后的动因、规则的严谨以及使用的注意事项。 展开更多
关键词 计算思维 程序设计 启发式教学 C语言 语法
下载PDF
基于“最近发展区”理论的类ACM式C语言教学 被引量:3
5
作者 徐新海 林宇斐 《计算机教育》 2015年第6期47-50,共4页
基于"最近发展区"理论,借鉴ACM国际程序设计竞赛的形式,提出旨在激发学生编程兴趣、不断突破自我的C语言教学方法,阐述如何在打牢语法知识和调试能力基础的前提下分阶段组织教学内容,在每阶段末尾进行突击能力提升的课堂测试... 基于"最近发展区"理论,借鉴ACM国际程序设计竞赛的形式,提出旨在激发学生编程兴趣、不断突破自我的C语言教学方法,阐述如何在打牢语法知识和调试能力基础的前提下分阶段组织教学内容,在每阶段末尾进行突击能力提升的课堂测试、测试用例与语法示例统筹设计,最终通过类ACM式的测试方法有效提高学生编程解决较难实际问题的能力。 展开更多
关键词 C语言 教学设计 最近发展区 ACM 程序设计
下载PDF
数据流Eager传输:一种分布式流体系结构中的性能优化技术 被引量:1
6
作者 李鑫 郭晓威 林宇斐 《计算机工程与科学》 CSCD 北大核心 2015年第11期2035-2044,共10页
分布式流体系结构扩展了分布式环境下的流计算模型,可在互联网上为大数据计算应用提供高效低成本的运行环境。互联网中较长的通信开销制约了计算性能。提出了一种数据流Eager传输的性能优化技术,以挖掘计算与通信之间的并行性,隐藏通信... 分布式流体系结构扩展了分布式环境下的流计算模型,可在互联网上为大数据计算应用提供高效低成本的运行环境。互联网中较长的通信开销制约了计算性能。提出了一种数据流Eager传输的性能优化技术,以挖掘计算与通信之间的并行性,隐藏通信延迟。在分布式流体系结构原型系统中实现了该技术。实验结果表明,应用程序采用该优化技术之后的平均时间开销减少了19.58%,表明该优化技术能够显著提高应用的性能,具有良好的应用前景。 展开更多
关键词 分布式流体系结构 性能优化 数据流Eager传输技术
下载PDF
面向分布式流体系结构的多副本积极容错技术 被引量:1
7
作者 李鑫 林宇斐 郭晓威 《计算机工程与科学》 CSCD 北大核心 2015年第12期2233-2241,共9页
随着互联网环境下计算系统规模的不断扩大,分布式流体系结构的可靠性问题面临着严峻的挑战。以多模冗余容错技术为基础,针对软错误提出了一种面向分布式流体系结构的多副本积极容错技术TREFT,利用三个程序副本进行高效的检错与纠错。在... 随着互联网环境下计算系统规模的不断扩大,分布式流体系结构的可靠性问题面临着严峻的挑战。以多模冗余容错技术为基础,针对软错误提出了一种面向分布式流体系结构的多副本积极容错技术TREFT,利用三个程序副本进行高效的检错与纠错。在分布式流体系结构原型系统上的实验结果表明,该技术能有效提高系统的可靠性,具有较低的容错成本,平均增加10.77%的容错开销。 展开更多
关键词 分布式流体系结构 容错技术 三模冗余
下载PDF
基于闭合最小图划分模型的多作业分配优化方法 被引量:1
8
作者 张拥军 林宇斐 《计算机科学》 CSCD 北大核心 2014年第6期22-26,共5页
随着并行计算系统规模的增大和复杂度的提高,已有的多作业分配方式可能导致较长的通信延迟和严重的通信竞争。针对这一问题,提出了一种基于闭合最小图划分模型的多作业分配优化方法。该方法以最小化通信延迟和消除通信竞争为出发点,通... 随着并行计算系统规模的增大和复杂度的提高,已有的多作业分配方式可能导致较长的通信延迟和严重的通信竞争。针对这一问题,提出了一种基于闭合最小图划分模型的多作业分配优化方法。该方法以最小化通信延迟和消除通信竞争为出发点,通过建立闭合最小图划分模型,将多作业分配优化问题转化成闭合最小图划分问题,并设计闭合最小图划分算法来获得优化的多作业分配方案。 展开更多
关键词 多作业分配 图划分 通信竞争 网络直径
下载PDF
事务体系结构的操作系统支持
9
作者 徐新海 杨学军 +1 位作者 所光 林宇斐 《计算机工程与科学》 CSCD 北大核心 2009年第2期116-119,134,共5页
随着多核芯片的广泛应用,开发线程级并行变得至关重要。事务可以使编程者通过非常简单的多线程编程模型来实现并行,事务存储(TM)可以简单地实现事务执行的原子性和独立性。本文介绍了目前的主流事务存储系统TCC、LogTM、PTM,分析了各自... 随着多核芯片的广泛应用,开发线程级并行变得至关重要。事务可以使编程者通过非常简单的多线程编程模型来实现并行,事务存储(TM)可以简单地实现事务执行的原子性和独立性。本文介绍了目前的主流事务存储系统TCC、LogTM、PTM,分析了各自的系统结构和相应的操作系统支持,并在此基础之上揭示了事务存储系统的硬件设计和操作系统支持之间的关系,最终总结得到了TM发展的一些基本规律和特点。 展开更多
关键词 事务存储 体系结构 操作系统
下载PDF
战士学员“大学计算机基础”课程中的计算思维培养
10
作者 徐新海 杨文婧 +1 位作者 林宇斐 陈娟 《高等教育研究学报》 2015年第4期104-108,共5页
针对战士学员学习"大学计算机基础"课程效率低、不深入的问题,提出结合军营实际案例、突出计算思维培养的教学方法。在强调知识点动因、逻辑、思想讲解的前提下,将各种零星知识点和系统知识点类比成军营生活中的实际案件进行... 针对战士学员学习"大学计算机基础"课程效率低、不深入的问题,提出结合军营实际案例、突出计算思维培养的教学方法。在强调知识点动因、逻辑、思想讲解的前提下,将各种零星知识点和系统知识点类比成军营生活中的实际案件进行讲解。教学实践结果表明,与传统教学方法相比,本次改革探索与实践提高了战士学生的学习效率、锻炼了计算思维、一定程度上达到了学以致用的目的。 展开更多
关键词 大学计算机基础 战士学员 教学设计 军营案例
下载PDF
军校青年学员与战士学员的因材施教探索与实践——以“大学计算机基础”课程为例 被引量:3
11
作者 任小广 林宇斐 易伟 《高等教育研究学报》 2017年第2期110-114,共5页
针对军校青年学员和战士学员的不同特点,展开现状分析和学员差异分析。并基于分析结果,以"大学计算机基础"为例,提出针对不同学员的因材施教教学方法。在尊重学员特点规律的前提下,利用不同学员类型的优势特点,采取措施将不... 针对军校青年学员和战士学员的不同特点,展开现状分析和学员差异分析。并基于分析结果,以"大学计算机基础"为例,提出针对不同学员的因材施教教学方法。在尊重学员特点规律的前提下,利用不同学员类型的优势特点,采取措施将不利因素转化为有利因素。实践结果表明,与传统教学方法相比,本次教学改革探索与实践提高了学员的学习效率,达到了充分挖掘学员学习潜能的目的。 展开更多
关键词 大学计算机基础 战士学员 青年学员 因材施教
下载PDF
财政税收对市场经济发展的作用浅谈 被引量:6
12
作者 林宇斐 《纳税》 2019年第20期32-32,共1页
财政税收是政府开展社会公共服务的重要组成部分,市场经济的发展水平直接决定了财政税收,同时财政税收对市场经济发展也是有一定的控制作用,随着经济的发展,以及财政税收理论和体系的不断完善,财政税收工作已经覆盖了人们的大部分生产... 财政税收是政府开展社会公共服务的重要组成部分,市场经济的发展水平直接决定了财政税收,同时财政税收对市场经济发展也是有一定的控制作用,随着经济的发展,以及财政税收理论和体系的不断完善,财政税收工作已经覆盖了人们的大部分生产和生活,本文对财政税收对市场经济发展的作用进行探讨和研究。 展开更多
关键词 财政税收 市场经济 发展
下载PDF
浅谈管理会计与基建财务管理结合应用探索 被引量:4
13
作者 林宇斐 《科技经济市场》 2019年第6期20-21,共2页
管理会计是从传统的会计系统中分离出来,与财务会计并列,着重为企业进行最优决策,改善经营管理,提高经济效益服务的一个企业会计分支。基建项目的投资与建设是企业扩大再生产、增加企业资本、社会物质财富和推进社会进步的重要基础。基... 管理会计是从传统的会计系统中分离出来,与财务会计并列,着重为企业进行最优决策,改善经营管理,提高经济效益服务的一个企业会计分支。基建项目的投资与建设是企业扩大再生产、增加企业资本、社会物质财富和推进社会进步的重要基础。基建项目的特点是投资大,建设周期长,加强基建项目的财务管理,能够有效控制基建项目的成本费用,保证项目顺利实施。但是目前企业在基建项目财务管理中仍面临一些突出问题,本文通过将管理会计理念引入企业基建财务管理的方式,提升企业基建财务管理水平,为企业基建项目保驾护航。 展开更多
关键词 管理会计 基建项目 财务管理
下载PDF
军队科研单位科技档案管理问题探析 被引量:1
14
作者 林宇斐 《管理观察》 2019年第27期77-78,共2页
科研单位是科学技术储备、创新和传播的重要阵地,拥有着最丰富的科技知识。科技档案管理是科技活动的组成部分,是科研单位管理工作的重要环节。做好科技档案管理工作,对科研单位的发展意义重大。本文首先分析科技档案管理对科研单位的... 科研单位是科学技术储备、创新和传播的重要阵地,拥有着最丰富的科技知识。科技档案管理是科技活动的组成部分,是科研单位管理工作的重要环节。做好科技档案管理工作,对科研单位的发展意义重大。本文首先分析科技档案管理对科研单位的重要性,然后针对军队科研单位特点,提出科技档案管理工作的问题,最后给出对策建议。 展开更多
关键词 科研单位 科技档案 档案管理 档案意识 涉密档案
下载PDF
基于异步机制的Gazebo仿真优化研究 被引量:5
15
作者 曾蕾 李豪 +1 位作者 林宇斐 张帅 《计算机科学》 CSCD 北大核心 2020年第S02期593-598,共6页
在大规模机器人仿真过程中,为了保证仿真精度,通常采用基于时间步的推进机制。这种机制下,虽然可以通过调整仿真时间步灵活控制仿真精度,但当仿真规模较大时,在仿真循环的每次迭代中需要采用同步阻塞的方式,执行大量用于更新位姿或状态... 在大规模机器人仿真过程中,为了保证仿真精度,通常采用基于时间步的推进机制。这种机制下,虽然可以通过调整仿真时间步灵活控制仿真精度,但当仿真规模较大时,在仿真循环的每次迭代中需要采用同步阻塞的方式,执行大量用于更新位姿或状态的插件代码,从而导致仿真性能降低。针对这一大规模机器人仿真所面临的精度与性能之间的矛盾,提出了一种基于异步策略的优化方案,并在流行的机器人仿真器Gazebo中对优化方案进行了设计实现,最后基于rosflight固定翼无人机案例,验证了方案的有效性。实验结果表明,对于100架固定翼无人机的仿真,采用异步策略优化重构后,仿真加速比达到了5.0以上。 展开更多
关键词 Gazebo ROS 异步策略 优化重构 高精度 实时仿真 大规模
下载PDF
基于MPI的分布式并行Gazebo仿真优化与测试 被引量:4
16
作者 蒋化南 张帅 +1 位作者 林宇斐 李豪 《计算机科学》 CSCD 北大核心 2021年第S02期672-677,692,共7页
Gazebo作为机器人通用仿真平台,能够在复杂的室内和室外环境中准确模拟机器人行为,并在单节点上支持多机器人的协同仿真。但执行仿真任务中如果启动成百上千台机器人,通常会发现Gazebo性能参考值(RTF)仿真实时比会降低两个数量级,甚至... Gazebo作为机器人通用仿真平台,能够在复杂的室内和室外环境中准确模拟机器人行为,并在单节点上支持多机器人的协同仿真。但执行仿真任务中如果启动成百上千台机器人,通常会发现Gazebo性能参考值(RTF)仿真实时比会降低两个数量级,甚至出现仿真错误的情况,仿真性能会成为其主要制约因素。为了实现机器人集群的高性能仿真,探索了基于MPI的跨节点ROS+Gazebo仿真平台搭建方法,核心过程是针对确定的仿真任务进行并行划分,可采用编号划分或区域划分,将划分好的各个子任务部署到各计算节点的Gazebo上进行仿真,最后通过Gazebo之间的MPI进程通信保证仿真的同步和一致性,以此实现机器人分布在不同计算节点上的协同仿真。同时编写了固定翼和四旋翼同构和异构的仿真测试案例,通过脚本程序读入world配置文件和roslaunch文件来实现,设计了对用户友好的与ROS类似的启动方式,进行了单节点和跨节点的性能测试,验证了分布式并行仿真的优越性。 展开更多
关键词 MPI Gazebo ROS 机器人集群 高性能仿真
下载PDF
PartialRC: A Partial Recomputing Method for Efficient Fault Recovery on GPGPUs 被引量:1
17
作者 徐新海 杨学军 +2 位作者 薛京灵 林宇斐 林一松 《Journal of Computer Science & Technology》 SCIE EI CSCD 2012年第2期240-255,共16页
GPGPUs are increasingly being used to as performance accelerators for HPC (High Performance Computing) applications in CPU/GPU heterogeneous computing systems, including TianHe-1A, the world's fastest supercomputer... GPGPUs are increasingly being used to as performance accelerators for HPC (High Performance Computing) applications in CPU/GPU heterogeneous computing systems, including TianHe-1A, the world's fastest supercomputer in the TOP500 list, built at NUDT (National University of Defense Technology) last year. However, despite their performance advantages, GPGPUs do not provide built-in fault-tolerant mechanisms to offer reliability guarantees required by many HPC applications. By analyzing the SIMT (single-instruction, multiple-thread) characteristics of programs running on GPGPUs, we have developed PartialRC, a new checkpoint-based compiler-directed partial recomputing method, for achieving efficient fault recovery by leveraging the phenomenal computing power of GPGPUs. In this paper, we introduce our PartialRC method that recovers from errors detected in a code region by partially re-computing the region, describe a checkpoint-based faulttolerance framework developed on PartialRC, and discuss an implementation on the CUDA platform. Validation using a range of representative CUDA programs on NVIDIA GPGPUs against FullRC (a traditional full-recomputing Checkpoint-Rollback-Restart fault recovery method for CPUs) shows that PartialRC reduces significantly the fault recovery overheads incurred by FullRC, by 73.5% when errors occur earlier during execution and 74.6% when errors occur later on average. In addition, PartialRC also reduces error detection overheads incurred by FullRC during fault recovery while incurring negligible performance overheads when no fault happens. 展开更多
关键词 GPGPU partial recomputing fault tolerance CUDA CHECKPOINTING
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部