期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于线程池的GPU任务并行计算模式研究 被引量:21
1
作者 李涛 董前琨 +3 位作者 张帅 孔令晏 康宏 杨愚鲁 《计算机学报》 EI CSCD 北大核心 2018年第10期2175-2192,共18页
GPU已经成为具有高并发高内存带宽的通用协处理器,但是GPU与CPU在体系结构和编程模型上存在很大差异,导致CPU-GPU异构计算系统的编程复杂度提高,即使采用统一计算设备架构(CUDA)提供的kernel并发技术和多流技术也较难充分控制和利用GPU... GPU已经成为具有高并发高内存带宽的通用协处理器,但是GPU与CPU在体系结构和编程模型上存在很大差异,导致CPU-GPU异构计算系统的编程复杂度提高,即使采用统一计算设备架构(CUDA)提供的kernel并发技术和多流技术也较难充分控制和利用GPU上的计算资源,难以有效地处理不规则的并行应用问题.为从体系结构角度探索GPU硬件支持的页锁定内存和统一虚拟地址空间等特征,该文提出了CPU辅助任务调度管理下的基于线程池技术的GPU任务并行计算模型CAGTP,实现了CPU-GPU异构计算系统上的共享内存式程序设计.提出并设计了CPU端的任务队列、计算线程块级任务调度器、任务槽和GPU端的任务复用kernel函数等机制,实现了CPU与GPU间的高效细粒度任务交互,避免了原生CUDA程序中多次启停kernel函数的开销,有效地支持了GPU上的细粒度不规则并行任务计算,而且利用模型API接口函数能够降低CPU-GPU异构计算系统的编程难度.实验结果表明,CAGTP模型中任务调度的开销是kernel函数调用的5%,有效提升了通用矩阵乘、乔列斯基分解和K均值、T近邻等典型线性代数和机器学习算法的计算性能;CAGTP模型易于扩展使用多块GPU,且在性能差异较大的多个GPU之间达到负载均衡,能够高效求解混合任务和具有不规则并行性的应用问题. 展开更多
关键词 异构计算系统 统一计算设备架构 线程池 任务并行 任务复用函数
下载PDF
物联网工程实验课程体系建设与实践教学研究 被引量:4
2
作者 卢冶 李涛 +2 位作者 宫晓利 董前琨 刘嘉欣 《实验室科学》 2019年第4期147-152,共6页
针对实验课程体系建设与实践教学过程中存在的问题与挑战,介绍南开大学物联网工程专业实验课程体系建设思路,提出以应用为导向,紧贴实际、侧重基础、结合实训、以赛代练的实践教学指导思想。通过具备针对性、拓展性和延续性的典型教学案... 针对实验课程体系建设与实践教学过程中存在的问题与挑战,介绍南开大学物联网工程专业实验课程体系建设思路,提出以应用为导向,紧贴实际、侧重基础、结合实训、以赛代练的实践教学指导思想。通过具备针对性、拓展性和延续性的典型教学案例,及物联网教学示范系统的建设,说明了实验课程内容设计和教学改革方法,阐述了如何将实验课程与实际应用紧密结合,引导学生发现问题与解决问题,激发学生创新思维,提高学生工程实践能力。 展开更多
关键词 物联网工程 实验课程体系 教学改革 示范系统 项目与竞赛
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部