期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
面向Cell宽带引擎架构的异构多核访存技术 被引量:10
1
作者 冯国富 董小社 +1 位作者 丁彦飞 王旭昊 《西安交通大学学报》 EI CAS CSCD 北大核心 2009年第2期1-5,共5页
针对Cell宽带引擎架构(CBEA)多核高性能处理器要求软件显式地对分层存储结构进行管理,带来架构的可编程性及性能等问题,提出了一种基于CBEA的异构多核访存技术.将CBEA访存分为批量访存和按需访存;通过合理部署数据缓冲区来减小批... 针对Cell宽带引擎架构(CBEA)多核高性能处理器要求软件显式地对分层存储结构进行管理,带来架构的可编程性及性能等问题,提出了一种基于CBEA的异构多核访存技术.将CBEA访存分为批量访存和按需访存;通过合理部署数据缓冲区来减小批量访存计算中的片内访存开销,利用支持粗粒度访问的软件管理cache及数据预取来降低按需访存的片外访存开销;以访存接口库的方式来改善软件的可编程性.实验结果表明,所提技术的访存接口库在批量访存方式下的性能比ALF和CellSs提高了30%~50%,按需访存中软件管理cache性能比CBE软件开发工具包提高了20%~30%,4路数据预取访存比单路缓存的性能提高约50%. 展开更多
关键词 异构多核 访存技术 分层存储结构 cell宽带引擎架构
下载PDF
基于CELL宽带引擎架构的MPI研究与实现 被引量:1
2
作者 徐祯 孙济洲 +2 位作者 于策 亓大志 张旭明 《计算机应用研究》 CSCD 北大核心 2010年第7期2526-2529,共4页
研究了在CBEA上移植MPI消息传递编程模型和标准接口的可行性,并利用IBM CELL SDK 3.0实现了一组常用的MPI编程接口。实验结果表明,该组MPI接口可满足CBEA上应用开发的数据传输性能要求,并且其性能已接近现有DMA数据传输模式。该组MPI接... 研究了在CBEA上移植MPI消息传递编程模型和标准接口的可行性,并利用IBM CELL SDK 3.0实现了一组常用的MPI编程接口。实验结果表明,该组MPI接口可满足CBEA上应用开发的数据传输性能要求,并且其性能已接近现有DMA数据传输模式。该组MPI接口为CELL应用开发人员提供了一种通用编程接口解决方案。 展开更多
关键词 cell宽带引擎架构 异构多核处理器 MPI接口 数据传输 高性能计算
下载PDF
IBM推出革命性CELL宽带引擎(Cell BE)计算机
3
《计算机系统应用》 2006年第3期94-94,共1页
基于Cell BE的BM系统标志着计算历史上的新纪元 日前,IBM推出了摹于Cell宽带引擎(CellBE)的刀片计算系统。这种基于Cell BE的IBM系统专为那些需要Cell BE处理器的密集计算能力和独特性能来应对大量图形处理和数宇应用的公司而设计。
关键词 IBM 计算机 cell 引擎 宽带 革命性 cell 系统标志 计算系统 图形处理
下载PDF
Cell宽带引擎处理器的LinuX扩展和软件开发工具发布
4
《中国金融电脑》 2005年第12期78-78,共1页
本刊讯 IBM、索尼公司和索尼电脑娱乐公司(后两家公司合称为索尼集团)日前宣布,推出具有突破性的Cell宽带引擎架构(CBEA)技术的软件组件和文档,其中包括可支持Cell编程的Linux扩展。这些资源将通过IBM的开发人员论坛DeveloperWork... 本刊讯 IBM、索尼公司和索尼电脑娱乐公司(后两家公司合称为索尼集团)日前宣布,推出具有突破性的Cell宽带引擎架构(CBEA)技术的软件组件和文档,其中包括可支持Cell编程的Linux扩展。这些资源将通过IBM的开发人员论坛DeveloperWorks、巴塞罗那大学超级计算中心和以及索尼电脑娱乐公司网站为用户提供。 展开更多
关键词 软件开发工具 cell LINUX 扩展 引擎 宽带 处理器 索尼集团 索尼公司 LINUX
下载PDF
CELL宽带引擎注力IBM刀片服务器
5
作者 迈克 《电子设计应用》 2006年第4期84-84,共1页
关键词 刀片服务器 cell IBM 一体化解决方案 引擎 宽带 服务器系统 生命科学 市场规模 市场份额
下载PDF
基于IBM CELL多核处理器的快速运动估计算法
6
作者 贺迅 方向忠 《微计算机信息》 2009年第27期151-153,165,共4页
为了充分利用CELLBE处理器SIMD技术的数据并行处理能力,本文介绍一种运动估计算法,和已有的钻石搜索算法(DS)相比该算法能够实现更精确的运动估计和更低的运动复杂度。大多数传统的快速运动估计算法只是通过减少运动估计时的搜索点的个... 为了充分利用CELLBE处理器SIMD技术的数据并行处理能力,本文介绍一种运动估计算法,和已有的钻石搜索算法(DS)相比该算法能够实现更精确的运动估计和更低的运动复杂度。大多数传统的快速运动估计算法只是通过减少运动估计时的搜索点的个数来减少运算复杂度。然而对于CELLBE来说,搜索点的减少并不等于运算复杂度的减少。本文提出的算法在第一步使用一个包含35点的矩形搜索框,和DS算法相比能够提高了4.32%的压缩效率。相比DS算法,我们能够减少29.5%的运算量。然后优化了inter和intra模式选择算法,使intra的运算量从11%降到了3%。 展开更多
关键词 cell宽带处理引擎 单指令多数据 H.264 视频编码 多核心处理器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部