期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于单指令多数据流扩展的光线投射算法优化
1
作者 邹云鹏 齐季 康雁 《生物医学工程学杂志》 CAS CSCD 北大核心 2012年第2期212-216,共5页
光线投射算法是目前医学图像可视化领域应用范围最广、成像效果最好的算法之一。由于大量的采样、梯度、光照和混合计算,所以该算法的运算开销也比较大。单指令多数据流扩展(SSE)指令集支持向量计算可以很好的支持光线投射算法的特性,... 光线投射算法是目前医学图像可视化领域应用范围最广、成像效果最好的算法之一。由于大量的采样、梯度、光照和混合计算,所以该算法的运算开销也比较大。单指令多数据流扩展(SSE)指令集支持向量计算可以很好的支持光线投射算法的特性,通过将梯度、光照和混合计算向量化,不仅可以明显提升算法的执行效率,而且可以绘制出高质量的可视化结果。 展开更多
关键词 医学图像可视化 光线投射 优化 单指令多数据流扩展
原文传递
基于SSE指令的大内存快速拷贝 被引量:1
2
作者 钱昌松 刘志刚 刘代志 《计算机应用研究》 CSCD 北大核心 2005年第2期113-114,120,共3页
在深入研究单指令多数据流扩展指令集(StreamingSIMDExtensions,SSE)数据传输指令操作特点的基础上,充分考虑了数据预取、数据对齐、CPU缓存和新的128位寄存器等因素,在VisualC++平台上用嵌入汇编开发了内存拷贝函数。通过实验分析了各... 在深入研究单指令多数据流扩展指令集(StreamingSIMDExtensions,SSE)数据传输指令操作特点的基础上,充分考虑了数据预取、数据对齐、CPU缓存和新的128位寄存器等因素,在VisualC++平台上用嵌入汇编开发了内存拷贝函数。通过实验分析了各内存拷贝函数拷贝速度与拷贝内存量之间的对应关系。 展开更多
关键词 单指令多数据流扩展指令 内存拷贝 MMX 代码优化
下载PDF
H.264网络视频编码优化技术研究 被引量:2
3
作者 段大高 崔岩松 邓中亮 《电视技术》 北大核心 2005年第3期22-24,27,共4页
在CDMA1x无线视频传输系统的基础上,使用IntelSSE2技术对H.264编码中的SATD(SAD)计算、亚像素内插、整数变换和量化等复杂耗时模块进行了优化,使编码器的编码速度得到显著提高。
关键词 H.264标准 单指令多数据流扩展 编码优化 无线视频传输
下载PDF
基于SIMD技术的σ-LFSR
4
作者 曾光 王政 韩文报 《计算机应用研究》 CSCD 北大核心 2008年第8期2434-2437,2443,共5页
σ-线性反馈移位寄存器(σ-LFSR)是一类适合软件快速实现的新型反馈移位寄存器。结合第二代单指令多数据流扩展指令集SSE2,设计了一类基于SIMD技术的σ-LFSR。这类σ-LFSR充分利用SSE2提供的128bit整数数据结构及其操作,获得了非常高的... σ-线性反馈移位寄存器(σ-LFSR)是一类适合软件快速实现的新型反馈移位寄存器。结合第二代单指令多数据流扩展指令集SSE2,设计了一类基于SIMD技术的σ-LFSR。这类σ-LFSR充分利用SSE2提供的128bit整数数据结构及其操作,获得了非常高的软件实现效率,同时其输出序列达到了最大周期并具有良好的随机性。所得结论表明这类基于SIMD技术的σ-LFSR可以作为适合软件实现的高速序列密码驱动部分。 展开更多
关键词 σ-线性反馈移位寄存器 单指令多数据技术 第二代单指令多数据流扩展指令 序列密码 快速软件加密
下载PDF
脉冲耦合神经网络的并行加速优化算法研究
5
作者 钟瑾 施俊 常谦 《生物医学工程学进展》 CAS 2010年第1期7-11,共5页
并行编程技术可以有效提高算法的执行效率。文中分别利用CPU的单指令多数据流扩展指令集(Streaming SIMD Extensions,SSE)技术和多核并行编程技术,对脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)分割算法进行并行编程优化,以... 并行编程技术可以有效提高算法的执行效率。文中分别利用CPU的单指令多数据流扩展指令集(Streaming SIMD Extensions,SSE)技术和多核并行编程技术,对脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)分割算法进行并行编程优化,以减少算法的运行时间。实验结果表明,SSE技术以及多核并行编程技术大大加快了PCNN分割算法的运行速度,有效提高了算法的执行效率,在一定程度上解决了该方法计算量大、耗时多的问题,具有应用于医学图像处理的潜在价值。 展开更多
关键词 脉冲耦合神经网络 单指令多数据流扩展指令集(SSE) 多核 并行编程
下载PDF
利用编译器进行地理信息系统软件的优化
6
作者 朱雷 潘懋 +2 位作者 李会军 徐绘宏 李丽勤 《计算机工程与应用》 CSCD 北大核心 2005年第13期27-28,77,共3页
在地理信息系统中需要处理的数据量越来越大的趋势下,提高软件代码的执行效率变得非常重要。论文介绍并讨论了利用编译器进行代码优化的各种情况;并采用地理信息系统中的一些空间分析的功能进行了测试。实验表明采用这种方法,提高了程... 在地理信息系统中需要处理的数据量越来越大的趋势下,提高软件代码的执行效率变得非常重要。论文介绍并讨论了利用编译器进行代码优化的各种情况;并采用地理信息系统中的一些空间分析的功能进行了测试。实验表明采用这种方法,提高了程序的运行速度,增强了程序分析处理数据的能力。 展开更多
关键词 地理信息系统 全程序优化 单指令多数据流扩展
下载PDF
基于SSE的FDTD程序设计 被引量:1
7
作者 李太全 肖柏勋 《微计算机信息》 2012年第10期31-32,67,共3页
应用单指令多数据流式扩展(SSE)指令集,实现时域有限差分算法(FDTD)的核心运算,并在考虑SSE指令的时延、执行端口和相互间相关性的前提下,进一步优化指令的排列顺序、数据的存取和FDTD循环,FDTD的迭代速度得到显著提高。通过对一组不同... 应用单指令多数据流式扩展(SSE)指令集,实现时域有限差分算法(FDTD)的核心运算,并在考虑SSE指令的时延、执行端口和相互间相关性的前提下,进一步优化指令的排列顺序、数据的存取和FDTD循环,FDTD的迭代速度得到显著提高。通过对一组不同网格数计算时间的测试,运算速度比原C语句的速度提高约2倍。 展开更多
关键词 并行计算 时域有限差分算法 单指令多数据流扩展
下载PDF
SIMD非对齐访存结构设计与实现 被引量:3
8
作者 余成龙 王永文 《计算机工程》 CAS CSCD 北大核心 2016年第9期1-4,共4页
单指令流多数据流(SIMD)是实现数据级并行的有效方法,但访问地址非对齐的数据严重影响程序的向量化,造成处理器性能下降。为降低非对齐访存延时,对高性能应用程序的访存结构进行建模,设计并实现SIMD分离缓冲行非对齐访存结构与双体cach... 单指令流多数据流(SIMD)是实现数据级并行的有效方法,但访问地址非对齐的数据严重影响程序的向量化,造成处理器性能下降。为降低非对齐访存延时,对高性能应用程序的访存结构进行建模,设计并实现SIMD分离缓冲行非对齐访存结构与双体cache非对齐访存结构。实验结果表明,在双体cache非对齐访存结构下,通过两数组相加与SIMD向量化实现的非对齐访存代码可达到对齐访存代码性能的99%,提高了SIMD向量化的访存效率。 展开更多
关键词 高性能计算 数据级并行 向量化 单指令多数据流扩展 非对齐访存 Gem5模拟器
下载PDF
基于SSE技术的H.264运动估计的并行处理
9
作者 李小红 《合肥学院学报(自然科学版)》 2005年第3期21-24,共4页
H.264标准是ITU-T视频编码专家组(VCEG)和ISO/IECMPEG委员会正在制定的用于视频通信的新一代视频编码标准。运动估计是H.264最关键技术,占计算量的主要部分,因而成为视频压缩处理的瓶颈,因此必须研究运动估计的并行处理算法。通过介绍SS... H.264标准是ITU-T视频编码专家组(VCEG)和ISO/IECMPEG委员会正在制定的用于视频通信的新一代视频编码标准。运动估计是H.264最关键技术,占计算量的主要部分,因而成为视频压缩处理的瓶颈,因此必须研究运动估计的并行处理算法。通过介绍SSE技术的特点、数据结构和内联函数,在此基础上用SSE技术实现了运动估计并行算法。 展开更多
关键词 H.264 运动估计 单指令多数据流扩展技术 单指令多数据技术
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部