期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
9
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于单指令多数据流扩展的光线投射算法优化
1
作者
邹云鹏
齐季
康雁
《生物医学工程学杂志》
CAS
CSCD
北大核心
2012年第2期212-216,共5页
光线投射算法是目前医学图像可视化领域应用范围最广、成像效果最好的算法之一。由于大量的采样、梯度、光照和混合计算,所以该算法的运算开销也比较大。单指令多数据流扩展(SSE)指令集支持向量计算可以很好的支持光线投射算法的特性,...
光线投射算法是目前医学图像可视化领域应用范围最广、成像效果最好的算法之一。由于大量的采样、梯度、光照和混合计算,所以该算法的运算开销也比较大。单指令多数据流扩展(SSE)指令集支持向量计算可以很好的支持光线投射算法的特性,通过将梯度、光照和混合计算向量化,不仅可以明显提升算法的执行效率,而且可以绘制出高质量的可视化结果。
展开更多
关键词
医学图像可视化
光线投射
优化
单指令多数据流扩展
原文传递
基于SSE指令的大内存快速拷贝
被引量:
1
2
作者
钱昌松
刘志刚
刘代志
《计算机应用研究》
CSCD
北大核心
2005年第2期113-114,120,共3页
在深入研究单指令多数据流扩展指令集(StreamingSIMDExtensions,SSE)数据传输指令操作特点的基础上,充分考虑了数据预取、数据对齐、CPU缓存和新的128位寄存器等因素,在VisualC++平台上用嵌入汇编开发了内存拷贝函数。通过实验分析了各...
在深入研究单指令多数据流扩展指令集(StreamingSIMDExtensions,SSE)数据传输指令操作特点的基础上,充分考虑了数据预取、数据对齐、CPU缓存和新的128位寄存器等因素,在VisualC++平台上用嵌入汇编开发了内存拷贝函数。通过实验分析了各内存拷贝函数拷贝速度与拷贝内存量之间的对应关系。
展开更多
关键词
单指令多数据流扩展
指令
集
内存拷贝
MMX
代码优化
下载PDF
职称材料
H.264网络视频编码优化技术研究
被引量:
2
3
作者
段大高
崔岩松
邓中亮
《电视技术》
北大核心
2005年第3期22-24,27,共4页
在CDMA1x无线视频传输系统的基础上,使用IntelSSE2技术对H.264编码中的SATD(SAD)计算、亚像素内插、整数变换和量化等复杂耗时模块进行了优化,使编码器的编码速度得到显著提高。
关键词
H.264标准
单指令多数据流扩展
编码优化
无线视频传输
下载PDF
职称材料
基于SIMD技术的σ-LFSR
4
作者
曾光
王政
韩文报
《计算机应用研究》
CSCD
北大核心
2008年第8期2434-2437,2443,共5页
σ-线性反馈移位寄存器(σ-LFSR)是一类适合软件快速实现的新型反馈移位寄存器。结合第二代单指令多数据流扩展指令集SSE2,设计了一类基于SIMD技术的σ-LFSR。这类σ-LFSR充分利用SSE2提供的128bit整数数据结构及其操作,获得了非常高的...
σ-线性反馈移位寄存器(σ-LFSR)是一类适合软件快速实现的新型反馈移位寄存器。结合第二代单指令多数据流扩展指令集SSE2,设计了一类基于SIMD技术的σ-LFSR。这类σ-LFSR充分利用SSE2提供的128bit整数数据结构及其操作,获得了非常高的软件实现效率,同时其输出序列达到了最大周期并具有良好的随机性。所得结论表明这类基于SIMD技术的σ-LFSR可以作为适合软件实现的高速序列密码驱动部分。
展开更多
关键词
σ-线性反馈移位寄存器
单指令
多数
据技术
第二代
单指令多数据流扩展
指令
集
序列密码
快速软件加密
下载PDF
职称材料
脉冲耦合神经网络的并行加速优化算法研究
5
作者
钟瑾
施俊
常谦
《生物医学工程学进展》
CAS
2010年第1期7-11,共5页
并行编程技术可以有效提高算法的执行效率。文中分别利用CPU的单指令多数据流扩展指令集(Streaming SIMD Extensions,SSE)技术和多核并行编程技术,对脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)分割算法进行并行编程优化,以...
并行编程技术可以有效提高算法的执行效率。文中分别利用CPU的单指令多数据流扩展指令集(Streaming SIMD Extensions,SSE)技术和多核并行编程技术,对脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)分割算法进行并行编程优化,以减少算法的运行时间。实验结果表明,SSE技术以及多核并行编程技术大大加快了PCNN分割算法的运行速度,有效提高了算法的执行效率,在一定程度上解决了该方法计算量大、耗时多的问题,具有应用于医学图像处理的潜在价值。
展开更多
关键词
脉冲耦合神经网络
单指令多数据流扩展
指令
集(SSE)
多核
并行编程
下载PDF
职称材料
利用编译器进行地理信息系统软件的优化
6
作者
朱雷
潘懋
+2 位作者
李会军
徐绘宏
李丽勤
《计算机工程与应用》
CSCD
北大核心
2005年第13期27-28,77,共3页
在地理信息系统中需要处理的数据量越来越大的趋势下,提高软件代码的执行效率变得非常重要。论文介绍并讨论了利用编译器进行代码优化的各种情况;并采用地理信息系统中的一些空间分析的功能进行了测试。实验表明采用这种方法,提高了程...
在地理信息系统中需要处理的数据量越来越大的趋势下,提高软件代码的执行效率变得非常重要。论文介绍并讨论了利用编译器进行代码优化的各种情况;并采用地理信息系统中的一些空间分析的功能进行了测试。实验表明采用这种方法,提高了程序的运行速度,增强了程序分析处理数据的能力。
展开更多
关键词
地理信息系统
全程序优化
单指令
多数据流
式
扩展
下载PDF
职称材料
基于SSE的FDTD程序设计
被引量:
1
7
作者
李太全
肖柏勋
《微计算机信息》
2012年第10期31-32,67,共3页
应用单指令多数据流式扩展(SSE)指令集,实现时域有限差分算法(FDTD)的核心运算,并在考虑SSE指令的时延、执行端口和相互间相关性的前提下,进一步优化指令的排列顺序、数据的存取和FDTD循环,FDTD的迭代速度得到显著提高。通过对一组不同...
应用单指令多数据流式扩展(SSE)指令集,实现时域有限差分算法(FDTD)的核心运算,并在考虑SSE指令的时延、执行端口和相互间相关性的前提下,进一步优化指令的排列顺序、数据的存取和FDTD循环,FDTD的迭代速度得到显著提高。通过对一组不同网格数计算时间的测试,运算速度比原C语句的速度提高约2倍。
展开更多
关键词
并行计算
时域有限差分算法
单指令
多数据流
式
扩展
下载PDF
职称材料
SIMD非对齐访存结构设计与实现
被引量:
3
8
作者
余成龙
王永文
《计算机工程》
CAS
CSCD
北大核心
2016年第9期1-4,共4页
单指令流多数据流(SIMD)是实现数据级并行的有效方法,但访问地址非对齐的数据严重影响程序的向量化,造成处理器性能下降。为降低非对齐访存延时,对高性能应用程序的访存结构进行建模,设计并实现SIMD分离缓冲行非对齐访存结构与双体cach...
单指令流多数据流(SIMD)是实现数据级并行的有效方法,但访问地址非对齐的数据严重影响程序的向量化,造成处理器性能下降。为降低非对齐访存延时,对高性能应用程序的访存结构进行建模,设计并实现SIMD分离缓冲行非对齐访存结构与双体cache非对齐访存结构。实验结果表明,在双体cache非对齐访存结构下,通过两数组相加与SIMD向量化实现的非对齐访存代码可达到对齐访存代码性能的99%,提高了SIMD向量化的访存效率。
展开更多
关键词
高性能计算
数据
级并行
向量化
单指令
流
多数据流
扩展
非对齐访存
Gem5模拟器
下载PDF
职称材料
基于SSE技术的H.264运动估计的并行处理
9
作者
李小红
《合肥学院学报(自然科学版)》
2005年第3期21-24,共4页
H.264标准是ITU-T视频编码专家组(VCEG)和ISO/IECMPEG委员会正在制定的用于视频通信的新一代视频编码标准。运动估计是H.264最关键技术,占计算量的主要部分,因而成为视频压缩处理的瓶颈,因此必须研究运动估计的并行处理算法。通过介绍SS...
H.264标准是ITU-T视频编码专家组(VCEG)和ISO/IECMPEG委员会正在制定的用于视频通信的新一代视频编码标准。运动估计是H.264最关键技术,占计算量的主要部分,因而成为视频压缩处理的瓶颈,因此必须研究运动估计的并行处理算法。通过介绍SSE技术的特点、数据结构和内联函数,在此基础上用SSE技术实现了运动估计并行算法。
展开更多
关键词
H.264
运动估计
单指令
多数据流
式
扩展
技术
单指令
多数
据技术
下载PDF
职称材料
题名
基于单指令多数据流扩展的光线投射算法优化
1
作者
邹云鹏
齐季
康雁
机构
东北大学中荷生物医学与信息工程学院
东北大学医学影像计算教育部重点实验室
出处
《生物医学工程学杂志》
CAS
CSCD
北大核心
2012年第2期212-216,共5页
基金
国家自然科学基金资助项目(61071213
60771067)
文摘
光线投射算法是目前医学图像可视化领域应用范围最广、成像效果最好的算法之一。由于大量的采样、梯度、光照和混合计算,所以该算法的运算开销也比较大。单指令多数据流扩展(SSE)指令集支持向量计算可以很好的支持光线投射算法的特性,通过将梯度、光照和混合计算向量化,不仅可以明显提升算法的执行效率,而且可以绘制出高质量的可视化结果。
关键词
医学图像可视化
光线投射
优化
单指令多数据流扩展
Keywords
Medical image visualization
Ray-casting
Optimization
Streaming single instruction multiple datum extensions(SSE)
分类号
R445 [医药卫生—影像医学与核医学]
TP391.41 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于SSE指令的大内存快速拷贝
被引量:
1
2
作者
钱昌松
刘志刚
刘代志
机构
第二炮兵工程学院
出处
《计算机应用研究》
CSCD
北大核心
2005年第2期113-114,120,共3页
基金
国家自然科学基金资助项目(40274044)
文摘
在深入研究单指令多数据流扩展指令集(StreamingSIMDExtensions,SSE)数据传输指令操作特点的基础上,充分考虑了数据预取、数据对齐、CPU缓存和新的128位寄存器等因素,在VisualC++平台上用嵌入汇编开发了内存拷贝函数。通过实验分析了各内存拷贝函数拷贝速度与拷贝内存量之间的对应关系。
关键词
单指令多数据流扩展
指令
集
内存拷贝
MMX
代码优化
Keywords
Streaming SIMD Extensions(SSE)
Memory Copy
MMX
Code Optimization
分类号
TP319 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
H.264网络视频编码优化技术研究
被引量:
2
3
作者
段大高
崔岩松
邓中亮
机构
北京邮电大学
出处
《电视技术》
北大核心
2005年第3期22-24,27,共4页
文摘
在CDMA1x无线视频传输系统的基础上,使用IntelSSE2技术对H.264编码中的SATD(SAD)计算、亚像素内插、整数变换和量化等复杂耗时模块进行了优化,使编码器的编码速度得到显著提高。
关键词
H.264标准
单指令多数据流扩展
编码优化
无线视频传输
Keywords
H.264
Streaming SIMD Extensions(SSE)
code optimization
wireless video transmission
分类号
TN919.81 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
基于SIMD技术的σ-LFSR
4
作者
曾光
王政
韩文报
机构
解放军信息工程大学信息工程学院信息研究系
出处
《计算机应用研究》
CSCD
北大核心
2008年第8期2434-2437,2443,共5页
基金
国家自然科学基金资助项目(60503011)
国家"863"计划资助项目(2006AA01Z425)
国家"973"计划资助项目(2007CB807902)
文摘
σ-线性反馈移位寄存器(σ-LFSR)是一类适合软件快速实现的新型反馈移位寄存器。结合第二代单指令多数据流扩展指令集SSE2,设计了一类基于SIMD技术的σ-LFSR。这类σ-LFSR充分利用SSE2提供的128bit整数数据结构及其操作,获得了非常高的软件实现效率,同时其输出序列达到了最大周期并具有良好的随机性。所得结论表明这类基于SIMD技术的σ-LFSR可以作为适合软件实现的高速序列密码驱动部分。
关键词
σ-线性反馈移位寄存器
单指令
多数
据技术
第二代
单指令多数据流扩展
指令
集
序列密码
快速软件加密
Keywords
σ-linear feedback shift register
single-istruction muhiple-data
streaming single-istruction multiple-data exten-sons 2
stream cipher
fast software encryption
分类号
TP309.7 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
脉冲耦合神经网络的并行加速优化算法研究
5
作者
钟瑾
施俊
常谦
机构
上海大学通信与信息工程学院
出处
《生物医学工程学进展》
CAS
2010年第1期7-11,共5页
基金
国家自然科学基金资助项目(60701021)
上海市教育委员会科研创新项目(09YZ15)
上海市教委重点学科建设项目(J50104)
文摘
并行编程技术可以有效提高算法的执行效率。文中分别利用CPU的单指令多数据流扩展指令集(Streaming SIMD Extensions,SSE)技术和多核并行编程技术,对脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)分割算法进行并行编程优化,以减少算法的运行时间。实验结果表明,SSE技术以及多核并行编程技术大大加快了PCNN分割算法的运行速度,有效提高了算法的执行效率,在一定程度上解决了该方法计算量大、耗时多的问题,具有应用于医学图像处理的潜在价值。
关键词
脉冲耦合神经网络
单指令多数据流扩展
指令
集(SSE)
多核
并行编程
Keywords
pulse coupled neural network
streaming SIMD extensions(SSE)
multi-core
parallel programming
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
利用编译器进行地理信息系统软件的优化
6
作者
朱雷
潘懋
李会军
徐绘宏
李丽勤
机构
北京大学造山带与地壳演化教育部重点实验室
北京市信息化促进中心
出处
《计算机工程与应用》
CSCD
北大核心
2005年第13期27-28,77,共3页
基金
国家863高技术研究发展计划资助项目(编号:2001AA135180)
文摘
在地理信息系统中需要处理的数据量越来越大的趋势下,提高软件代码的执行效率变得非常重要。论文介绍并讨论了利用编译器进行代码优化的各种情况;并采用地理信息系统中的一些空间分析的功能进行了测试。实验表明采用这种方法,提高了程序的运行速度,增强了程序分析处理数据的能力。
关键词
地理信息系统
全程序优化
单指令
多数据流
式
扩展
Keywords
GIS,WPO,SSE
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于SSE的FDTD程序设计
被引量:
1
7
作者
李太全
肖柏勋
机构
长江大学物理科学与技术学院
长江大学地球物理与石油资源学院
出处
《微计算机信息》
2012年第10期31-32,67,共3页
文摘
应用单指令多数据流式扩展(SSE)指令集,实现时域有限差分算法(FDTD)的核心运算,并在考虑SSE指令的时延、执行端口和相互间相关性的前提下,进一步优化指令的排列顺序、数据的存取和FDTD循环,FDTD的迭代速度得到显著提高。通过对一组不同网格数计算时间的测试,运算速度比原C语句的速度提高约2倍。
关键词
并行计算
时域有限差分算法
单指令
多数据流
式
扩展
Keywords
Parallel Algorithm
the Finite Difference of Time Domain method
Streaming SEVID Extensions
分类号
TN01 [电子电信—物理电子学]
下载PDF
职称材料
题名
SIMD非对齐访存结构设计与实现
被引量:
3
8
作者
余成龙
王永文
机构
国防科学技术大学计算机学院
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第9期1-4,共4页
基金
国家自然科学基金资助项目"面向超高性能计算的众线程宽向量微体系结构研究"(61170045)
文摘
单指令流多数据流(SIMD)是实现数据级并行的有效方法,但访问地址非对齐的数据严重影响程序的向量化,造成处理器性能下降。为降低非对齐访存延时,对高性能应用程序的访存结构进行建模,设计并实现SIMD分离缓冲行非对齐访存结构与双体cache非对齐访存结构。实验结果表明,在双体cache非对齐访存结构下,通过两数组相加与SIMD向量化实现的非对齐访存代码可达到对齐访存代码性能的99%,提高了SIMD向量化的访存效率。
关键词
高性能计算
数据
级并行
向量化
单指令
流
多数据流
扩展
非对齐访存
Gem5模拟器
Keywords
high-performance computing
Data Level Parallelism ( DLP )
vectorization
Single Instruction Multiple Data (SIMD) extension
unaligned memory access
Gem5 simulator
分类号
TP302.2 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于SSE技术的H.264运动估计的并行处理
9
作者
李小红
机构
合肥工业大学计算机与信息学院
出处
《合肥学院学报(自然科学版)》
2005年第3期21-24,共4页
基金
安徽省教育厅高校青年教师科研资助计划项目(2005jq1009)资助。
文摘
H.264标准是ITU-T视频编码专家组(VCEG)和ISO/IECMPEG委员会正在制定的用于视频通信的新一代视频编码标准。运动估计是H.264最关键技术,占计算量的主要部分,因而成为视频压缩处理的瓶颈,因此必须研究运动估计的并行处理算法。通过介绍SSE技术的特点、数据结构和内联函数,在此基础上用SSE技术实现了运动估计并行算法。
关键词
H.264
运动估计
单指令
多数据流
式
扩展
技术
单指令
多数
据技术
Keywords
H. 264
motion estimate
SSE
SIMD
分类号
TN919.81 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于单指令多数据流扩展的光线投射算法优化
邹云鹏
齐季
康雁
《生物医学工程学杂志》
CAS
CSCD
北大核心
2012
0
原文传递
2
基于SSE指令的大内存快速拷贝
钱昌松
刘志刚
刘代志
《计算机应用研究》
CSCD
北大核心
2005
1
下载PDF
职称材料
3
H.264网络视频编码优化技术研究
段大高
崔岩松
邓中亮
《电视技术》
北大核心
2005
2
下载PDF
职称材料
4
基于SIMD技术的σ-LFSR
曾光
王政
韩文报
《计算机应用研究》
CSCD
北大核心
2008
0
下载PDF
职称材料
5
脉冲耦合神经网络的并行加速优化算法研究
钟瑾
施俊
常谦
《生物医学工程学进展》
CAS
2010
0
下载PDF
职称材料
6
利用编译器进行地理信息系统软件的优化
朱雷
潘懋
李会军
徐绘宏
李丽勤
《计算机工程与应用》
CSCD
北大核心
2005
0
下载PDF
职称材料
7
基于SSE的FDTD程序设计
李太全
肖柏勋
《微计算机信息》
2012
1
下载PDF
职称材料
8
SIMD非对齐访存结构设计与实现
余成龙
王永文
《计算机工程》
CAS
CSCD
北大核心
2016
3
下载PDF
职称材料
9
基于SSE技术的H.264运动估计的并行处理
李小红
《合肥学院学报(自然科学版)》
2005
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部