-
题名H.264编码器的SSE2指令级优化
被引量:1
- 1
-
-
作者
王琰
向校萱
祁燕
-
机构
沈阳理工大学信息科学与工程学院
-
出处
《计算机工程与应用》
CSCD
2012年第10期217-221,共5页
-
基金
辽宁省高等学校科技计划项目(No.1810162)
-
文摘
H.264视频编码标准采用了很多新技术,具有更优越的编码效率,同时也增加了计算复杂度,无法满足实时应用。由于单指令多数据扩展指令集2(SSE2)的并行运算能力可以提高计算机对多媒体数据的实时处理。文中主要采用了SSE2对H.264中的一些耗时较多的关键模块,例如整数像素运动估计中计算SAD、整数DCT变换、量化、Hadamard变换以及亚像素运动估计中计算SATD进行了指令级优化。实验结果表明,经过优化后,在保持视频图像质量的前提下,相应模块运行速度得到了提高,使H.264编码器整体的编码速度较好地满足实时要求。
-
关键词
H.264编码
绝对误差和
整数DCT变换
变换绝对差值总和
单指令多数据扩展指令集2(SSE2)
-
Keywords
H.264 encoding
Sum of Absolute Difference(SAD)
integer DCT
Sum of Absolute Transformed Dif-ference(SATD)
Streaming SIMD Extensions 2(SSE2)
-
分类号
TN919.81
[电子电信—通信与信息系统]
-
-
题名等效环路时域有限差分算法及其核内加速技术
- 2
-
-
作者
刘立国
莫锦军
付云起
袁乃昌
-
机构
国防科学技术大学电子科学与工程学院
-
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2013年第6期1138-1142,共5页
-
基金
国家自然科学基金(60871069)
新世纪优秀人才支持计划(NCET-10-0894)资助课题
-
文摘
提出了一种新颖的有限差分算法——等效环路有限差分算法。这种算法借鉴传输线算法的思想,在Yee氏网格中引入集总元件的概念,由于其良好的物理思想,可实现对于色散介质的仿真计算。单指令多数据指令集(streaming single-instruction multiple-data extensions,SSE)技术是Intel公司提出的核内并行加速技术,普通的个人电脑都支持这种技术。结合SSE技术,可实现对算法的有效加速,这种加速技术无须硬件的改进即可实现理论上最高4倍的加速。分别利用等效环路有限差分算法、普通有限差分算法仿真计算了平面倒F天线(pla-nar inverted-F antenna,PIFA)的端口反射系数和天线方向图,并与实测数据进行了比较,验证了算法的正确性。在实际的运算中,使用SSE技术普遍可实现2倍以上的加速比,加速算法的有效性得到了验证。
-
关键词
等效环路
时域有限差分
加速比
单指令多数据指令集
集总元件
-
Keywords
equivalent circuit
finite difference time domain (FDTD)
speedup ratio
streaming single in struction multiple-data extensions (SSE)
lumped element
-
分类号
O411
[理学—理论物理]
-