期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于CUDA的H.264并行解码器设计与实现 被引量:2
1
作者 陈勇 吴晓民 +1 位作者 杨坚 奚宏生 《计算机工程》 CAS CSCD 北大核心 2016年第5期249-252,257,共5页
针对H.264视频编解码标准复杂度高、运算量大的缺点,基于统一计算设备架构平台设计并实现CPU+GPU异构并行H.264解码器,利用GPU的并行计算能力和CPU的逻辑控制优势加快运行速度,提高解码性能。实验结果表明,与FFmpege中传统的串... 针对H.264视频编解码标准复杂度高、运算量大的缺点,基于统一计算设备架构平台设计并实现CPU+GPU异构并行H.264解码器,利用GPU的并行计算能力和CPU的逻辑控制优势加快运行速度,提高解码性能。实验结果表明,与FFmpege中传统的串行解码器相比,利用GPU加速的H.264并行解码器能获得2倍~7倍的性能提升,各并行单独模块也可实现5倍~11倍的加速。 展开更多
关键词 图形处理器 统一计算设备架构平台 H.264标准 视频编解码器 并行化
下载PDF
可重构视频阵列处理器簇内存储结构设计与实现 被引量:2
2
作者 郭佳乐 蒋林 +2 位作者 山蕊 崔朋飞 武鑫 《微电子学与计算机》 CSCD 北大核心 2017年第9期116-120,125,共6页
提出了一种簇内高效并行访问存储结构.该结构采用"逻辑共享、物理分布"多个存储块并行存储的方法,实现了4×4视频阵列处理器的并行访问.实验结果表明,在无冲突情况下,该结构支持16个轻核处理元的同时读/写操作,最高频率20... 提出了一种簇内高效并行访问存储结构.该结构采用"逻辑共享、物理分布"多个存储块并行存储的方法,实现了4×4视频阵列处理器的并行访问.实验结果表明,在无冲突情况下,该结构支持16个轻核处理元的同时读/写操作,最高频率200 MHz,访存峰值带宽6.25GB/s.最后对8×8二维离散余弦变换算法进行映射实现和性能比较发现,簇内存储结构能够为该算法提供312.2Msamples/s的数据访存带宽,相较于同类型阵列结构,执行周期数降低了31.67%,工作频率提高了一倍,访存带宽增加了192.60%. 展开更多
关键词 阵列处理器 存储结构 并行存储 视频编解码
下载PDF
基于HEVC视频编码标准的并行解码策略研究 被引量:1
3
作者 刘争艳 李劲禾 李絮 《阜阳师范学院学报(自然科学版)》 2015年第1期54-57,77,共5页
将并行化策略引入到新一代HEVC视频编码的标准中,提出一种在解码阶段的熵片中应用并行策略的算法。通过将每行最大编码单元(LCU)作为一个熵片来编码视频,以波阵面并行的方式解码多行LCU。算法在配置为12 Intel Xeon Cores、3.3 GHz的PC... 将并行化策略引入到新一代HEVC视频编码的标准中,提出一种在解码阶段的熵片中应用并行策略的算法。通过将每行最大编码单元(LCU)作为一个熵片来编码视频,以波阵面并行的方式解码多行LCU。算法在配置为12 Intel Xeon Cores、3.3 GHz的PC机上进行了评估测试。其结果显示,在视频分辨率为1 920×1 080 p(53.1 fps)和2 560×1 600(29.5 fps)引入并行化策略后的执行速度与采用顺序执行时的执行速度相比较有了显著的提高,并且能够达到很好的实时性效果。 展开更多
关键词 视频编解码 HEVC 并行处理 高清视频
下载PDF
DVCPRO HD并行解码算法的研究与实现
4
作者 王祥远 王兴东 宋利 《信息技术》 2009年第7期72-74,共3页
DVCPRO HD标准广泛应用于广播电影电视前端的视频压缩,在普通的PC平台上每帧解码耗时需80到100ms,经过汇编优化后城需40到60ms,在优化比较好的情况下能达到实时解码播放的需求。GPU具有强大的并行处理能力,而DVCPRO HD的视频单元间耦合... DVCPRO HD标准广泛应用于广播电影电视前端的视频压缩,在普通的PC平台上每帧解码耗时需80到100ms,经过汇编优化后城需40到60ms,在优化比较好的情况下能达到实时解码播放的需求。GPU具有强大的并行处理能力,而DVCPRO HD的视频单元间耦合性小,适应于并行处理。充分利用GPU的并行性和强大的浮点运算功能,在CUDA开发环境下对其进行并行解码优化,可远远超过实时解码的要求。 展开更多
关键词 DVCPRO HD GPU CUDA 编解码并行
下载PDF
宽带信号处理器BSP-15
5
作者 江锦业 陈生潭 《现代电子技术》 2005年第5期101-103,共3页
随着多媒体技术的广泛应用 ,采用 DSP芯片设计多媒体设备 ,成为人们关注的方向 ,但是 ,对于可编程的媒体处理器的需求也很高。因此 ,一种新型的 DSP芯片媒体处理器 (Media Processor)应运而生 ,并很快得到业界的广泛关注 ,而本文介绍的 ... 随着多媒体技术的广泛应用 ,采用 DSP芯片设计多媒体设备 ,成为人们关注的方向 ,但是 ,对于可编程的媒体处理器的需求也很高。因此 ,一种新型的 DSP芯片媒体处理器 (Media Processor)应运而生 ,并很快得到业界的广泛关注 ,而本文介绍的 BSP 15正是一款典型的媒体处理器。 BSP 15是专门以视频应用为中心而设计的高效 DSP,以高度集成的单芯片满足了宽带产品的需要。本文介绍了 BSP 15的性能、结构及其软件开发 ,并给出了基于 BSP 15的软件并行设计。 展开更多
关键词 宽带信号处理器 超长指令字 变长编解码 并行设计
下载PDF
高速并行RS编译码系统实现技术
6
作者 王福文 董燕琴 李兵 《微处理机》 2001年第4期55-60,共6页
给出了一种高速并行 RS编译码系统的实现方法 ,并就其中的几个关键技术进行了分析。采用该技术实现的纠错系统 ,可以使误码率在 1 0 -3的情况下仍保证数据的高可靠。
关键词 并行RS编译码系统 通信 纠错编码理论 磁盘阵列
下载PDF
嵌入式SIMD处理器上G.729的优化方法研究
7
作者 李图平 龚素文 《计算机工程与应用》 CSCD 北大核心 2007年第3期139-141,共3页
首先介绍了G.729语音编解码器算法原理以及嵌入式SIMD处理器VFASTDSP芯片的结构性能,重点讨论了系统实现过程中的VP6汇编代码优化、调度策略以及各功能模块并行算法的设计优化。实践证明,优化后的编码器在384K的网络带宽下可以得到无延... 首先介绍了G.729语音编解码器算法原理以及嵌入式SIMD处理器VFASTDSP芯片的结构性能,重点讨论了系统实现过程中的VP6汇编代码优化、调度策略以及各功能模块并行算法的设计优化。实践证明,优化后的编码器在384K的网络带宽下可以得到无延迟、主观音质完美的通话效果,达到商用的需求。 展开更多
关键词 G.729 语音编码器 DSP 并行算法 实时
下载PDF
Fault-Tolerant Design of Spaceborne Mass Memory System
8
作者 张宇宁 常亮 +1 位作者 杨根庆 李华旺 《Transactions of Tianjin University》 EI CAS 2010年第1期17-21,共5页
A fault-tolerant spaceborne mass memory architecture is presented based on entirely commercial-off-theshelf components.The highly modularized and scalable memory kernel supports the hierarchical design and is well sui... A fault-tolerant spaceborne mass memory architecture is presented based on entirely commercial-off-theshelf components.The highly modularized and scalable memory kernel supports the hierarchical design and is well suited to redundancy structure.Error correcting code(ECC) and periodical scrubbing are used to deal with bit errors induced by single event upset.For 8-bit wide devices, the parallel Reed Solomon(10, 8) can perform coder/decoder calculations in one clock cycle, achieving a data rate of several Gb/... 展开更多
关键词 fault-tolerant memory architecture data integrity parallel Reed-Solomon codec
下载PDF
基于申威421的视频解码的向量化并行
9
作者 裴航 王磊 +1 位作者 王威 张书钦 《计算机技术与发展》 2021年第10期81-86,共6页
H.264解码器在申威平台移植后遇到解码效率低,视频播放不流畅等问题。为提升视频解码性能,满足国产申威平台用户的多媒体需求,首先对FFmpeg开源编解码库中H.264解码器进行了详细分析,使用性能分析工具找到视频解码的热点函数。然后充分... H.264解码器在申威平台移植后遇到解码效率低,视频播放不流畅等问题。为提升视频解码性能,满足国产申威平台用户的多媒体需求,首先对FFmpeg开源编解码库中H.264解码器进行了详细分析,使用性能分析工具找到视频解码的热点函数。然后充分利用申威处理器的向量扩展部件,对解码器运动补偿、DCT反变换等关键模块代码使用手工嵌入式汇编进行向量指令替换来缩短指令周期,实现向量化并行。最后对环路滤波代码中不能直接向量化的循环通过数组重组等方式满足向量化分析,然后进行向量化计算,更深层次挖掘多媒体并行能力,从而提升多媒体程序运行速度。实验结果表明,向量化后的视频解码性能最高提升了35.3%,释放了CPU资源,解决了视频播放不流畅的问题,有效推动了申威处理器市场化发展。 展开更多
关键词 H.264解码器 FFmpeg编解码库 申威处理器 单指令多数据流 并行计算
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部