摘要
针对H.265整数运动估计算法参考块更新模块中数据传输量大、运行速度慢等问题,在分析参考块间数据相关性的基础上,提出了能够减少硬件使用资源,提高运行效率的并行方案。该方案采用18×17个处理元阵列,通过相邻参考块之间3个方向数据重合的关系设计了3个缓存区,更新时根据参考块之间的关系定位缓存区,然后从外存加载相应的参考块数据。该方案中的资源占用量相比传统设计降至1/16。实验结果表明,该方案可以将数据复用率提高到98.4%,有效降低了整数运动估计算法的带宽需求。
To improve the processing time of reference block updating scheme in H.265,the paper proposes a paralleling method that can reduce hardware resources and improve the efficiency.Based on analyzing the relationship of data overlap among reference blocks,the paper uses 18 × 17 array of processing elements and three cache regions in three directions.Then selects? cache region and loads reference block data from external memory according to data overlap direction.The resource usage of parallel scheme reaches 1/16 compared with traditional design.Experimental resuhs show that data multiplex rate of this parallel scheme reaches 98.4%,the bandwidth requirements reducing is clearly.
作者
谢晓燕
雷祥
崔继兴
XIE Xiaoyan;LEI Xiang;CUI Jixing(School of Computer,Xi' an University of Posts and Telecommunications,Xi' an 710061, China)
出处
《电视技术》
北大核心
2017年第11期1-5,共5页
Video Engineering
基金
国家自然基金面上项目(61272120)
陕西省科技基金统筹创新工程项目(2016KTZDGY02-04-02)
国家自然科学基金青年科学基金项目(61602377)
国家科技重大专项(2016ZX03001003-006)
西安邮电大学教学改革项目(JGZ201403
JGZ201404)
关键词
参考块更新
整数运动估计
阵列处理器
并行化
reference block updating
integer motion estimation
array processor
parallelization