期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
HXDSP平台上矩阵乘法的实现与性能分析 被引量:4
1
作者 刘余福 郎文辉 贾光帅 《计算机工程》 CAS CSCD 北大核心 2019年第4期25-29,共5页
在向量处理器上进行矩阵运算时硬件资源利用率与数据处理能力较低。为此,基于魂芯数字信号处理器(HXDSP)平台,结合高效视频编码(HEVC)标准中的离散余弦变换算法,采用数据压缩式向量法实现矩阵乘法,以发挥向量处理器的硬件资源。实验结... 在向量处理器上进行矩阵运算时硬件资源利用率与数据处理能力较低。为此,基于魂芯数字信号处理器(HXDSP)平台,结合高效视频编码(HEVC)标准中的离散余弦变换算法,采用数据压缩式向量法实现矩阵乘法,以发挥向量处理器的硬件资源。实验结果表明,该方法可达到HXDSP的定点乘累加运算能力峰值32 GMACs,数据处理能力可达2 GPixel/s,满足HEVC编码标准的性能要求。 展开更多
关键词 魂芯数字信号处理器 矩阵乘法 数据压缩 向量法 高效视频编码标准 离散余弦变换算法
下载PDF
HXDSP上IDCT变换的数据压缩式向量化设计及实现 被引量:4
2
作者 段苓丽 郎文辉 +1 位作者 刘余福 贾光帅 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2020年第4期474-479,共6页
二维离散余弦逆变换(inverse discrete cosine transform,IDCT)是视频解码算法的核心模块之一,也是视频解码算法中运算量和耗时最多的部分,因此提高解码速度的重点在于如何提高IDCT的运算速度。文章基于魂芯数字信号处理器(HXDSP)平台,... 二维离散余弦逆变换(inverse discrete cosine transform,IDCT)是视频解码算法的核心模块之一,也是视频解码算法中运算量和耗时最多的部分,因此提高解码速度的重点在于如何提高IDCT的运算速度。文章基于魂芯数字信号处理器(HXDSP)平台,结合openHEVC中的IDCT算法,设计并实现了一种数据压缩式向量法,该方法利用HXDSP的现有硬件资源构建向量处理器,并将2个相邻的运算数据压缩至寄存器的高位和低位同时参与计算,在硬件资源和周期不变的情况下,数据运算量提高了50%。测试结果表明该算法的运算速度达到了HXDSP的计算峰值32 GMACS,为openHEVC解码器的DSP优化提供了重要的参考。 展开更多
关键词 openHEVC工程 HXDSP硬件平台 矩阵乘法 数据压缩 向量化
下载PDF
BWDSP上HEVC运动估计的实现及存储器访问优化 被引量:1
3
作者 贾尚柱 郎文辉 +1 位作者 曾飞洋 刘余福 《电脑知识与技术(过刊)》 2017年第4X期178-180,共3页
运动估计技术是利用视频帧中之前已编码图像为当前图像的每个像素块寻找一个最佳匹配块。运动估计过程中主要包括了运动搜索、亚像素插值和MV预测技术,在运动估计过程中,存在着大量的计算。为保证硬件编码的实时性,我们结合BWDSP体系结... 运动估计技术是利用视频帧中之前已编码图像为当前图像的每个像素块寻找一个最佳匹配块。运动估计过程中主要包括了运动搜索、亚像素插值和MV预测技术,在运动估计过程中,存在着大量的计算。为保证硬件编码的实时性,我们结合BWDSP体系结构的特征,采用存储器访问优化和代码级优化技术,实现了基于循环buffer的运动估计算法。实验表明,在BWDSP仿真环境下,该优化方法减少了代码执行所需的时钟周期,提高了编码器性能。 展开更多
关键词 运动估计 BWDSP 视频编码 亚像素插值 循环buffer
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部