期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
HXDSP平台上矩阵乘法的实现与性能分析
被引量:
4
1
作者
刘余福
郎文辉
贾光帅
《计算机工程》
CAS
CSCD
北大核心
2019年第4期25-29,共5页
在向量处理器上进行矩阵运算时硬件资源利用率与数据处理能力较低。为此,基于魂芯数字信号处理器(HXDSP)平台,结合高效视频编码(HEVC)标准中的离散余弦变换算法,采用数据压缩式向量法实现矩阵乘法,以发挥向量处理器的硬件资源。实验结...
在向量处理器上进行矩阵运算时硬件资源利用率与数据处理能力较低。为此,基于魂芯数字信号处理器(HXDSP)平台,结合高效视频编码(HEVC)标准中的离散余弦变换算法,采用数据压缩式向量法实现矩阵乘法,以发挥向量处理器的硬件资源。实验结果表明,该方法可达到HXDSP的定点乘累加运算能力峰值32 GMACs,数据处理能力可达2 GPixel/s,满足HEVC编码标准的性能要求。
展开更多
关键词
魂芯数字信号处理器
矩阵乘法
数据压缩
向量法
高效视频编码标准
离散余弦变换算法
下载PDF
职称材料
HXDSP上IDCT变换的数据压缩式向量化设计及实现
被引量:
4
2
作者
段苓丽
郎文辉
+1 位作者
刘余福
贾光帅
《合肥工业大学学报(自然科学版)》
CAS
北大核心
2020年第4期474-479,共6页
二维离散余弦逆变换(inverse discrete cosine transform,IDCT)是视频解码算法的核心模块之一,也是视频解码算法中运算量和耗时最多的部分,因此提高解码速度的重点在于如何提高IDCT的运算速度。文章基于魂芯数字信号处理器(HXDSP)平台,...
二维离散余弦逆变换(inverse discrete cosine transform,IDCT)是视频解码算法的核心模块之一,也是视频解码算法中运算量和耗时最多的部分,因此提高解码速度的重点在于如何提高IDCT的运算速度。文章基于魂芯数字信号处理器(HXDSP)平台,结合openHEVC中的IDCT算法,设计并实现了一种数据压缩式向量法,该方法利用HXDSP的现有硬件资源构建向量处理器,并将2个相邻的运算数据压缩至寄存器的高位和低位同时参与计算,在硬件资源和周期不变的情况下,数据运算量提高了50%。测试结果表明该算法的运算速度达到了HXDSP的计算峰值32 GMACS,为openHEVC解码器的DSP优化提供了重要的参考。
展开更多
关键词
openHEVC工程
HXDSP硬件平台
矩阵乘法
数据压缩
向量化
下载PDF
职称材料
BWDSP上HEVC运动估计的实现及存储器访问优化
被引量:
1
3
作者
贾尚柱
郎文辉
+1 位作者
曾飞洋
刘余福
《电脑知识与技术(过刊)》
2017年第4X期178-180,共3页
运动估计技术是利用视频帧中之前已编码图像为当前图像的每个像素块寻找一个最佳匹配块。运动估计过程中主要包括了运动搜索、亚像素插值和MV预测技术,在运动估计过程中,存在着大量的计算。为保证硬件编码的实时性,我们结合BWDSP体系结...
运动估计技术是利用视频帧中之前已编码图像为当前图像的每个像素块寻找一个最佳匹配块。运动估计过程中主要包括了运动搜索、亚像素插值和MV预测技术,在运动估计过程中,存在着大量的计算。为保证硬件编码的实时性,我们结合BWDSP体系结构的特征,采用存储器访问优化和代码级优化技术,实现了基于循环buffer的运动估计算法。实验表明,在BWDSP仿真环境下,该优化方法减少了代码执行所需的时钟周期,提高了编码器性能。
展开更多
关键词
运动估计
BWDSP
视频编码
亚像素插值
循环buffer
下载PDF
职称材料
题名
HXDSP平台上矩阵乘法的实现与性能分析
被引量:
4
1
作者
刘余福
郎文辉
贾光帅
机构
合肥工业大学计算机与信息学院
合肥工业大学工业安全与应急技术安徽省重点实验室
中国电子科技集团公司第三十八研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第4期25-29,共5页
基金
安徽省科技专项资金"高清摄像机产业化及核心处理器芯片技术开发"(13Z02010)
文摘
在向量处理器上进行矩阵运算时硬件资源利用率与数据处理能力较低。为此,基于魂芯数字信号处理器(HXDSP)平台,结合高效视频编码(HEVC)标准中的离散余弦变换算法,采用数据压缩式向量法实现矩阵乘法,以发挥向量处理器的硬件资源。实验结果表明,该方法可达到HXDSP的定点乘累加运算能力峰值32 GMACs,数据处理能力可达2 GPixel/s,满足HEVC编码标准的性能要求。
关键词
魂芯数字信号处理器
矩阵乘法
数据压缩
向量法
高效视频编码标准
离散余弦变换算法
Keywords
HX Digital Signal Processor(HXDSP)
matrix multiplication
data compression
vector method
High Efficiency Video Coding(HEVC) standard
Discrete Cosine Transform(DCT) algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
HXDSP上IDCT变换的数据压缩式向量化设计及实现
被引量:
4
2
作者
段苓丽
郎文辉
刘余福
贾光帅
机构
合肥工业大学计算机与信息学院
工业安全与应急技术安徽省重点实验室
中国电子科技集团公司第三十八研究所
出处
《合肥工业大学学报(自然科学版)》
CAS
北大核心
2020年第4期474-479,共6页
基金
国家自然科学基金资助项目(61271381)。
文摘
二维离散余弦逆变换(inverse discrete cosine transform,IDCT)是视频解码算法的核心模块之一,也是视频解码算法中运算量和耗时最多的部分,因此提高解码速度的重点在于如何提高IDCT的运算速度。文章基于魂芯数字信号处理器(HXDSP)平台,结合openHEVC中的IDCT算法,设计并实现了一种数据压缩式向量法,该方法利用HXDSP的现有硬件资源构建向量处理器,并将2个相邻的运算数据压缩至寄存器的高位和低位同时参与计算,在硬件资源和周期不变的情况下,数据运算量提高了50%。测试结果表明该算法的运算速度达到了HXDSP的计算峰值32 GMACS,为openHEVC解码器的DSP优化提供了重要的参考。
关键词
openHEVC工程
HXDSP硬件平台
矩阵乘法
数据压缩
向量化
Keywords
openHEVC
HXDSP hardware platform
matrix multiplication
data compression
vectorization
分类号
TN919.81 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
BWDSP上HEVC运动估计的实现及存储器访问优化
被引量:
1
3
作者
贾尚柱
郎文辉
曾飞洋
刘余福
机构
合肥工业大学计算机与信息学院
出处
《电脑知识与技术(过刊)》
2017年第4X期178-180,共3页
文摘
运动估计技术是利用视频帧中之前已编码图像为当前图像的每个像素块寻找一个最佳匹配块。运动估计过程中主要包括了运动搜索、亚像素插值和MV预测技术,在运动估计过程中,存在着大量的计算。为保证硬件编码的实时性,我们结合BWDSP体系结构的特征,采用存储器访问优化和代码级优化技术,实现了基于循环buffer的运动估计算法。实验表明,在BWDSP仿真环境下,该优化方法减少了代码执行所需的时钟周期,提高了编码器性能。
关键词
运动估计
BWDSP
视频编码
亚像素插值
循环buffer
分类号
TN919.81 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
HXDSP平台上矩阵乘法的实现与性能分析
刘余福
郎文辉
贾光帅
《计算机工程》
CAS
CSCD
北大核心
2019
4
下载PDF
职称材料
2
HXDSP上IDCT变换的数据压缩式向量化设计及实现
段苓丽
郎文辉
刘余福
贾光帅
《合肥工业大学学报(自然科学版)》
CAS
北大核心
2020
4
下载PDF
职称材料
3
BWDSP上HEVC运动估计的实现及存储器访问优化
贾尚柱
郎文辉
曾飞洋
刘余福
《电脑知识与技术(过刊)》
2017
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部