期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于热点函数的代码体积优化
1
作者 黄昕 《软件导刊》 2019年第6期42-45,共4页
为解决嵌入式系统存储受限的问题,编译器往往禁止一些会增大代码体积的优化,如循环展开、过程内联等,导致性能下降。大部分程序中存在占据程序90%以上执行时间的“热”代码,但其体积仅占程序代码小部分。利用该程序属性,提出基于热点代... 为解决嵌入式系统存储受限的问题,编译器往往禁止一些会增大代码体积的优化,如循环展开、过程内联等,导致性能下降。大部分程序中存在占据程序90%以上执行时间的“热”代码,但其体积仅占程序代码小部分。利用该程序属性,提出基于热点代码的可执行代码体积优化方法,即通过程序执行剖视信息获取“热”、“冷”代码并采用不同优化方法。测试表明,与针对性能的优化相比,该方法典型测试程序代码体积平均下降15.2%,性能仅下降3.4%。 展开更多
关键词 体积优化 编译 热点函数 嵌入式应用
下载PDF
天气预报模型WRF中复杂Stencil性能优化
2
作者 邸健强 袁良 +1 位作者 张云泉 张思佳 《计算机科学》 CSCD 北大核心 2024年第4期56-66,共11页
天气研究与预报模式(WRF)是一种应用广泛的中尺度数值天气预报系统,在大气研究和业务预报领域发挥着重要作用。Stencil计算是科学工程应用中一类常见的嵌套循环计算模式,WRF中对大气动力学和热力学方程的数值求解引出了大量空间网格上... 天气研究与预报模式(WRF)是一种应用广泛的中尺度数值天气预报系统,在大气研究和业务预报领域发挥着重要作用。Stencil计算是科学工程应用中一类常见的嵌套循环计算模式,WRF中对大气动力学和热力学方程的数值求解引出了大量空间网格上的复杂Stencil计算,存在多维度、多变量、物理模型边界特殊性、物理和动力学过程的复杂性等模型特征。文中深入剖析了WRF中典型的Stencil计算模式,识别抽象出典型Stencil循环中存在的“中间变量”概念,围绕其设计实现了3种优化方案,即中间变量计算合并、中间变量降维存储以及中间变量提取,有效提高了数据局部性,改善了数据重用率和空间复用率,降低了冗余计算和访存开销。结果表明,经优化方案重构的WRF 4.2典型Stencil热点函数在Intel CPU和Hygon CPU上均可获得良好的性能加速,最高加速比达21.3%和17.8%。 展开更多
关键词 WRF Stencil计算 中间变量 优化方案 数据局部性 热点函数 性能加速
下载PDF
基于申威SIMD指令的H.264编码优化 被引量:1
3
作者 黄朴 刘世巍 +1 位作者 张昊 王聪 《现代电子技术》 北大核心 2024年第6期49-54,共6页
国产化申威处理器出现较晚,其在多媒体领域中的性能还不突出,同时通用处理器中的单指令流多数据流(SIMD)因能有效提升并行处理能力而受到处理器厂商的青睐。为提高国产化自主平台申威架构的多媒体处理能力,结合申威架构Core3B体系的SIM... 国产化申威处理器出现较晚,其在多媒体领域中的性能还不突出,同时通用处理器中的单指令流多数据流(SIMD)因能有效提升并行处理能力而受到处理器厂商的青睐。为提高国产化自主平台申威架构的多媒体处理能力,结合申威架构Core3B体系的SIMD指令系统,提出一种基于申威架构的SIMD指令集H.264编码优化方法。结合申威处理器的并行结构特点,利用申威适配的Perf、Top指令等系统性能分析工具,采集两种主流视频分辨率下与编码性能强相关的高频热点函数,详细分析其程序并行化可行性,采用手工嵌入申威SIMD和访存扩展等汇编指令进行细粒度优化。实验结果表明,该方法在申威架构下的H.264平均编码性能提升了约30%。相应工作成果已推送到申威社区,增强了基于申威处理器的国产计算机在桌面多媒体应用领域的工作体验。 展开更多
关键词 单指令流多数据流 H.264标准 申威处理器 热点函数 程序并行化 细粒度
下载PDF
基于威焱831平台的H.264视频解码优化
4
作者 王聪 张昊 +1 位作者 刘世巍 黄朴 《现代电子技术》 北大核心 2024年第10期86-90,共5页
为提高威焱831平台的多媒体处理能力,解决H.264解码器解码效率低的问题,在提出SIMD指令级优化方法的同时,提出一种面向帧拷贝的优化方法。通过分析开源软件FFmpeg中H.264解码器的并行化特性,使用威焱平台性能分析工具解析影响视频解码... 为提高威焱831平台的多媒体处理能力,解决H.264解码器解码效率低的问题,在提出SIMD指令级优化方法的同时,提出一种面向帧拷贝的优化方法。通过分析开源软件FFmpeg中H.264解码器的并行化特性,使用威焱平台性能分析工具解析影响视频解码性能的热点函数。采用手工嵌入SIMD汇编指令的方式对关键模块热点函数进行优化,通过FFmpeg源码编译过程链接汇编实现的内存操作函数memcpy提升内存拷贝速度。实验结果表明,威焱831平台视频解码的平均性能提高26%,推动了威焱831处理器在多媒体应用领域的发展。 展开更多
关键词 威焱831平台 SIMD H.264解码器 FFMPEG 热点函数 解码效率
下载PDF
主流视频编解码软件的硬件性能分析与设计 被引量:3
5
作者 汤旭龙 安虹 范东睿 《计算机工程》 CAS CSCD 2014年第6期300-305,共6页
网络视频会议以及高清视频点播等应用的广泛流行,对视频编解码的编码质量以及编码速度提出了更高的要求。为帮助硬件设计人员设计更强大的专用处理器去适应视频编解码应用的发展趋势,并评估处理器设计的合理性和正确性,对视频编解码进... 网络视频会议以及高清视频点播等应用的广泛流行,对视频编解码的编码质量以及编码速度提出了更高的要求。为帮助硬件设计人员设计更强大的专用处理器去适应视频编解码应用的发展趋势,并评估处理器设计的合理性和正确性,对视频编解码进行分析和测试,提出一套基准测试程序。采用自顶向下的分析方法,以流行性、编解码效率、压缩质量和开源性为标准,选取主流的视频编解码软件,进行热点函数分析。抽取变换、量化以及滤波过程中的热点函数,使之成为视频编解码测试程序,为其构造典型输入集。通过分析真实硬件平台上这些测试程序的计算和访存特性,给出处理器设计的建议。结果证明,该基准测试程序使用10%的代码量即可反映视频编解码过程的主要特征,对处理器设计具有指导意义。 展开更多
关键词 视频编解码 体系结构 热点函数 性能分析 变换 量化 滤波
下载PDF
ORB-SLAM系统特征分析研究 被引量:1
6
作者 薛瑞 李易 +3 位作者 李文明 安述倩 叶笑春 唐志敏 《高技术通讯》 CAS 2022年第11期1112-1125,共14页
随着自动驾驶汽车、机器人、无人机、虚拟现实和增强现实等应用的飞速发展,其核心技术同步定位和建图(SLAM)成为目前热门研究方向之一。ORB-SLAM系统作为典型的基于特征点法的SLAM系统,具有更好的鲁棒性和更高的计算效率,无论在系统优... 随着自动驾驶汽车、机器人、无人机、虚拟现实和增强现实等应用的飞速发展,其核心技术同步定位和建图(SLAM)成为目前热门研究方向之一。ORB-SLAM系统作为典型的基于特征点法的SLAM系统,具有更好的鲁棒性和更高的计算效率,无论在系统优化层面还是底层硬件架构设计层面一直被广泛关注。然而目前学术界和工业界缺乏面向ORB-SLAM系统底层硬件架构设计的系统特征分析研究。本文从跟踪线程、地图构建线程和回环检测线程出发详细介绍ORB-SLAM系统,选取了ORB-SLAM2系统进行了性能分析实验,得到了ORB特征提取和块求解器2个热点函数,并分析了2个热点函数的执行特征。在Intel i5-6500和ARM Neoverse-N1处理器平台实验对比评估了2个热点函数的IPC、分支预测失效率、一级数据缓存读失效率、最后一级缓存失效率和最后一级缓存MPKI等特征,并总结了对体系结构设计的需求,为面向ORB-SLAM系统的底层硬件架构设计提供了指导性建议。 展开更多
关键词 ORB-SLAM 热点函数 特征分析 硬件架构设计
下载PDF
Heat Generation by Electric Current in Normal-Metal-Molecular Quantum Dot-Superconductor System 被引量:2
7
作者 陈桥 邓永和 《Communications in Theoretical Physics》 SCIE CAS CSCD 2011年第9期517-520,共4页
We investigate the heat generation induced by electrical current in a normal-metal-molecular quantum dot-superconductor (NDS) system. By using nonequilibrium Green's function method, the heat generation Q is derive... We investigate the heat generation induced by electrical current in a normal-metal-molecular quantum dot-superconductor (NDS) system. By using nonequilibrium Green's function method, the heat generation Q is derived and studied in detail. The superconducting lead influences the heat generation significantly. An obvious step appears in Q - eV characteristics and the iocation of this step is related with the phonon frequency ωo. The heat generations exhibit very different behaviour in the condition eV 〈 △ and eV 〉 △ due to different tunneling mechanism. From the study of Q - eVg curves, there is an extra peak as eV 〉 △. The difference in this two cases is also shown in Q - ωo curve, an extra peak emerges as eV 〉 △. 展开更多
关键词 heat generation SUPERCONDUCTOR electron-phonon interaction nonequilibrium Green's function
下载PDF
Heat Generation by Electrical Current in Quantum Dot System with Fano Resonance
8
作者 陈桥 许迈昌 屈喜龙 《Communications in Theoretical Physics》 SCIE CAS CSCD 2012年第8期295-299,共5页
We study the heat generation in quantum dot system with Fano resonance by nonequilibrium Green's functions method. The Fano resonance influences the heat generation significantly. As increases, the heat generation d... We study the heat generation in quantum dot system with Fano resonance by nonequilibrium Green's functions method. The Fano resonance influences the heat generation significantly. As increases, the heat generation decreases gradually. From the study of Q-eV curves, we llnd that the linewidth function F has huge influence on the heat generation. The Q-eV curves display obvious steps when the linewidth function is small. However, these steps disappear with F increasing. As the source-drain bias eV increases, the Q-eVg curves also display interesting behaviors. 展开更多
关键词 heat generation Fano resonance electron-phonon interaction nonequilibrium Green's function
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部