期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
11
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
异构双核的高分辨率折反射全景高速处理系统
被引量:
5
1
作者
陈立栋
张茂军
+2 位作者
王炜
包卫东
金晗婧
《电子与信息学报》
EI
CSCD
北大核心
2009年第4期822-826,共5页
为了实现对高分辨率折反射全景的快速处理,采用DSP+FPGA异构双核结构、多级乒乓缓存的数据通信机制,基于查找表技术和分块预取策略的全景图像展开算法等,开发了一个可对300万像素折反射全景进行帧速率为12fps的采集、展开并输出的嵌入...
为了实现对高分辨率折反射全景的快速处理,采用DSP+FPGA异构双核结构、多级乒乓缓存的数据通信机制,基于查找表技术和分块预取策略的全景图像展开算法等,开发了一个可对300万像素折反射全景进行帧速率为12fps的采集、展开并输出的嵌入式系统。系统动态可重构、易扩展、计算效率高,可应用于全景视频监控、机器人视觉等领域。
展开更多
关键词
图像处理
异构双核
折反射全景
多级乒乓缓存
全景图像展开
分块预取
下载PDF
职称材料
分布式系统卷重构过程的改写块预取方法
被引量:
4
2
作者
谭怀亮
王燕
+1 位作者
孙建华
陈浩
《湖南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2009年第1期77-80,共4页
从多同构主机分别由同一共享系统卷远程启动与配置过程中对共享卷改写情况的统计分析入手,提出了透明计算模式下分布式系统卷重构过程的改写块预取模型.通过在共享系统卷的改写相似集元素上留下一种标识来进行信息传递,以此指导该主机...
从多同构主机分别由同一共享系统卷远程启动与配置过程中对共享卷改写情况的统计分析入手,提出了透明计算模式下分布式系统卷重构过程的改写块预取模型.通过在共享系统卷的改写相似集元素上留下一种标识来进行信息传递,以此指导该主机以后对改写相似集的快速定位,并指导其他主机重构其系统卷时快速预取相应的改写块.设计了基于二度局部特征的改写块预取算法,使得改写块预取能在横向顺序预取、纵向跳转预取两方向并发完成.算法对共享系统卷扩展块改写感知判别和改写块地址重定位的时间复杂度始终是O(1).结果表明该预取策略具有良好的性能和稳定性.
展开更多
关键词
分布式系统
系统卷重构
二度局部性
改写块预取
下载PDF
职称材料
一种DSP折反射全景图像实时展开方法
被引量:
3
3
作者
程钢
熊志辉
+2 位作者
陈立栋
王斌
张茂军
《计算机应用》
CSCD
北大核心
2008年第9期2285-2287,2291,共4页
为了提高折反射全景图像展开速度,可采用查表来取代耗时的计算,但查找表需要大量的存储空间,于是采用分块预取方法。通过分块,将待处理目标图像块对应的查找表和原始图像分块预先存入DSP片内存储器并完成展开,可以降低存取访问开销,加...
为了提高折反射全景图像展开速度,可采用查表来取代耗时的计算,但查找表需要大量的存储空间,于是采用分块预取方法。通过分块,将待处理目标图像块对应的查找表和原始图像分块预先存入DSP片内存储器并完成展开,可以降低存取访问开销,加快查表展开。实验结果表明,分块预取方法在对1 024×768分辨率的原始全景图像展开为1 152×256分辨率的目标全景图像时,展开数据可达每秒97帧,与不采用分块预取策略的查表展开方法相比,此方法要快近20倍。
展开更多
关键词
折反射全景图像
全景图像查表展开
分块预取
下载PDF
职称材料
以基本块为单位的非顺序指令预取
被引量:
4
4
作者
沈立
戴葵
王志英
《计算机工程与科学》
CSCD
2003年第4期94-98,共5页
取指令能力的高低对微处理器的性能有很大影响。指令预取技术能够有效地降低指令Cache的访问失效率,提高微处理器的取指令能力,进而提高微处理器的性能。本文提出了一种由分支指令指导的、以基本块为单位的非顺序指令预取技术,每次预取...
取指令能力的高低对微处理器的性能有很大影响。指令预取技术能够有效地降低指令Cache的访问失效率,提高微处理器的取指令能力,进而提高微处理器的性能。本文提出了一种由分支指令指导的、以基本块为单位的非顺序指令预取技术,每次预取将一个完整的基本块读入指令Cache。这种方法使用静态策略分析程序行为,实现所需的硬件复杂度低。模拟结果显示,该方法能够有效地提高指令Cache访问的命中率。
展开更多
关键词
微处理器
指令处理模块
基本块
非顺序指令预取
执行模块
下载PDF
职称材料
存储系统中的频繁访问模式挖掘
5
作者
朱旭东
卜庆忠
+2 位作者
柯剑
那文武
许鲁
《高技术通讯》
EI
CAS
CSCD
北大核心
2009年第7期699-705,共7页
研究、分析了影响经典的模式挖掘方法挖掘频繁访问模式的效率,使其难以被存储系统接受的主要因素——噪音的产生原因和表现类型,提出一种具有噪音过滤能力,适应存储系统频繁访问序列模式挖掘的新方法——Z-Miner。Z-Miner使用全局分支...
研究、分析了影响经典的模式挖掘方法挖掘频繁访问模式的效率,使其难以被存储系统接受的主要因素——噪音的产生原因和表现类型,提出一种具有噪音过滤能力,适应存储系统频繁访问序列模式挖掘的新方法——Z-Miner。Z-Miner使用全局分支裁剪和分支聚类方法来过滤噪音,对实际系统工作负载的模拟结果显示,Z-Miner指导的预取可以使缓存失效率降低40%~66%,平均响应时间降低26%~66%。相对经典挖掘方法,Z-Miner的挖掘开销有1~2个数量级的下降,而预取优化效果提高了1倍。
展开更多
关键词
频繁访问模式
数据块关系
序列模式挖掘
聚类
预取
下载PDF
职称材料
高性能低功耗FT-XDSP的指令缓存队列
6
作者
杨惠
孙永节
《小型微型计算机系统》
CSCD
北大核心
2010年第7期1350-1354,共5页
介绍定点高性能低功耗数字信号处理器YHFT-X的指令缓冲队列与其控制器的设计.为实现向运算部件源源不断地输送高密度可变长的并行指令流,提出改进型动态管理循环缓冲队列的结构.该设计改善了现有处理循环指令技术的局限性,提出当功能单...
介绍定点高性能低功耗数字信号处理器YHFT-X的指令缓冲队列与其控制器的设计.为实现向运算部件源源不断地输送高密度可变长的并行指令流,提出改进型动态管理循环缓冲队列的结构.该设计改善了现有处理循环指令技术的局限性,提出当功能单元充足时,利用循环缓冲队列实现的软件流水操作,大大减少了代码量,实现了循环体内指令的并行执行,同时减轻了取指令给存储器带来的压力.该结构支持分块指令预取技术,隐藏了部分流水线停顿.经验证及对比测试满足高性能、低功耗的应用要求.
展开更多
关键词
数字信号处理器
指令缓冲队列
块循环指令
软件流水
指令预取
下载PDF
职称材料
利用数据预取机制降低块执行模型的访存延迟
被引量:
2
7
作者
从明
安虹
+1 位作者
张军
任永青
《小型微型计算机系统》
CSCD
北大核心
2010年第8期1692-1696,共5页
块执行模型通过将串行程序划分成一系列可并行执行的指令块来挖掘应用中潜在的指令级并行性.访存延迟是阻碍块执行模型提高指令级并行性的主要因素之一,而数据预取技术在传统执行模型中可有效降低访存延迟,对块执行模型也同样具有较强...
块执行模型通过将串行程序划分成一系列可并行执行的指令块来挖掘应用中潜在的指令级并行性.访存延迟是阻碍块执行模型提高指令级并行性的主要因素之一,而数据预取技术在传统执行模型中可有效降低访存延迟,对块执行模型也同样具有较强的适应性.本文分析了在块执行模型中引入数据预取机制的可行性,并从cache命中率、访存指令的延迟等方面验证了数据预取在块执行模型中的作用,仿真结果表明数据预取可有效降低块执行模型中的访存延迟.
展开更多
关键词
数据预取
块执行模型
分片式处理器
访存延迟
访存命中率
下载PDF
职称材料
基于Alluxio远程场景下缓存策略的优化
被引量:
4
8
作者
董文菁
温东新
张展
《计算机应用研究》
CSCD
北大核心
2018年第10期3025-3028,共4页
当今时代数据呈现出指数级增长效应,更多的组织采用多数据中心和分布式来存储数据,Alluxio作为以内存为中心的虚拟分布式存储系统,整合了底层大数据生态系统。在Alluxio与底层存储结合的远程场景中,由于网络的延迟,使得I/O速度成为影响...
当今时代数据呈现出指数级增长效应,更多的组织采用多数据中心和分布式来存储数据,Alluxio作为以内存为中心的虚拟分布式存储系统,整合了底层大数据生态系统。在Alluxio与底层存储结合的远程场景中,由于网络的延迟,使得I/O速度成为影响对外服务的重要因素之一。针对以上研究提出一种基于Alluxio远程场景下的缓存策略CPR,利用存储系统中数据块之间的关联性指导数据预取与替换,采用分组思想提高关联规则的利用率,启用后台线程实时更新规则集,并通过仿真实验验证策略的有效性。仿真结果表明,CPR策略指导下的I/O性能要优于Alluxio现有的缓存策略和一些基于数据块间关联规则的缓存策略。
展开更多
关键词
数据块
关联规则
Alluxio
数据预取
数据替换
下载PDF
职称材料
PostgreSQL数据库预取算法研究
被引量:
3
9
作者
胡巧巧
王建民
叶晓俊
《计算机科学》
CSCD
北大核心
2006年第3期138-139,159,共3页
减少磁盘的存取时间是提高数据库性能的关键。本文讨论了 PostgreSQ L数据库顺序存取的特性,提出了一种 PostgreSQL 中顺序预取数据块的算法,预取的数据决数目可根据当前存取块之前的顺序存取情况作自适应调整。实验结果表明,该算法能...
减少磁盘的存取时间是提高数据库性能的关键。本文讨论了 PostgreSQ L数据库顺序存取的特性,提出了一种 PostgreSQL 中顺序预取数据块的算法,预取的数据决数目可根据当前存取块之前的顺序存取情况作自适应调整。实验结果表明,该算法能有效地提高磁盘决的平均存取速度。
展开更多
关键词
预取
顺序存取
POSTGRESQL
数据块
下载PDF
职称材料
一种面向实时系统的程序基本块指令预取技术
被引量:
4
10
作者
王恩东
倪璠
+2 位作者
陈继承
王洪伟
唐士斌
《软件学报》
EI
CSCD
北大核心
2016年第9期2426-2442,共17页
面向通用计算机系统的指令预取技术无法满足实时系统的应用需求,其中一个重要原因是:无效预取引起的指令Cache内容污染使得实时任务WCET评估值不够精确,导致系统可调度性下降,严重影响系统效率.以简化实时任务WCET分析、降低任务WCET评...
面向通用计算机系统的指令预取技术无法满足实时系统的应用需求,其中一个重要原因是:无效预取引起的指令Cache内容污染使得实时任务WCET评估值不够精确,导致系统可调度性下降,严重影响系统效率.以简化实时任务WCET分析、降低任务WCET评估值为目标,提出一种基于程序基本块的指令预取方法.该方法以基本块为粒度执行指令预取,避免了传统指令预取技术引入的无效预取;通过简化最坏情况下的指令访问命中/缺失情况判定,简化任务WCET分析过程并优化WCET评估值.实时基准测试程序评估结果表明:与常规无预取方法相比,该预取方法可使实时任务WCET评估值降低约20%,平均执行情况下的指令Cache访问性能提升约10%.
展开更多
关键词
实时系统
最坏情况执行时间
高速缓存性能
指令预取
基本块
下载PDF
职称材料
基于GPU架构的两层并行块Jacobi SVD算法
被引量:
2
11
作者
黄荣锋
赵永华
+1 位作者
于天禹
刘世芳
《数值计算与计算机应用》
2022年第4期380-399,共20页
SVD(singularvaluedecomposition)广泛应用于图像处理、人脸识别、信号降噪等领域。本文基于单边JacobiSVD算法给出了块间和块内两层并行的块JacobiSVDGPU算法.为了更好地利用GPU的共享内存,块间并行通过存储矩阵列块之间的内积解决了...
SVD(singularvaluedecomposition)广泛应用于图像处理、人脸识别、信号降噪等领域。本文基于单边JacobiSVD算法给出了块间和块内两层并行的块JacobiSVDGPU算法.为了更好地利用GPU的共享内存,块间并行通过存储矩阵列块之间的内积解决了共享内存不足的问题.此外,块间并行还通过矩阵块操作技术提高数据利用率及数据预取技术实现数据访问和数据计算的重叠.块内并行通过直接更新矩阵列块之间的内积替代了更新矩阵列块以及更新矩阵列块之后计算矩阵列块之间内积的归约操作,增加了GPU线程的利用率.另一方面,块内并行将需要多次访问的数据存储于共享内存或寄存器,减少了对全局内存的访问从而提升了算法实现性能。在NVIDIATeslaV100GPU上的数值实验结果表明,本文的算法较Cusolver库有1.8×倍的加速,较MAGMA库中最快的算法加速达2.5×倍.
展开更多
关键词
奇异值分解
块Jacobi算法
并行算法
GPU
数据预取技术
原文传递
题名
异构双核的高分辨率折反射全景高速处理系统
被引量:
5
1
作者
陈立栋
张茂军
王炜
包卫东
金晗婧
机构
国防科技大学信息系统与管理学院
中国人民解放军
出处
《电子与信息学报》
EI
CSCD
北大核心
2009年第4期822-826,共5页
基金
国家自然科学基金项目(60773023,60705013)
中国博士后科学基金(20070410977)资助课题
文摘
为了实现对高分辨率折反射全景的快速处理,采用DSP+FPGA异构双核结构、多级乒乓缓存的数据通信机制,基于查找表技术和分块预取策略的全景图像展开算法等,开发了一个可对300万像素折反射全景进行帧速率为12fps的采集、展开并输出的嵌入式系统。系统动态可重构、易扩展、计算效率高,可应用于全景视频监控、机器人视觉等领域。
关键词
图像处理
异构双核
折反射全景
多级乒乓缓存
全景图像展开
分块预取
Keywords
Image processing
Heterogeneous dual-core
Catadioptric panorama
Multi-level ping-pong caches
Panorama unrolling
block prefetch
分类号
TP274 [自动化与计算机技术—检测技术与自动化装置]
TN911.73 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
分布式系统卷重构过程的改写块预取方法
被引量:
4
2
作者
谭怀亮
王燕
孙建华
陈浩
机构
湖南大学计算机与通信学院
出处
《湖南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2009年第1期77-80,共4页
基金
湖南省自然科学基金资助项目(07JJ6139)
973国家重点基础研究发展计划资助项目(2007CB310900)
文摘
从多同构主机分别由同一共享系统卷远程启动与配置过程中对共享卷改写情况的统计分析入手,提出了透明计算模式下分布式系统卷重构过程的改写块预取模型.通过在共享系统卷的改写相似集元素上留下一种标识来进行信息传递,以此指导该主机以后对改写相似集的快速定位,并指导其他主机重构其系统卷时快速预取相应的改写块.设计了基于二度局部特征的改写块预取算法,使得改写块预取能在横向顺序预取、纵向跳转预取两方向并发完成.算法对共享系统卷扩展块改写感知判别和改写块地址重定位的时间复杂度始终是O(1).结果表明该预取策略具有良好的性能和稳定性.
关键词
分布式系统
系统卷重构
二度局部性
改写块预取
Keywords
distributed system
system volume rebuild
two degree partial characteristics
the rewrited
block prefetch
分类号
TP316.4 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种DSP折反射全景图像实时展开方法
被引量:
3
3
作者
程钢
熊志辉
陈立栋
王斌
张茂军
机构
国防科学技术大学信息系统与管理学院
出处
《计算机应用》
CSCD
北大核心
2008年第9期2285-2287,2291,共4页
基金
国家自然科学基金资助项目(60705013)
文摘
为了提高折反射全景图像展开速度,可采用查表来取代耗时的计算,但查找表需要大量的存储空间,于是采用分块预取方法。通过分块,将待处理目标图像块对应的查找表和原始图像分块预先存入DSP片内存储器并完成展开,可以降低存取访问开销,加快查表展开。实验结果表明,分块预取方法在对1 024×768分辨率的原始全景图像展开为1 152×256分辨率的目标全景图像时,展开数据可达每秒97帧,与不采用分块预取策略的查表展开方法相比,此方法要快近20倍。
关键词
折反射全景图像
全景图像查表展开
分块预取
Keywords
catadioptric omni-directional imaging
lookup-table panorama unroll
block prefetch
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
以基本块为单位的非顺序指令预取
被引量:
4
4
作者
沈立
戴葵
王志英
机构
国防科技大学计算机学院
出处
《计算机工程与科学》
CSCD
2003年第4期94-98,共5页
基金
国家自然科学基金资助项目(60173040
6993303)
文摘
取指令能力的高低对微处理器的性能有很大影响。指令预取技术能够有效地降低指令Cache的访问失效率,提高微处理器的取指令能力,进而提高微处理器的性能。本文提出了一种由分支指令指导的、以基本块为单位的非顺序指令预取技术,每次预取将一个完整的基本块读入指令Cache。这种方法使用静态策略分析程序行为,实现所需的硬件复杂度低。模拟结果显示,该方法能够有效地提高指令Cache访问的命中率。
关键词
微处理器
指令处理模块
基本块
非顺序指令预取
执行模块
Keywords
basic
block
instruction cache
instruction
prefetch
ing
branch prediction
分类号
TP332 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
存储系统中的频繁访问模式挖掘
5
作者
朱旭东
卜庆忠
柯剑
那文武
许鲁
机构
中国科学院计算技术研究所
中国科学院研究生院
出处
《高技术通讯》
EI
CAS
CSCD
北大核心
2009年第7期699-705,共7页
基金
863计划(2007AA01Z402)
973计划(2004CB318205)资助项目。
文摘
研究、分析了影响经典的模式挖掘方法挖掘频繁访问模式的效率,使其难以被存储系统接受的主要因素——噪音的产生原因和表现类型,提出一种具有噪音过滤能力,适应存储系统频繁访问序列模式挖掘的新方法——Z-Miner。Z-Miner使用全局分支裁剪和分支聚类方法来过滤噪音,对实际系统工作负载的模拟结果显示,Z-Miner指导的预取可以使缓存失效率降低40%~66%,平均响应时间降低26%~66%。相对经典挖掘方法,Z-Miner的挖掘开销有1~2个数量级的下降,而预取优化效果提高了1倍。
关键词
频繁访问模式
数据块关系
序列模式挖掘
聚类
预取
Keywords
frequent access pattern,
block
correlations, sequential pattern mining, clustering,
prefetch
ing
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
TP333 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
高性能低功耗FT-XDSP的指令缓存队列
6
作者
杨惠
孙永节
机构
国防科技大学计算机学院微电子与微处理器研究所
出处
《小型微型计算机系统》
CSCD
北大核心
2010年第7期1350-1354,共5页
基金
国家自然科学基金项目(60876024)资助
文摘
介绍定点高性能低功耗数字信号处理器YHFT-X的指令缓冲队列与其控制器的设计.为实现向运算部件源源不断地输送高密度可变长的并行指令流,提出改进型动态管理循环缓冲队列的结构.该设计改善了现有处理循环指令技术的局限性,提出当功能单元充足时,利用循环缓冲队列实现的软件流水操作,大大减少了代码量,实现了循环体内指令的并行执行,同时减轻了取指令给存储器带来的压力.该结构支持分块指令预取技术,隐藏了部分流水线停顿.经验证及对比测试满足高性能、低功耗的应用要求.
关键词
数字信号处理器
指令缓冲队列
块循环指令
软件流水
指令预取
Keywords
DSP
instruction buffer queue(IBQ)
repeat
block
instructions
software pipelining
instruction
prefetch
分类号
TP368.1 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
利用数据预取机制降低块执行模型的访存延迟
被引量:
2
7
作者
从明
安虹
张军
任永青
机构
中国科学技术大学计算机科学与技术学院
中国科学院计算机体系结构重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2010年第8期1692-1696,共5页
基金
国家自然科学基金项目(60633040
60736012)资助
+3 种基金
国家"九七三"重点基础研究发展计划基金项目(2005CB321601)资助
国家"八六三"高技术研究发展计划项目(2006AA01A102
2009AA01Z106)资助
教育部-英特尔信息技术专项科研基金项目(MOE-INTEL-08-07)资助
文摘
块执行模型通过将串行程序划分成一系列可并行执行的指令块来挖掘应用中潜在的指令级并行性.访存延迟是阻碍块执行模型提高指令级并行性的主要因素之一,而数据预取技术在传统执行模型中可有效降低访存延迟,对块执行模型也同样具有较强的适应性.本文分析了在块执行模型中引入数据预取机制的可行性,并从cache命中率、访存指令的延迟等方面验证了数据预取在块执行模型中的作用,仿真结果表明数据预取可有效降低块执行模型中的访存延迟.
关键词
数据预取
块执行模型
分片式处理器
访存延迟
访存命中率
Keywords
data
prefetch
block
execution model
tiled processor
memory-access latency
cache hit rate
分类号
TP303 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于Alluxio远程场景下缓存策略的优化
被引量:
4
8
作者
董文菁
温东新
张展
机构
哈尔滨工业大学计算机科学与技术学院
出处
《计算机应用研究》
CSCD
北大核心
2018年第10期3025-3028,共4页
基金
国家自然科学基金资助项目(61370085)
文摘
当今时代数据呈现出指数级增长效应,更多的组织采用多数据中心和分布式来存储数据,Alluxio作为以内存为中心的虚拟分布式存储系统,整合了底层大数据生态系统。在Alluxio与底层存储结合的远程场景中,由于网络的延迟,使得I/O速度成为影响对外服务的重要因素之一。针对以上研究提出一种基于Alluxio远程场景下的缓存策略CPR,利用存储系统中数据块之间的关联性指导数据预取与替换,采用分组思想提高关联规则的利用率,启用后台线程实时更新规则集,并通过仿真实验验证策略的有效性。仿真结果表明,CPR策略指导下的I/O性能要优于Alluxio现有的缓存策略和一些基于数据块间关联规则的缓存策略。
关键词
数据块
关联规则
Alluxio
数据预取
数据替换
Keywords
data
block
association rule
Alluxio
data
prefetch
data replacement
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
PostgreSQL数据库预取算法研究
被引量:
3
9
作者
胡巧巧
王建民
叶晓俊
机构
清华大学软件学院
出处
《计算机科学》
CSCD
北大核心
2006年第3期138-139,159,共3页
基金
本课题得到了国家973计划项目(2004CB719400)
国家自然基金项目(60473077)
国家863计划项目(2003AA413230)资助
文摘
减少磁盘的存取时间是提高数据库性能的关键。本文讨论了 PostgreSQ L数据库顺序存取的特性,提出了一种 PostgreSQL 中顺序预取数据块的算法,预取的数据决数目可根据当前存取块之前的顺序存取情况作自适应调整。实验结果表明,该算法能有效地提高磁盘决的平均存取速度。
关键词
预取
顺序存取
POSTGRESQL
数据块
Keywords
prefetch
, Sequential access, PostgreSQL, Data
block
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
O121.5 [理学—基础数学]
下载PDF
职称材料
题名
一种面向实时系统的程序基本块指令预取技术
被引量:
4
10
作者
王恩东
倪璠
陈继承
王洪伟
唐士斌
机构
高效能服务器和存储技术国家重点实验室(浪潮(北京)电子信息产业有限公司)
出处
《软件学报》
EI
CSCD
北大核心
2016年第9期2426-2442,共17页
基金
国家高技术研究发展计划(863)(2013AA011701)~~
文摘
面向通用计算机系统的指令预取技术无法满足实时系统的应用需求,其中一个重要原因是:无效预取引起的指令Cache内容污染使得实时任务WCET评估值不够精确,导致系统可调度性下降,严重影响系统效率.以简化实时任务WCET分析、降低任务WCET评估值为目标,提出一种基于程序基本块的指令预取方法.该方法以基本块为粒度执行指令预取,避免了传统指令预取技术引入的无效预取;通过简化最坏情况下的指令访问命中/缺失情况判定,简化任务WCET分析过程并优化WCET评估值.实时基准测试程序评估结果表明:与常规无预取方法相比,该预取方法可使实时任务WCET评估值降低约20%,平均执行情况下的指令Cache访问性能提升约10%.
关键词
实时系统
最坏情况执行时间
高速缓存性能
指令预取
基本块
Keywords
real-time system
WCET
cache performance
instruction
prefetch
ing
basic
block
分类号
TP316 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于GPU架构的两层并行块Jacobi SVD算法
被引量:
2
11
作者
黄荣锋
赵永华
于天禹
刘世芳
机构
中国科学院计算机网络信息中心
中国科学院大学
出处
《数值计算与计算机应用》
2022年第4期380-399,共20页
基金
国家重点研发计划(2017YFB0202202)
中国科学院战略性先导科技专项(XDC05000000)
文摘
SVD(singularvaluedecomposition)广泛应用于图像处理、人脸识别、信号降噪等领域。本文基于单边JacobiSVD算法给出了块间和块内两层并行的块JacobiSVDGPU算法.为了更好地利用GPU的共享内存,块间并行通过存储矩阵列块之间的内积解决了共享内存不足的问题.此外,块间并行还通过矩阵块操作技术提高数据利用率及数据预取技术实现数据访问和数据计算的重叠.块内并行通过直接更新矩阵列块之间的内积替代了更新矩阵列块以及更新矩阵列块之后计算矩阵列块之间内积的归约操作,增加了GPU线程的利用率.另一方面,块内并行将需要多次访问的数据存储于共享内存或寄存器,减少了对全局内存的访问从而提升了算法实现性能。在NVIDIATeslaV100GPU上的数值实验结果表明,本文的算法较Cusolver库有1.8×倍的加速,较MAGMA库中最快的算法加速达2.5×倍.
关键词
奇异值分解
块Jacobi算法
并行算法
GPU
数据预取技术
Keywords
singular value decomposition
block
ed Jacobi algorithm
parallel algorithm
GPU
data
prefetch
ing
分类号
TP332 [自动化与计算机技术—计算机系统结构]
TP301.6 [自动化与计算机技术—计算机系统结构]
原文传递
题名
作者
出处
发文年
被引量
操作
1
异构双核的高分辨率折反射全景高速处理系统
陈立栋
张茂军
王炜
包卫东
金晗婧
《电子与信息学报》
EI
CSCD
北大核心
2009
5
下载PDF
职称材料
2
分布式系统卷重构过程的改写块预取方法
谭怀亮
王燕
孙建华
陈浩
《湖南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2009
4
下载PDF
职称材料
3
一种DSP折反射全景图像实时展开方法
程钢
熊志辉
陈立栋
王斌
张茂军
《计算机应用》
CSCD
北大核心
2008
3
下载PDF
职称材料
4
以基本块为单位的非顺序指令预取
沈立
戴葵
王志英
《计算机工程与科学》
CSCD
2003
4
下载PDF
职称材料
5
存储系统中的频繁访问模式挖掘
朱旭东
卜庆忠
柯剑
那文武
许鲁
《高技术通讯》
EI
CAS
CSCD
北大核心
2009
0
下载PDF
职称材料
6
高性能低功耗FT-XDSP的指令缓存队列
杨惠
孙永节
《小型微型计算机系统》
CSCD
北大核心
2010
0
下载PDF
职称材料
7
利用数据预取机制降低块执行模型的访存延迟
从明
安虹
张军
任永青
《小型微型计算机系统》
CSCD
北大核心
2010
2
下载PDF
职称材料
8
基于Alluxio远程场景下缓存策略的优化
董文菁
温东新
张展
《计算机应用研究》
CSCD
北大核心
2018
4
下载PDF
职称材料
9
PostgreSQL数据库预取算法研究
胡巧巧
王建民
叶晓俊
《计算机科学》
CSCD
北大核心
2006
3
下载PDF
职称材料
10
一种面向实时系统的程序基本块指令预取技术
王恩东
倪璠
陈继承
王洪伟
唐士斌
《软件学报》
EI
CSCD
北大核心
2016
4
下载PDF
职称材料
11
基于GPU架构的两层并行块Jacobi SVD算法
黄荣锋
赵永华
于天禹
刘世芳
《数值计算与计算机应用》
2022
2
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部