期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
76
篇文章
<
1
2
…
4
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于VRML的计算机组成原理课件开发
被引量:
1
1
作者
买桂英
《重庆文理学院学报(自然科学版)》
2009年第3期52-54,共3页
基于虚拟现实的互动课件是一种新型CAI课件。通过分析当前计算机硬件课程的教学现状和在教与学的过程中使用计算机虚拟技术的优势,在此基础上,介绍了一种基于虚拟现实技术的计算机组成原理互动课件的设计和开发。
关键词
VRML
互动
计算机组成原理
下载PDF
职称材料
有限元单元计算子程序的OpenMP并行化
被引量:
11
2
作者
宋刚
蒋孟奇
+1 位作者
张云泉
李玉成
《计算机工程》
CAS
CSCD
北大核心
2008年第6期80-81,84,共3页
Intel和AMD双核乃至4核处理器的推出,使得并行计算已经普及到PC机。为了充分利用多核,需要对原有程序进行多线程改造,使其充分利用多核处理带来的性能提升。该文利用共享存储编程的工业标准OpenMP对有限元方法涉及的单元计算子程序进行...
Intel和AMD双核乃至4核处理器的推出,使得并行计算已经普及到PC机。为了充分利用多核,需要对原有程序进行多线程改造,使其充分利用多核处理带来的性能提升。该文利用共享存储编程的工业标准OpenMP对有限元方法涉及的单元计算子程序进行了并行化实现。在机群的一个双CPU的SMP节点上的测试表明,共享并行化使得该单元子程序的性能提高了一倍。
展开更多
关键词
并行编程
多线程
多核
有限元
下载PDF
职称材料
基于横向局部性的多核计算模型
被引量:
2
3
作者
袁良
张云泉
《计算机科学》
CSCD
北大核心
2012年第7期1-6,共6页
片内多核已成为延长摩尔定律的方式,并行算法设计、编程模型、编译器和运行时系统都需要利用计算模型进行分析。现有多核模型对线程间共享缓存等资源的竞争已有较精确的模型,但是对于线程间数据共享考虑较少。提出线程间共享缓存的横向...
片内多核已成为延长摩尔定律的方式,并行算法设计、编程模型、编译器和运行时系统都需要利用计算模型进行分析。现有多核模型对线程间共享缓存等资源的竞争已有较精确的模型,但是对于线程间数据共享考虑较少。提出线程间共享缓存的横向局部性和任务共享率概念,基于此扩展串行存储层次模型RAM(h),提出考虑任务共享率的多核并行计算模型MRAM(h)。
展开更多
关键词
多核
并行计算模型
共享缓存
横向局部性
下载PDF
职称材料
并行计算模型参数动态分析软件包设计
4
作者
王向前
张云泉
侯晓吻
《计算机工程》
CAS
CSCD
北大核心
2009年第10期30-32,共3页
并行计算模型的发展引入越来越多的模型参数。对并行计算模型参数动态采集分析软件包DEMPAT的整体框架进行研究,实现基于硬件性能计数器的存储层次参数采集模块。实验表明,该模块能够准确快速地获取存储层次参数且具有较好的可移植性。
关键词
并行计算模型
机器参数
存储层次
下载PDF
职称材料
基于主流云计算技术的集群三元空间提取方法
5
作者
许春玲
张广泉
《电信科学》
北大核心
2010年第10期35-40,共6页
本文对目前代表性的云计算技术进行了回顾,选择其中的HDFS提取主要组成元素分析整理,抽象出若干对象集和关系集,进而提出集群三元空间。从抽象层面回归到具体实现,HDFS对集群三元空间的实现采用了集中式结构,形成了系统性能的瓶颈以及...
本文对目前代表性的云计算技术进行了回顾,选择其中的HDFS提取主要组成元素分析整理,抽象出若干对象集和关系集,进而提出集群三元空间。从抽象层面回归到具体实现,HDFS对集群三元空间的实现采用了集中式结构,形成了系统性能的瓶颈以及集群扩展的滞点。集群三元空间从抽象层面,剔除具体实现因素之后,给出了系统分析与问题定义的背景。
展开更多
关键词
HDFS
集群三元空间
GFS
Sector/Sphere
下载PDF
职称材料
SpMV的自动性能优化实现技术及其应用研究
被引量:
15
6
作者
袁娥
张云泉
+1 位作者
刘芳芳
孙相征
《计算机研究与发展》
EI
CSCD
北大核心
2009年第7期1117-1126,共10页
在科学计算中,稀疏矩阵向量乘(SpMV)是一个十分重要且经常被大量调用的计算内核.由于SpMV一般实现算法的浮点计算和存储访问次数比率非常低,且其存储访问模式极为不规则,其实际运行性能往往很低.通过采用寄存器分块算法和启发式分块大...
在科学计算中,稀疏矩阵向量乘(SpMV)是一个十分重要且经常被大量调用的计算内核.由于SpMV一般实现算法的浮点计算和存储访问次数比率非常低,且其存储访问模式极为不规则,其实际运行性能往往很低.通过采用寄存器分块算法和启发式分块大小选择算法,将稀疏矩阵分成小的稠密分块,重用保存在寄存器中向量x元素,可以提高该计算内核的性能.剖析和总结了OSKI软件包所采用的若干关键优化技术,并进行了实际应用性能测试.测试表明,在实际应用这些优化技术的过程中,应用程序对SpMV的调用次数要达到上百次的量级,才能抵消由于应用这些性能优化技术所带来的额外时间开销,取得性能加速效果.在Pentium4和AMD Athlon平台上,测试了10个矩阵,其平均加速比分别达到了1.69和1.48.
展开更多
关键词
稀疏矩阵向量乘
启发式算法
自适应性能优化
存储访问模式
寄存器分块
下载PDF
职称材料
基于XYZ/ADL的Web服务组合描述与验证
被引量:
6
7
作者
张广泉
戎玫
+2 位作者
朱雪阳
何亚丽
石慧娟
《电子学报》
EI
CAS
CSCD
北大核心
2011年第A03期86-93,共8页
Web服务组合是当前Web服务领域的一个研究热点,目前已有一些相关的描述与验证方法,本文从软件体系结构角度研究Web服务组合描述与验证方法.基于软件体系结构描述语言XYZ/ADL和精化检验/模型检测方法,提出了一种Web服务组合的描述与验证...
Web服务组合是当前Web服务领域的一个研究热点,目前已有一些相关的描述与验证方法,本文从软件体系结构角度研究Web服务组合描述与验证方法.基于软件体系结构描述语言XYZ/ADL和精化检验/模型检测方法,提出了一种Web服务组合的描述与验证方法.XYZ/ADL是时序逻辑语言XYZ/E的扩展,考虑到多数Web服务具有实时特征,采用XYZ/E的实时扩展语言XYZ/RE表示系统应满足的时间约束.针对Web服务组合系统,根据XYZ/RE到时间自动机的映射规则将系统描述转换为对应的时间自动机,分别采用精化检验和模型检测两种技术验证Web服务组合的正确性;最后通过两个实例分析分别阐述了上述方法的可行性和有效性.
展开更多
关键词
WEB服务组合
XYZ/ADL
XYZ/RE
时间自动机
精化检验
模型检测
下载PDF
职称材料
带传递关系和存在量词的描述逻辑MSC推理
被引量:
7
8
作者
蒋运承
唐素勤
+1 位作者
王驹
周生明
《计算机研究与发展》
EI
CSCD
北大核心
2009年第6期979-987,共9页
分析了描述逻辑非标准推理的重要性,特别分析了描述逻辑MSC推理的研究现状和存在的问题.针对目前描述逻辑MSC推理不能同时处理传递关系和存在量词的不足,研究了带传递关系和存在量词的描述逻辑εL+的MSC推理问题.提出了一种新的εL+-描...
分析了描述逻辑非标准推理的重要性,特别分析了描述逻辑MSC推理的研究现状和存在的问题.针对目前描述逻辑MSC推理不能同时处理传递关系和存在量词的不足,研究了带传递关系和存在量词的描述逻辑εL+的MSC推理问题.提出了一种新的εL+-描述图,利用描述树和描述图给出了描述逻辑εL+的MSC近似推理算法,并利用εL+-描述树同态和εL+-描述树描述图同态证明了MSC近似推理算法的正确性.作为一个附带的结果,利用εL+-描述树描述图同态给出了εL+的实例推理算法,也证明了实例推理算法的正确性.
展开更多
关键词
描述逻辑
传递关系
存在量词
MSC
描述树
描述图
下载PDF
职称材料
SIMD技术与向量数学库研究
被引量:
10
9
作者
解庆春
张云泉
+2 位作者
王可
李焱
许亚武
《计算机科学》
CSCD
北大核心
2011年第7期298-301,共4页
首先,结合Intel,AMD和IBM处理器,介绍了单指令流多数据流(SIMD)向量化技术及其各自的特点。其次,在3种平台上对各自开发的函数库中的部分向量数学函数进行了测试。结果表明,相对传统的标量计算,向量化技术带来的加速比较高,特别是Cell ...
首先,结合Intel,AMD和IBM处理器,介绍了单指令流多数据流(SIMD)向量化技术及其各自的特点。其次,在3种平台上对各自开发的函数库中的部分向量数学函数进行了测试。结果表明,相对传统的标量计算,向量化技术带来的加速比较高,特别是Cell SDK函数,因其独特的体系结构,多个向量处理单元带来的平均加速比为10。最后,通过测试结果的对比,发现不同数学库中的向量函数之间在性能方面也存在着差异,并对差异原因进行了分析,得出性能差异主要是处理器架构和向量计算单元个数和访存等因素造成的。
展开更多
关键词
向量化
SSE
MMX
3DNow!
SIMD
下载PDF
职称材料
一种改进的OpenMP指导调度策略研究
被引量:
15
10
作者
刘胜飞
张云泉
孙相征
《计算机研究与发展》
EI
CSCD
北大核心
2010年第4期687-694,共8页
在科学计算中,循环结构是最重要的并行对象之一.考虑到负载平衡、调度开销等多方面因素,OpenMP标准提供静态调度、动态调度、指导调度和运行时调度等不同策略.针对指导调度策略不适合递减型循环结构的问题,提出一种改进的new_guided指...
在科学计算中,循环结构是最重要的并行对象之一.考虑到负载平衡、调度开销等多方面因素,OpenMP标准提供静态调度、动态调度、指导调度和运行时调度等不同策略.针对指导调度策略不适合递减型循环结构的问题,提出一种改进的new_guided指导调度策略,并在OMPi编译器上加以实现.New_guided调度策略的主要思想是对前半部分的循环采用静态调度,后半部分的循环采用指导调度.针对不同循环结构,在多核处理器上对不同调度策略进行评测.结果表明,在一般情况下,OpenMP默认的静态策略的调度性能最差;对于规则的循环结构和递增的循环结构,动态调度、指导调度和new_guided策略的性能差别不大;对于递减型的循环结构,动态调度和new_guided策略的性能相当,要优于指导调度策略;对于某些极不规则的随机循环结构,动态调度明显优于其他策略,new_guided策略的性能介于动态调度和指导调度之间.
展开更多
关键词
OPENMP
负载平衡
静态调度
动态调度
指导调度
OMPi
下载PDF
职称材料
体育视频中的运动员检测与跟踪
被引量:
8
11
作者
吴海松
华庆一
+1 位作者
李光俊
沈婧
《计算机工程》
CAS
CSCD
北大核心
2008年第19期230-232,235,共4页
利用自适应高斯混合模型对视频图像进行建模,从图像序列中获取背景图像并提取运动区域,利用像素的颜色信息从背景图像中提取绿色球场。为提高运动员检测的准确度,利用纹理相似性度量方法消除运动区域中的阴影,用形态学方法消除区域内的...
利用自适应高斯混合模型对视频图像进行建模,从图像序列中获取背景图像并提取运动区域,利用像素的颜色信息从背景图像中提取绿色球场。为提高运动员检测的准确度,利用纹理相似性度量方法消除运动区域中的阴影,用形态学方法消除区域内的裂缝,根据球场信息去除球场外的噪声。改进了CamShift算法,并应用该算法对运动员进行跟踪。
展开更多
关键词
自适应高斯混合模型
球场检测
运动员检测
运动员跟踪
CAMSHIFT算法
下载PDF
职称材料
GOTOBLAS一般矩阵乘法高效实现机制的研究
被引量:
8
12
作者
蒋孟奇
张云泉
+1 位作者
宋刚
李玉成
《计算机工程》
CAS
CSCD
北大核心
2008年第7期84-86,103,共4页
对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析。结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度。对比实验表明,GOTO库的性能远远高于没...
对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析。结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度。对比实验表明,GOTO库的性能远远高于没有考虑存储层次的一般BLAS库。证明了GOTO库性能上的优越性和将存储层次引入计算模型的必要性。
展开更多
关键词
GOTOBLAS库
一般矩阵乘法
存储层次
分块算法
计算模型
下载PDF
职称材料
一种可信的信息物理融合系统设计框架初探
被引量:
12
13
作者
张侃
张广泉
张茗泰
《计算机研究与发展》
EI
CSCD
北大核心
2011年第S2期242-246,共5页
信息物理融合系统(CPS)连接物理世界和计算系统,由计算核心监控,是一种物理进程和计算进程紧密结合的系统.对CPS的研究目前还处于初步探索阶段,还没有完整的理论框架和技术体系,关于CPS系统的正确性以及安全性的研究尤其空缺.针对这一问...
信息物理融合系统(CPS)连接物理世界和计算系统,由计算核心监控,是一种物理进程和计算进程紧密结合的系统.对CPS的研究目前还处于初步探索阶段,还没有完整的理论框架和技术体系,关于CPS系统的正确性以及安全性的研究尤其空缺.针对这一问题,结合形式化方法和面向方面技术,初步提出一种可信的CPS设计框架,并阐述了该框架的主要设计过程及需要解决的关键问题.
展开更多
关键词
信息物理融合系统
可信
形式化方法
面向方面技术
下载PDF
职称材料
面向城市交通网络的一种新型动态路径寻优方法
被引量:
13
14
作者
曹政才
韩丁富
王永吉
《电子学报》
EI
CAS
CSCD
北大核心
2012年第10期2062-2067,共6页
针对静态路径寻优方法中没有考虑到交通流随时间变化的问题,本文提出一种基于交通流量预测的路径寻优方法.首先,从实际交通路网本身的特点和人类对路网的认识出发,构建以"道路"为基本元素的新型路网模型;其次,采用基于单变量...
针对静态路径寻优方法中没有考虑到交通流随时间变化的问题,本文提出一种基于交通流量预测的路径寻优方法.首先,从实际交通路网本身的特点和人类对路网的认识出发,构建以"道路"为基本元素的新型路网模型;其次,采用基于单变量时间序列的预测方法对路网上各路段未来一段时间内的道路交通流量进行预测,并根据预测结果估计出行者在未来时段各路段上的交通代价;再次,通过估计的交通代价把车辆从起点到该路段时间内的道路交通变化状况融入改进A*算法的路径搜索过程,从而建立一种高效的动态改进A*路径搜索算法;最后,实例表明预测交通流量与实际交通流量具有很好的拟合度,路径搜索结果能够对出行者起到诱导作用,提高出行者行驶效率.
展开更多
关键词
交通流预测
路径搜索算法
路网模型
下载PDF
职称材料
基于改进遗传算法的快速自动组卷算法研究
被引量:
20
15
作者
陈国彬
张广泉
《计算机应用研究》
CSCD
北大核心
2015年第10期2996-2998,3003,共4页
为了克服现有的试题管理系统在试卷生成环节的速度和质量上存在的缺陷,将粗粒度并行遗传算法与自适应技术相结合,提出了一种自适应调整种群迁移的快速并行遗传算法。分别从试题库的编码方案、遗传策略、适应度函数的优化、交叉变异算子...
为了克服现有的试题管理系统在试卷生成环节的速度和质量上存在的缺陷,将粗粒度并行遗传算法与自适应技术相结合,提出了一种自适应调整种群迁移的快速并行遗传算法。分别从试题库的编码方案、遗传策略、适应度函数的优化、交叉变异算子的选择和自适应度值函数的选取等方面进行设计,取得了很好的适应度,同时采用并行的策略,提高了算法的运行速度。仿真实验结果表明,该算法能够成功应用于自动组卷,并且组卷效率和成功率都得到了明显的提高,具有很好的通用性。该算法用于智能快速自动组卷是可行的、有效的。
展开更多
关键词
试题管理系统
数据挖掘
组卷算法
遗传算法
粗粒度
下载PDF
职称材料
基于Petri网的容错系统分层建模
被引量:
9
16
作者
周月明
杜玉越
刘伟
《计算机工程》
CAS
CSCD
北大核心
2010年第2期39-41,共3页
扩展Petri网的结构,将一般的控制管理系统改进为具有容错功能的控制管理系统,应用扩展Petri网对其进行分层建模,包括系统的基础层、检错层、恢复层。采用故障恢复策略并使用带有基于Petri网分层模型中状态标识的行为跟踪、行为检错和行...
扩展Petri网的结构,将一般的控制管理系统改进为具有容错功能的控制管理系统,应用扩展Petri网对其进行分层建模,包括系统的基础层、检错层、恢复层。采用故障恢复策略并使用带有基于Petri网分层模型中状态标识的行为跟踪、行为检错和行为改错增加控制管理系统的容错功能,并分析了模型的正确性。
展开更多
关键词
PETRI网
容错
分层建模
检错
下载PDF
职称材料
时间感知Web服务交互行为建模与失配检测方法研究
被引量:
6
17
作者
张广泉
戎玫
王昇
《电子学报》
EI
CAS
CSCD
北大核心
2011年第11期2568-2575,共8页
针对现有Web服务组合过程中存在时间感知力弱、服务利用率低、组合可靠性差等问题,通过将定量时间属性引入Web服务交互适配框架中,研究时间感知Web服务交互行为的形式化建模与交互行为失配的自动检测问题.提出了用于表达单个时间感知We...
针对现有Web服务组合过程中存在时间感知力弱、服务利用率低、组合可靠性差等问题,通过将定量时间属性引入Web服务交互适配框架中,研究时间感知Web服务交互行为的形式化建模与交互行为失配的自动检测问题.提出了用于表达单个时间感知Web服务交互行为的时间服务协议(TSP)模型和用于表达多个时间感知Web服务并发组合的时间服务协议网络(TSPN)模型;将时间感知Web服务交互失配检测问题转化为TSP模型之间的兼容性判定问题,定义了从时间感知Web服务描述至TSP模型和从TSP模型至UPPAAL规约的映射规则,给出了TSP模型兼容性性质的CTL公式表示,基于模型检测工具UPPAAL实现时间感知Web服务交互失配的自动化检测,其检测结果作为下一步是否需要构造适配器的判断依据;最后通过实例分析进一步阐述了上述方法的可行性和有效性.
展开更多
关键词
时间感知Web服务
时间服务协议
时间服务交互
模型检测
失配检测
下载PDF
职称材料
一种考虑网络能效优化的队列管理方法
被引量:
6
18
作者
蒋丽丽
陈国彬
张广泉
《四川大学学报(自然科学版)》
CAS
CSCD
北大核心
2017年第3期499-503,共5页
针对网络数据传输过程中传输速率慢、网络能耗高等问题,本文基于混合引力搜索算法HGSA提出了一种队列管理方法.该方法首先给出了网络能效评价指标,以此衡量网络的有效信息容量和传输速率.同时利用混合引力搜索算法来对队列管理方法进行...
针对网络数据传输过程中传输速率慢、网络能耗高等问题,本文基于混合引力搜索算法HGSA提出了一种队列管理方法.该方法首先给出了网络能效评价指标,以此衡量网络的有效信息容量和传输速率.同时利用混合引力搜索算法来对队列管理方法进行优化.最后通过数学仿真,分析了队列长度、数据包大小等对网络能效的影响,结果证明了该方法具有较好的适应性.
展开更多
关键词
队列管理方法
网络能效
混合引力搜索算法
队列长度
下载PDF
职称材料
基于模糊Petri网推理的半导体生产线投料控制策略
被引量:
5
19
作者
曹政才
赵会丹
王永吉
《电子学报》
EI
CAS
CSCD
北大核心
2011年第7期1545-1550,共6页
半导体生产线存在大量随机不确定因素,各种不确定扰动的发生,往往使已获得优化调度方案在执行过程中失去优良性,鉴于模糊Petri网在知识表达和逻辑推理方面的优势,本文研究将该思想用于半导体生产线投料控制,构建投料模糊Petri网推理模型...
半导体生产线存在大量随机不确定因素,各种不确定扰动的发生,往往使已获得优化调度方案在执行过程中失去优良性,鉴于模糊Petri网在知识表达和逻辑推理方面的优势,本文研究将该思想用于半导体生产线投料控制,构建投料模糊Petri网推理模型,建立完整的在线投料机制,以生产线实时信息为依据,决定系统采取的投料控制行为,以便尽可能发挥系统的生产能力,优化系统制造性能.最后,以某半导体生产线为例进行投料控制实验,结果表明,该策略是可行有效的.
展开更多
关键词
半导体生产线
投料策略
模糊PETRI网
下载PDF
职称材料
数值软件自适应性能优化搜索过程评价技术研究
被引量:
2
20
作者
孙相征
张云泉
+1 位作者
王宣强
王磊
《计算机研究与发展》
EI
CSCD
北大核心
2010年第4期679-686,共8页
随着计算机硬件的快速变化,如何充分利用计算机资源,使软件性能尽可能逼近处理器峰值是人们关心的问题.针对特定硬件平台手工优化程序,或者依赖编译器优化技术,存在人工介入,难与硬件更新同步等问题.而采用自适应性能优化技术实现的高...
随着计算机硬件的快速变化,如何充分利用计算机资源,使软件性能尽可能逼近处理器峰值是人们关心的问题.针对特定硬件平台手工优化程序,或者依赖编译器优化技术,存在人工介入,难与硬件更新同步等问题.而采用自适应性能优化技术实现的高性能数学软件包(SANS)如FFTW,ATLAS,PHiPAC,OSKI等,可有效解决前两种方法存在的问题,降低开发成本,提高软件可移植性.针对自适应性能优化技术中,优化参数搜索过程十分耗时的问题,提出对优化搜索过程的评价指标Pt,并给出用此指标控制优化搜索过程的方法.实验表明运用该指标可以在较短的时间内得到一个合理的性能值.
展开更多
关键词
自适应
优化过程评价指标
优化参数
性能跟踪
ATLAS
GEMM
下载PDF
职称材料
题名
基于VRML的计算机组成原理课件开发
被引量:
1
1
作者
买桂英
机构
甘肃民族师范
学院
计算机
系
中国科学院计算机科学国家重点实验室
出处
《重庆文理学院学报(自然科学版)》
2009年第3期52-54,共3页
基金
中国科学院计算机科学国家重点实验室开放课题基金资助项目(SYSKF0704)
国家863高技术发展研究计划资助项目(2006AA01Z328)
文摘
基于虚拟现实的互动课件是一种新型CAI课件。通过分析当前计算机硬件课程的教学现状和在教与学的过程中使用计算机虚拟技术的优势,在此基础上,介绍了一种基于虚拟现实技术的计算机组成原理互动课件的设计和开发。
关键词
VRML
互动
计算机组成原理
Keywords
VRML
interaction
computer principle
分类号
TP301 [自动化与计算机技术—计算机系统结构]
G434 [文化科学—教育技术学]
下载PDF
职称材料
题名
有限元单元计算子程序的OpenMP并行化
被引量:
11
2
作者
宋刚
蒋孟奇
张云泉
李玉成
机构
中国科学院
研究生院
中国科学院
软件研究所并行
计算
实验室
中国科学院计算机科学国家重点实验室
中国科学院
软件研究所并行
计算
实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第6期80-81,84,共3页
基金
国家自然科学基金资助项目(60303020)
国家自然科学基金资助重点项目(60533020)
+2 种基金
国家“973”计划基金资助项目(2005CB321702)
国家“863”计划基金资助项目(2006AA01A102,2006AA01A125)
北京邮电大学网络与交换技术国家重点实验室开放课题基金资助项目(2005-05)
文摘
Intel和AMD双核乃至4核处理器的推出,使得并行计算已经普及到PC机。为了充分利用多核,需要对原有程序进行多线程改造,使其充分利用多核处理带来的性能提升。该文利用共享存储编程的工业标准OpenMP对有限元方法涉及的单元计算子程序进行了并行化实现。在机群的一个双CPU的SMP节点上的测试表明,共享并行化使得该单元子程序的性能提高了一倍。
关键词
并行编程
多线程
多核
有限元
Keywords
parallel programming
mulfithread
multi-core
finite element
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于横向局部性的多核计算模型
被引量:
2
3
作者
袁良
张云泉
机构
中国科学院
软件研究所并行软件与
计算
科学
实验室
中国科学院
研究生院
中国科学院计算机科学国家重点实验室
出处
《计算机科学》
CSCD
北大核心
2012年第7期1-6,共6页
基金
863计划(2006AA01A125
2009AA01A129
+3 种基金
2009AA01A134)
核高基(2009ZX01036-001-002)
中国科学院知识创新工程重大项目课题(KGCX1-YW-13)
财政部国家重大科研装备研制项目(ZDYZ2008-2)资助
文摘
片内多核已成为延长摩尔定律的方式,并行算法设计、编程模型、编译器和运行时系统都需要利用计算模型进行分析。现有多核模型对线程间共享缓存等资源的竞争已有较精确的模型,但是对于线程间数据共享考虑较少。提出线程间共享缓存的横向局部性和任务共享率概念,基于此扩展串行存储层次模型RAM(h),提出考虑任务共享率的多核并行计算模型MRAM(h)。
关键词
多核
并行计算模型
共享缓存
横向局部性
Keywords
Multi-core, Parallel computational model, Shared cache, Horizontal locality
分类号
TP317 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
并行计算模型参数动态分析软件包设计
4
作者
王向前
张云泉
侯晓吻
机构
中国科学院
软件研究所并行
计算
实验室
中国科学院
研究生院
中国科学院计算机科学国家重点实验室
杭州电子科技大学
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第10期30-32,共3页
基金
国家自然科学基金资助项目(60303020
60533020)
+2 种基金
国家"863"计划基金资助项目(2006AA01A102
2006AA01A125)
北京邮电大学网络与交换技术国家重点实验室开放课题基金资助项目(2005-05)
文摘
并行计算模型的发展引入越来越多的模型参数。对并行计算模型参数动态采集分析软件包DEMPAT的整体框架进行研究,实现基于硬件性能计数器的存储层次参数采集模块。实验表明,该模块能够准确快速地获取存储层次参数且具有较好的可移植性。
关键词
并行计算模型
机器参数
存储层次
Keywords
parallel computational model
machine parameter
memory hierarchy
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于主流云计算技术的集群三元空间提取方法
5
作者
许春玲
张广泉
机构
苏州大学
计算机
科学
与技术
学院
中国科学院计算机科学国家重点实验室
出处
《电信科学》
北大核心
2010年第10期35-40,共6页
基金
国家自然科学基金资助项目(No.60873047)
中国科学院计算机科学国家重点实验室开放课题(No.SYSKF0908)
江苏省高校自然科学研究项目(No.08KJB520010)
文摘
本文对目前代表性的云计算技术进行了回顾,选择其中的HDFS提取主要组成元素分析整理,抽象出若干对象集和关系集,进而提出集群三元空间。从抽象层面回归到具体实现,HDFS对集群三元空间的实现采用了集中式结构,形成了系统性能的瓶颈以及集群扩展的滞点。集群三元空间从抽象层面,剔除具体实现因素之后,给出了系统分析与问题定义的背景。
关键词
HDFS
集群三元空间
GFS
Sector/Sphere
Keywords
HDFS
triplet-space
GFS
Sector/Sphere
分类号
TN929.5 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
SpMV的自动性能优化实现技术及其应用研究
被引量:
15
6
作者
袁娥
张云泉
刘芳芳
孙相征
机构
中国科学院
软件研究所并行
计算
实验室
中国科学院
研究生院
中国科学院计算机科学国家重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第7期1117-1126,共10页
基金
国家自然科学基金项目(60303020)
国家自然科学基金重点项目(60533020)
+1 种基金
国家"八六三"高技术研究发展计划基金项目(2006AA01A102
2006AA01A125)~~
文摘
在科学计算中,稀疏矩阵向量乘(SpMV)是一个十分重要且经常被大量调用的计算内核.由于SpMV一般实现算法的浮点计算和存储访问次数比率非常低,且其存储访问模式极为不规则,其实际运行性能往往很低.通过采用寄存器分块算法和启发式分块大小选择算法,将稀疏矩阵分成小的稠密分块,重用保存在寄存器中向量x元素,可以提高该计算内核的性能.剖析和总结了OSKI软件包所采用的若干关键优化技术,并进行了实际应用性能测试.测试表明,在实际应用这些优化技术的过程中,应用程序对SpMV的调用次数要达到上百次的量级,才能抵消由于应用这些性能优化技术所带来的额外时间开销,取得性能加速效果.在Pentium4和AMD Athlon平台上,测试了10个矩阵,其平均加速比分别达到了1.69和1.48.
关键词
稀疏矩阵向量乘
启发式算法
自适应性能优化
存储访问模式
寄存器分块
Keywords
sparse matrix-vector multiplication
heuristic algorithm
self-adapting algorithm
memory access pattern
register-level blocking
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于XYZ/ADL的Web服务组合描述与验证
被引量:
6
7
作者
张广泉
戎玫
朱雪阳
何亚丽
石慧娟
机构
苏州大学
计算机
科学
与技术
学院
中国科学院计算机科学国家重点实验室
暨南大学深圳旅游
学院
出处
《电子学报》
EI
CAS
CSCD
北大核心
2011年第A03期86-93,共8页
基金
国家自然科学基金(No.60973149)
中国科学院计算机科学国家重点实验室开放课题(No.SYSKF0908)
江苏省高校自然科学研究项目(No.08KJB520010)
文摘
Web服务组合是当前Web服务领域的一个研究热点,目前已有一些相关的描述与验证方法,本文从软件体系结构角度研究Web服务组合描述与验证方法.基于软件体系结构描述语言XYZ/ADL和精化检验/模型检测方法,提出了一种Web服务组合的描述与验证方法.XYZ/ADL是时序逻辑语言XYZ/E的扩展,考虑到多数Web服务具有实时特征,采用XYZ/E的实时扩展语言XYZ/RE表示系统应满足的时间约束.针对Web服务组合系统,根据XYZ/RE到时间自动机的映射规则将系统描述转换为对应的时间自动机,分别采用精化检验和模型检测两种技术验证Web服务组合的正确性;最后通过两个实例分析分别阐述了上述方法的可行性和有效性.
关键词
WEB服务组合
XYZ/ADL
XYZ/RE
时间自动机
精化检验
模型检测
Keywords
Web services composition
XYZ/ADL
XYZ/RE
timed automata
refinement checking
model checking
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
带传递关系和存在量词的描述逻辑MSC推理
被引量:
7
8
作者
蒋运承
唐素勤
王驹
周生明
机构
广西师范大学
计算机
科学
与信息工程
学院
中国科学院计算机科学国家重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2009年第6期979-987,共9页
基金
国家自然科学基金项目(60663001
60573010
+4 种基金
60673135)
中国科学院计算机科学国家重点实验室开放课题项目(SYSKF0904)
广西自然科学基金项目(桂科青0640030
桂科自0991100)
广西科学研究与技术开发计划基金项目(桂科攻0719001-11)~~
文摘
分析了描述逻辑非标准推理的重要性,特别分析了描述逻辑MSC推理的研究现状和存在的问题.针对目前描述逻辑MSC推理不能同时处理传递关系和存在量词的不足,研究了带传递关系和存在量词的描述逻辑εL+的MSC推理问题.提出了一种新的εL+-描述图,利用描述树和描述图给出了描述逻辑εL+的MSC近似推理算法,并利用εL+-描述树同态和εL+-描述树描述图同态证明了MSC近似推理算法的正确性.作为一个附带的结果,利用εL+-描述树描述图同态给出了εL+的实例推理算法,也证明了实例推理算法的正确性.
关键词
描述逻辑
传递关系
存在量词
MSC
描述树
描述图
Keywords
description logic
transitive role,
existential restriction
MSC
description tree
description graph
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
SIMD技术与向量数学库研究
被引量:
10
9
作者
解庆春
张云泉
王可
李焱
许亚武
机构
中国科学院
软件研究所并行软件与
计算
科学
实验室
中国科学院计算机科学国家重点实验室
中国科学院
研究生院
广州大学网络与现代教育技术中心
出处
《计算机科学》
CSCD
北大核心
2011年第7期298-301,共4页
基金
国家863项目(2006AA01A125
2009AA01A129
+2 种基金
2009AA01A134)
国家自然科学基金项目(60303032)
国家自然基金重点项目(60533020)资助
文摘
首先,结合Intel,AMD和IBM处理器,介绍了单指令流多数据流(SIMD)向量化技术及其各自的特点。其次,在3种平台上对各自开发的函数库中的部分向量数学函数进行了测试。结果表明,相对传统的标量计算,向量化技术带来的加速比较高,特别是Cell SDK函数,因其独特的体系结构,多个向量处理单元带来的平均加速比为10。最后,通过测试结果的对比,发现不同数学库中的向量函数之间在性能方面也存在着差异,并对差异原因进行了分析,得出性能差异主要是处理器架构和向量计算单元个数和访存等因素造成的。
关键词
向量化
SSE
MMX
3DNow!
SIMD
Keywords
Vectorization
SSE
MMX
3DNow!
SIMD
分类号
TP338.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一种改进的OpenMP指导调度策略研究
被引量:
15
10
作者
刘胜飞
张云泉
孙相征
机构
中国科学院
软件研究所并行
计算
实验室
中国科学院
研究生院
中国科学院计算机科学国家重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2010年第4期687-694,共8页
基金
国家自然科学基金重点项目(60533020)
国家"八六三"高技术研究发展计划基金项目(2006AA01A125
+2 种基金
2009AA01A129
2009AA01A134)
中国科学院知识创新工程重大项目课题(KGCX1-YW-13)~~
文摘
在科学计算中,循环结构是最重要的并行对象之一.考虑到负载平衡、调度开销等多方面因素,OpenMP标准提供静态调度、动态调度、指导调度和运行时调度等不同策略.针对指导调度策略不适合递减型循环结构的问题,提出一种改进的new_guided指导调度策略,并在OMPi编译器上加以实现.New_guided调度策略的主要思想是对前半部分的循环采用静态调度,后半部分的循环采用指导调度.针对不同循环结构,在多核处理器上对不同调度策略进行评测.结果表明,在一般情况下,OpenMP默认的静态策略的调度性能最差;对于规则的循环结构和递增的循环结构,动态调度、指导调度和new_guided策略的性能差别不大;对于递减型的循环结构,动态调度和new_guided策略的性能相当,要优于指导调度策略;对于某些极不规则的随机循环结构,动态调度明显优于其他策略,new_guided策略的性能介于动态调度和指导调度之间.
关键词
OPENMP
负载平衡
静态调度
动态调度
指导调度
OMPi
Keywords
OpenMP
load balance
static scheduling
dynamic scheduling
guided scheduling
OMPi
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
体育视频中的运动员检测与跟踪
被引量:
8
11
作者
吴海松
华庆一
李光俊
沈婧
机构
西北大学信息
学院
计算机
科学
系
中国科学院计算机科学国家重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第19期230-232,235,共4页
基金
国家“863”计划基金资助项目(2006AA01Z328)
中科院计算机科学国家重点实验室开放课题基金资助项目(SYSKF0704)
文摘
利用自适应高斯混合模型对视频图像进行建模,从图像序列中获取背景图像并提取运动区域,利用像素的颜色信息从背景图像中提取绿色球场。为提高运动员检测的准确度,利用纹理相似性度量方法消除运动区域中的阴影,用形态学方法消除区域内的裂缝,根据球场信息去除球场外的噪声。改进了CamShift算法,并应用该算法对运动员进行跟踪。
关键词
自适应高斯混合模型
球场检测
运动员检测
运动员跟踪
CAMSHIFT算法
Keywords
adaptive GMM
playfield detection
player detection
player tracking
CamShift algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
GOTOBLAS一般矩阵乘法高效实现机制的研究
被引量:
8
12
作者
蒋孟奇
张云泉
宋刚
李玉成
机构
中国科学院
软件研究所并行
计算
实验室
中国科学院
研究生院
中国科学院计算机科学国家重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第7期84-86,103,共4页
基金
国家自然科学基金资助项目(60303020)
国家自然科学基金资助重点项目(60533020)
+1 种基金
国家“973”计划基金资助项目(2005CB321702)
国家“863”计划基金资助项目(2006AA01A102,2006AA01A125)
文摘
对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析。结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度。对比实验表明,GOTO库的性能远远高于没有考虑存储层次的一般BLAS库。证明了GOTO库性能上的优越性和将存储层次引入计算模型的必要性。
关键词
GOTOBLAS库
一般矩阵乘法
存储层次
分块算法
计算模型
Keywords
GOTOBLAS
general matrix-matrix multiplication
hierarchical memory
blocking algorithm
computational models
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种可信的信息物理融合系统设计框架初探
被引量:
12
13
作者
张侃
张广泉
张茗泰
机构
苏州大学
计算机
科学
与技术
学院
中国科学院计算机科学国家重点实验室
出处
《计算机研究与发展》
EI
CSCD
北大核心
2011年第S2期242-246,共5页
基金
中国科学院计算机科学国家重点实验室开放课题(SYSKF0908)
江苏省自然科学基金项目(BK2011152)
文摘
信息物理融合系统(CPS)连接物理世界和计算系统,由计算核心监控,是一种物理进程和计算进程紧密结合的系统.对CPS的研究目前还处于初步探索阶段,还没有完整的理论框架和技术体系,关于CPS系统的正确性以及安全性的研究尤其空缺.针对这一问题,结合形式化方法和面向方面技术,初步提出一种可信的CPS设计框架,并阐述了该框架的主要设计过程及需要解决的关键问题.
关键词
信息物理融合系统
可信
形式化方法
面向方面技术
Keywords
Cyber-Physical Systems
Trusted
Formal Method
Aspect-oriented technology
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
面向城市交通网络的一种新型动态路径寻优方法
被引量:
13
14
作者
曹政才
韩丁富
王永吉
机构
北京化工大学信息
科学
与技术
学院
中国科学院计算机科学国家重点实验室
出处
《电子学报》
EI
CAS
CSCD
北大核心
2012年第10期2062-2067,共6页
基金
北京市优秀人才培养课题(No.2010D009016000001)
文摘
针对静态路径寻优方法中没有考虑到交通流随时间变化的问题,本文提出一种基于交通流量预测的路径寻优方法.首先,从实际交通路网本身的特点和人类对路网的认识出发,构建以"道路"为基本元素的新型路网模型;其次,采用基于单变量时间序列的预测方法对路网上各路段未来一段时间内的道路交通流量进行预测,并根据预测结果估计出行者在未来时段各路段上的交通代价;再次,通过估计的交通代价把车辆从起点到该路段时间内的道路交通变化状况融入改进A*算法的路径搜索过程,从而建立一种高效的动态改进A*路径搜索算法;最后,实例表明预测交通流量与实际交通流量具有很好的拟合度,路径搜索结果能够对出行者起到诱导作用,提高出行者行驶效率.
关键词
交通流预测
路径搜索算法
路网模型
Keywords
traffic flow prediction
path searching algorithm
mad network model
分类号
TP302.7 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于改进遗传算法的快速自动组卷算法研究
被引量:
20
15
作者
陈国彬
张广泉
机构
重庆工商大学融智
学院
苏州大学
计算机
科学
与技术
学院
中国科学院计算机科学国家重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2015年第10期2996-2998,3003,共4页
基金
重庆市教委科学技术研究项目(KJ133103)
江苏省自然科学基金资助项目(BK2011152)
中国科学院计算机科学国家重点实验室开放课题(CSYSKF0908)
文摘
为了克服现有的试题管理系统在试卷生成环节的速度和质量上存在的缺陷,将粗粒度并行遗传算法与自适应技术相结合,提出了一种自适应调整种群迁移的快速并行遗传算法。分别从试题库的编码方案、遗传策略、适应度函数的优化、交叉变异算子的选择和自适应度值函数的选取等方面进行设计,取得了很好的适应度,同时采用并行的策略,提高了算法的运行速度。仿真实验结果表明,该算法能够成功应用于自动组卷,并且组卷效率和成功率都得到了明显的提高,具有很好的通用性。该算法用于智能快速自动组卷是可行的、有效的。
关键词
试题管理系统
数据挖掘
组卷算法
遗传算法
粗粒度
Keywords
test management system
data mining
group algorithm
genetic algorithm
coarse-grained
分类号
TP274 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
基于Petri网的容错系统分层建模
被引量:
9
16
作者
周月明
杜玉越
刘伟
机构
山东科技大学信息
科学
与工程
学院
中国科学院计算机科学国家重点实验室
出处
《计算机工程》
CAS
CSCD
北大核心
2010年第2期39-41,共3页
基金
国家自然科学基金资助项目(60773034
90818023
+2 种基金
60803032)
山东省科技发展计划基金资助项目(2008GG30001024)
山东科技大学2009-2010年度研究生创新基金资助项目(YCA090319)
文摘
扩展Petri网的结构,将一般的控制管理系统改进为具有容错功能的控制管理系统,应用扩展Petri网对其进行分层建模,包括系统的基础层、检错层、恢复层。采用故障恢复策略并使用带有基于Petri网分层模型中状态标识的行为跟踪、行为检错和行为改错增加控制管理系统的容错功能,并分析了模型的正确性。
关键词
PETRI网
容错
分层建模
检错
Keywords
Petri nets
fault-tolerance
layer modeling
error detection
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
时间感知Web服务交互行为建模与失配检测方法研究
被引量:
6
17
作者
张广泉
戎玫
王昇
机构
苏州大学
计算机
科学
与技术
学院
中国科学院计算机科学国家重点实验室
暨南大学深圳旅游
学院
出处
《电子学报》
EI
CAS
CSCD
北大核心
2011年第11期2568-2575,共8页
基金
国家自然科学基金(No.60973149)
中国科学院计算机科学国家重点实验室开放课题(No.SYSKF0908)
江苏省自然科学基金(No.BK2011281)
文摘
针对现有Web服务组合过程中存在时间感知力弱、服务利用率低、组合可靠性差等问题,通过将定量时间属性引入Web服务交互适配框架中,研究时间感知Web服务交互行为的形式化建模与交互行为失配的自动检测问题.提出了用于表达单个时间感知Web服务交互行为的时间服务协议(TSP)模型和用于表达多个时间感知Web服务并发组合的时间服务协议网络(TSPN)模型;将时间感知Web服务交互失配检测问题转化为TSP模型之间的兼容性判定问题,定义了从时间感知Web服务描述至TSP模型和从TSP模型至UPPAAL规约的映射规则,给出了TSP模型兼容性性质的CTL公式表示,基于模型检测工具UPPAAL实现时间感知Web服务交互失配的自动化检测,其检测结果作为下一步是否需要构造适配器的判断依据;最后通过实例分析进一步阐述了上述方法的可行性和有效性.
关键词
时间感知Web服务
时间服务协议
时间服务交互
模型检测
失配检测
Keywords
time-aware web services
limed service protocol
timed service interaction
model checking
mismatch checking
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种考虑网络能效优化的队列管理方法
被引量:
6
18
作者
蒋丽丽
陈国彬
张广泉
机构
重庆工商大学融智
学院
大数据研究所
苏州大学
计算机
科学
与技术
学院
中国科学院计算机科学国家重点实验室
出处
《四川大学学报(自然科学版)》
CAS
CSCD
北大核心
2017年第3期499-503,共5页
基金
重庆市教委科学技术研究项目(KJ133103)
江苏省自然科学基金项目(BK2011152)
中国科学院计算机科学国家重点实验室开放课题(CSYSKF0908)
文摘
针对网络数据传输过程中传输速率慢、网络能耗高等问题,本文基于混合引力搜索算法HGSA提出了一种队列管理方法.该方法首先给出了网络能效评价指标,以此衡量网络的有效信息容量和传输速率.同时利用混合引力搜索算法来对队列管理方法进行优化.最后通过数学仿真,分析了队列长度、数据包大小等对网络能效的影响,结果证明了该方法具有较好的适应性.
关键词
队列管理方法
网络能效
混合引力搜索算法
队列长度
Keywords
Queue management method
Network energy efficiency
Hybrid gravitional search algo-rithm
Queue length
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于模糊Petri网推理的半导体生产线投料控制策略
被引量:
5
19
作者
曹政才
赵会丹
王永吉
机构
北京化工大学信息
科学
与技术
学院
中国科学院计算机科学国家重点实验室
出处
《电子学报》
EI
CAS
CSCD
北大核心
2011年第7期1545-1550,共6页
基金
教育部博士点基金新教师课题(No.20090010120011)
中央高校基本科研业务费项目(No.ZZ0914)
+2 种基金
机械系统与振动国家重点实验室开放课题(No.MSV-2010-19)
机械制造系统工程国家重点实验室开放课题(No.2010005)
计算机软件新技术国家重点实验室开放课题(No.KFKT2010B11)
文摘
半导体生产线存在大量随机不确定因素,各种不确定扰动的发生,往往使已获得优化调度方案在执行过程中失去优良性,鉴于模糊Petri网在知识表达和逻辑推理方面的优势,本文研究将该思想用于半导体生产线投料控制,构建投料模糊Petri网推理模型,建立完整的在线投料机制,以生产线实时信息为依据,决定系统采取的投料控制行为,以便尽可能发挥系统的生产能力,优化系统制造性能.最后,以某半导体生产线为例进行投料控制实验,结果表明,该策略是可行有效的.
关键词
半导体生产线
投料策略
模糊PETRI网
Keywords
semiconductor wafer fabrication
releasing strategy
fuzzy Petri nets
分类号
TP373 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
数值软件自适应性能优化搜索过程评价技术研究
被引量:
2
20
作者
孙相征
张云泉
王宣强
王磊
机构
中国科学院
软件研究所并行
计算
实验室
中国科学院计算机科学国家重点实验室
中国科学院
研究生院
出处
《计算机研究与发展》
EI
CSCD
北大核心
2010年第4期679-686,共8页
基金
国家自然科学基金重点项目(60533020)
国家"八六三"高技术研究发展计划基金项目(2006AA01A125
+2 种基金
2009AA01A129
2009AA01A134)
中国科学院知识创新工程重大项目课题(KGCX1-YW-13)~~
文摘
随着计算机硬件的快速变化,如何充分利用计算机资源,使软件性能尽可能逼近处理器峰值是人们关心的问题.针对特定硬件平台手工优化程序,或者依赖编译器优化技术,存在人工介入,难与硬件更新同步等问题.而采用自适应性能优化技术实现的高性能数学软件包(SANS)如FFTW,ATLAS,PHiPAC,OSKI等,可有效解决前两种方法存在的问题,降低开发成本,提高软件可移植性.针对自适应性能优化技术中,优化参数搜索过程十分耗时的问题,提出对优化搜索过程的评价指标Pt,并给出用此指标控制优化搜索过程的方法.实验表明运用该指标可以在较短的时间内得到一个合理的性能值.
关键词
自适应
优化过程评价指标
优化参数
性能跟踪
ATLAS
GEMM
Keywords
self-adapting
searching process criterion
optimization parameter
performance tracking
ATLAS
GEMM
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于VRML的计算机组成原理课件开发
买桂英
《重庆文理学院学报(自然科学版)》
2009
1
下载PDF
职称材料
2
有限元单元计算子程序的OpenMP并行化
宋刚
蒋孟奇
张云泉
李玉成
《计算机工程》
CAS
CSCD
北大核心
2008
11
下载PDF
职称材料
3
基于横向局部性的多核计算模型
袁良
张云泉
《计算机科学》
CSCD
北大核心
2012
2
下载PDF
职称材料
4
并行计算模型参数动态分析软件包设计
王向前
张云泉
侯晓吻
《计算机工程》
CAS
CSCD
北大核心
2009
0
下载PDF
职称材料
5
基于主流云计算技术的集群三元空间提取方法
许春玲
张广泉
《电信科学》
北大核心
2010
0
下载PDF
职称材料
6
SpMV的自动性能优化实现技术及其应用研究
袁娥
张云泉
刘芳芳
孙相征
《计算机研究与发展》
EI
CSCD
北大核心
2009
15
下载PDF
职称材料
7
基于XYZ/ADL的Web服务组合描述与验证
张广泉
戎玫
朱雪阳
何亚丽
石慧娟
《电子学报》
EI
CAS
CSCD
北大核心
2011
6
下载PDF
职称材料
8
带传递关系和存在量词的描述逻辑MSC推理
蒋运承
唐素勤
王驹
周生明
《计算机研究与发展》
EI
CSCD
北大核心
2009
7
下载PDF
职称材料
9
SIMD技术与向量数学库研究
解庆春
张云泉
王可
李焱
许亚武
《计算机科学》
CSCD
北大核心
2011
10
下载PDF
职称材料
10
一种改进的OpenMP指导调度策略研究
刘胜飞
张云泉
孙相征
《计算机研究与发展》
EI
CSCD
北大核心
2010
15
下载PDF
职称材料
11
体育视频中的运动员检测与跟踪
吴海松
华庆一
李光俊
沈婧
《计算机工程》
CAS
CSCD
北大核心
2008
8
下载PDF
职称材料
12
GOTOBLAS一般矩阵乘法高效实现机制的研究
蒋孟奇
张云泉
宋刚
李玉成
《计算机工程》
CAS
CSCD
北大核心
2008
8
下载PDF
职称材料
13
一种可信的信息物理融合系统设计框架初探
张侃
张广泉
张茗泰
《计算机研究与发展》
EI
CSCD
北大核心
2011
12
下载PDF
职称材料
14
面向城市交通网络的一种新型动态路径寻优方法
曹政才
韩丁富
王永吉
《电子学报》
EI
CAS
CSCD
北大核心
2012
13
下载PDF
职称材料
15
基于改进遗传算法的快速自动组卷算法研究
陈国彬
张广泉
《计算机应用研究》
CSCD
北大核心
2015
20
下载PDF
职称材料
16
基于Petri网的容错系统分层建模
周月明
杜玉越
刘伟
《计算机工程》
CAS
CSCD
北大核心
2010
9
下载PDF
职称材料
17
时间感知Web服务交互行为建模与失配检测方法研究
张广泉
戎玫
王昇
《电子学报》
EI
CAS
CSCD
北大核心
2011
6
下载PDF
职称材料
18
一种考虑网络能效优化的队列管理方法
蒋丽丽
陈国彬
张广泉
《四川大学学报(自然科学版)》
CAS
CSCD
北大核心
2017
6
下载PDF
职称材料
19
基于模糊Petri网推理的半导体生产线投料控制策略
曹政才
赵会丹
王永吉
《电子学报》
EI
CAS
CSCD
北大核心
2011
5
下载PDF
职称材料
20
数值软件自适应性能优化搜索过程评价技术研究
孙相征
张云泉
王宣强
王磊
《计算机研究与发展》
EI
CSCD
北大核心
2010
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
4
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部