期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于国产ARM架构CPU的导航卫星精密定轨解算效率优化方法
1
作者 廖敏 唐成盼 +5 位作者 周善石 陈建兵 胡小工 冯学斌 陈桂根 李凯 《大地测量与地球动力学》 CSCD 北大核心 2024年第4期366-371,共6页
以国产飞腾CPU为例,讨论在国产ARM架构CPU基础上的导航卫星精密定轨解算效率优化方法。基于导航卫星精密定轨解算流程中钟差约化和法方程求逆耗时较多,分别利用多线程和OpenBlas对上述2个过程进行优化。结果表明,优化后解算效率大幅提... 以国产飞腾CPU为例,讨论在国产ARM架构CPU基础上的导航卫星精密定轨解算效率优化方法。基于导航卫星精密定轨解算流程中钟差约化和法方程求逆耗时较多,分别利用多线程和OpenBlas对上述2个过程进行优化。结果表明,优化后解算效率大幅提升。钟差约化方面,采用100个测站32颗导航卫星进行解算时,原始单历元平均耗时1.105 s,优化后为0.188 s;法方程求逆方面,原始求逆平均耗时2 264 s,优化后仅需78 s。 展开更多
关键词 精密定轨 ARM架构cpu 多线程 OpenBlas
下载PDF
多核CPU环境下的并行遗传算法的研究 被引量:7
2
作者 唐天兵 谢祥宏 +2 位作者 申文杰 韦凌云 严毅 《广西大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第4期546-550,共5页
多核CPU已经成为当前CPU市场上的主流产品,设计适应多核CPU环境的算法与软件势在必行。遗传算法是一种具有很强通用性的全局搜索方法,也是一种计算量大、极耗计算资源的算法,其传统的串行计算形式并不能充分利用多核的计算资源,将其设... 多核CPU已经成为当前CPU市场上的主流产品,设计适应多核CPU环境的算法与软件势在必行。遗传算法是一种具有很强通用性的全局搜索方法,也是一种计算量大、极耗计算资源的算法,其传统的串行计算形式并不能充分利用多核的计算资源,将其设计为适应多核CPU环境的并行计算形式,具有重要的现实意义。将遗传算法的基本操作设计成并行执行形式,并利用OpenMP将其线程化,从而对不同规模的TSP问题的求解结果来看,加速比与计算效率随着规模的增大而提高。 展开更多
关键词 多核cpu OPENMP 线程化 遗传算法
下载PDF
比较分析CPU超线程技术与双核技术的异同 被引量:3
3
作者 林杰 余建坤 《计算机应用与软件》 CSCD 2011年第12期293-294,297,共3页
超线程技术和双核技术是CPU发展历程中的重要技术。超线程技术把一个物理处理器模拟成两个"虚拟"的处理器,减少执行单元和一些资源的闲置时间,提高CPU的利用率。双核技术是将两个物理处理核心封装在一个CPU中,提高程序的执行... 超线程技术和双核技术是CPU发展历程中的重要技术。超线程技术把一个物理处理器模拟成两个"虚拟"的处理器,减少执行单元和一些资源的闲置时间,提高CPU的利用率。双核技术是将两个物理处理核心封装在一个CPU中,提高程序的执行效率。介绍CPU的基本模型,分析超线程和双核的技术原理,并从系统架构、并行程度和提升的效率三个方面比较它们的异同点。 展开更多
关键词 中央处理器 超线程 双核
下载PDF
Windows操作系统多核CPU内核线程管理方法 被引量:5
4
作者 李骥 姜守达 邹昕光 《自动化技术与应用》 2010年第1期27-30,共4页
Windows是采用CPU时间片轮转多任务分配机制的非实时操作系统,无法满足实时性要求比较高的任务需要。而随着CPU技术的快速发展,当前市场上双核甚至多核CPU已成为主流,这使得在Windows平台上用多核CPU的某些核独立执行任务,从而有效地提... Windows是采用CPU时间片轮转多任务分配机制的非实时操作系统,无法满足实时性要求比较高的任务需要。而随着CPU技术的快速发展,当前市场上双核甚至多核CPU已成为主流,这使得在Windows平台上用多核CPU的某些核独立执行任务,从而有效地提高软件的实时性成为可能。本文介绍一种在Windows内核模式下编写Windows驱动程序,有效分配多核CPU资源从而提高软件实时性的方法。 展开更多
关键词 多核cpu 进程 线程 实时性
下载PDF
基于CPU-GPU的多尺度视网膜增强算法 被引量:1
5
作者 张卫东 杜师帅 +2 位作者 路皓翔 卓永 杨辉华 《计算机工程与设计》 北大核心 2018年第12期3779-3784,共6页
针对多尺度视网膜增强算法在图像增强过程中存在运算时间较长的问题,给出一种基于CPU-GPU并行加速的多尺度视网膜算法。在并行化设计时,对CUDA如何管理GPU的硬件资源能够在GPU硬件资源量固定的情况下启动更多的线程参与计算进行深入讨... 针对多尺度视网膜增强算法在图像增强过程中存在运算时间较长的问题,给出一种基于CPU-GPU并行加速的多尺度视网膜算法。在并行化设计时,对CUDA如何管理GPU的硬件资源能够在GPU硬件资源量固定的情况下启动更多的线程参与计算进行深入讨论和公式化求解;对GPU并行模型进行改进,充分利用CPU和GPU资源;通过3个CPU线程实现R、G、B通道的并行,每个通道的增强过程通过GPU并行。在对多种场景图片的CPU-GPU并行加速处理的实验中得到了高达267倍的加速比。 展开更多
关键词 图像增强 并行加速 cpu线程 GPU并行 多尺度视网膜
下载PDF
APU:一种精确评估超线程处理器算力消耗程度的方法
6
作者 温盈盈 程冠杰 +1 位作者 邓水光 尹建伟 《软件学报》 EI CSCD 北大核心 2023年第12期5887-5904,共18页
伴随着云计算的发展,以及软件即服务(SaaS)、方法即服务(FaaS)等服务框架的提出,数据中心作为服务的提供商,面临着持续性的资源管理挑战:一方面需要保证服务质量(quality of service,QoS),另一方面又需要控制资源成本.为了在提升资源使... 伴随着云计算的发展,以及软件即服务(SaaS)、方法即服务(FaaS)等服务框架的提出,数据中心作为服务的提供商,面临着持续性的资源管理挑战:一方面需要保证服务质量(quality of service,QoS),另一方面又需要控制资源成本.为了在提升资源使用率的同时确保负载压力在可承受范围内波动,一种精确衡量当前算力消耗程度的方法成为关键性的研究问题.传统的评估指标CPU利用率,由于虚拟化技术的成熟以及并行技术的发展,无法应对资源竞争所产生的干扰,失去了评估精度.而当前数据中心的主流处理器基本都开启了超线程技术,这导致评估超线程处理器算力消耗程度的需求亟待解决.为了应对这一评估挑战,基于超线程机制的理解以及线程行为的建模,提出一种评估超线程处理器算力消耗的方法APU.同时考虑到不同权限的用户能访问的系统层级不同,还提出了两种实现方案:一种基于硬件层支持的实现,以及一种基于操作系统层支持的实现.APU方法利用传统CPU利用率指标作为输入,没有其他维度的需求,免去了新监测工具的开发部署代价,也无需特殊硬件体系结构的支持,确保该方法的通用性和易用性.最后通过SPEC基准测试程序进一步证明该方法提升了算力评估的精度,分别将3种基准程序运行情况的算力评估误差从原先的20%,50%,以及20%下降至5%以内.为了进一步证明APU的实际应用能力,将其运用在了字节跳动的集群中,在案例研究中展示了它的应用效果. 展开更多
关键词 超线程 数据中心 算力评估 cpu利用率 系统性能分析
下载PDF
多核多线程技术综述 被引量:46
7
作者 眭俊华 刘慧娜 +1 位作者 王建鑫 秦庆旺 《计算机应用》 CSCD 北大核心 2013年第A01期239-242,261,共5页
分析了多核CPU和操作系统、并行计算以及多线程设计与开发之间的关系,结合一个新的性能评估算法,从线程并行数量、数据竞争、锁竞争、线程安全、数据传输、存储一致性等方面,详细分析了多核多线程开发中开发技术和存在的问题,并给出了... 分析了多核CPU和操作系统、并行计算以及多线程设计与开发之间的关系,结合一个新的性能评估算法,从线程并行数量、数据竞争、锁竞争、线程安全、数据传输、存储一致性等方面,详细分析了多核多线程开发中开发技术和存在的问题,并给出了对应的措施,最后简要论述和分析了多核多线程技术的发展趋势。 展开更多
关键词 多核cpu 多线程 任务调度 数据共享 锁竞争 线程安全 cache存储一致性
下载PDF
Windows内核模式中断请求级的分析与应用 被引量:6
8
作者 王兰英 居锦武 《计算机工程与设计》 CSCD 北大核心 2008年第11期2824-2826,共3页
中断请求级IRQL是Windows操作系统内核的重要概念,WDM驱动程序的设计经常涉及到IRQL的应用。研究了Windows操作系统下WDM驱动程序中IRQL的实质,IRQL对线程调度的影响,研究了IRQL与处理器环级、线程优先级、硬件IRQ之间的区别与联系,分... 中断请求级IRQL是Windows操作系统内核的重要概念,WDM驱动程序的设计经常涉及到IRQL的应用。研究了Windows操作系统下WDM驱动程序中IRQL的实质,IRQL对线程调度的影响,研究了IRQL与处理器环级、线程优先级、硬件IRQ之间的区别与联系,分析了用IRQL实现自旋锁的原理。 展开更多
关键词 中断请求级 设备驱动程序开发包 处理器环级 线程优先级 硬件中断级
下载PDF
基于多线程评估的基因表达式编程算法 被引量:4
9
作者 倪胜巧 唐常杰 +1 位作者 杨宁 左劼 《计算机应用》 CSCD 北大核心 2012年第4期986-989,共4页
分析了基因表达式编程(GEP)算法的性能关键,指出提升的一个重要瓶颈是在个体评估阶段;结合多核CPU并行计算能力,提出了基于多线程评估的GEP算法(MTEGEP),并通过实验验证了MTEGEP的高效性:在双核CPU环境下MTEGEP运算速度是传统GEP的1.89... 分析了基因表达式编程(GEP)算法的性能关键,指出提升的一个重要瓶颈是在个体评估阶段;结合多核CPU并行计算能力,提出了基于多线程评估的GEP算法(MTEGEP),并通过实验验证了MTEGEP的高效性:在双核CPU环境下MTEGEP运算速度是传统GEP的1.89倍,而在8核CPU环境下达到了6.48倍。实验结果表明该算法能有效提升GEP算法的性能。 展开更多
关键词 数据挖掘 基因表达式编程 多线程 多核cpu 评估
下载PDF
Vega平台下三维并行A*算法的设计与实现 被引量:2
10
作者 高晔 邢毅 《计算机工程与应用》 CSCD 2012年第7期231-234,共4页
采用一种并行的A*算法实现了复杂地理环境下低空飞行器的三维路径规划。该算法将A*算法的基本操作设计成并行执行形式,并利用OpenMP将其线程化,结合约束条件,最终完成在三维空间中避开障碍物的路径搜索过程。使用建模工具Cre-ator和开... 采用一种并行的A*算法实现了复杂地理环境下低空飞行器的三维路径规划。该算法将A*算法的基本操作设计成并行执行形式,并利用OpenMP将其线程化,结合约束条件,最终完成在三维空间中避开障碍物的路径搜索过程。使用建模工具Cre-ator和开发工具Vega为仿真平台,完成对复杂地形地貌场景的设计,在此基础上对上述算法进行了验证。仿真结果表明该并行方式较之串行方式能获得更快的寻优速度,加速比也随着规模的增大而提高。 展开更多
关键词 多核cpu 并行A*算法 OPENMP 线程化
下载PDF
基于多核的多线程程序优化研究 被引量:17
11
作者 施惠丰 袁道华 《计算机技术与发展》 2010年第6期70-73,共4页
随着主流芯片厂商的大力推广,多核处理器已经变得越来越普及。以往串行化的程序设计方法在多核环境下已经不能充分利用多核CPU的资源。怎样高效地利用多核处理器的计算性能,已经成为软件开发者面临的新的课题。文中在传统的多线程编程... 随着主流芯片厂商的大力推广,多核处理器已经变得越来越普及。以往串行化的程序设计方法在多核环境下已经不能充分利用多核CPU的资源。怎样高效地利用多核处理器的计算性能,已经成为软件开发者面临的新的课题。文中在传统的多线程编程基础上,根据Intel处理器的微架构(Microarchitecture)特点,以及Linux内核提供的CPU绑定技术,通过采用Cache优化和CPU亲和力(CPU affinity)优化,消除了多核环境下局部多线程Cache行竞争和伪共享,减少了线程的调度开销,提高了多线程程序的运行效率。 展开更多
关键词 多核处理器 多线程编程 CACHE优化 cpu亲和力
下载PDF
基于PMAC运动控制器的开放式数控系统研究 被引量:7
12
作者 王家畴 位在林 +1 位作者 宋芳 尤波 《哈尔滨理工大学学报》 CAS 2004年第5期1-3,共3页
为满足加工生产高压玻璃钢管道外螺纹的要求,以PMAC运动控制技术为基础,提出了一种以PMAC为控制系统核心、工业控制计算机(IPC)为系统支撑单元的双CPU开放式数控系统,给出了该系统功能、硬件结构和软件设计方法.实践证明,该数控系统不... 为满足加工生产高压玻璃钢管道外螺纹的要求,以PMAC运动控制技术为基础,提出了一种以PMAC为控制系统核心、工业控制计算机(IPC)为系统支撑单元的双CPU开放式数控系统,给出了该系统功能、硬件结构和软件设计方法.实践证明,该数控系统不仅可以实现人机接口的定制和实时控制部件的参数化,而且轨迹行程精确、响应速度快、定位准确度高等优良性能. 展开更多
关键词 PMAC 开放式数控系统 磨螺纹机床 cpu
下载PDF
基于GPU并行处理的图像快速旋转算法 被引量:1
13
作者 李亚荣 刘佳 《大连交通大学学报》 CAS 2012年第3期63-66,共4页
提出了一种在CUDA架构上实现基于Bresenham画线算法的图像快速旋转算法.该算法避免了复杂的数学运算,并融入Bresenham画线算法的优点,解决了大量的浮点的取整运算问题,并且减少了图片旋转过程中精度的损失,使得算法的精度和时间复杂度... 提出了一种在CUDA架构上实现基于Bresenham画线算法的图像快速旋转算法.该算法避免了复杂的数学运算,并融入Bresenham画线算法的优点,解决了大量的浮点的取整运算问题,并且减少了图片旋转过程中精度的损失,使得算法的精度和时间复杂度达到相互平衡,极大提升了旋转算法的性能.实验证明,在当前的硬件平台下,与传统旋转算法相比,该算法极大的提高了旋转算法的速度并减少精度的损失. 展开更多
关键词 CUDA 旋转 多线程 cpu计算量
下载PDF
稠密线性方程组的多线程同步算法及其实现 被引量:1
14
作者 张晓蕾 李环 《首都师范大学学报(自然科学版)》 2002年第4期7-12,共6页
构造线性方程组的若干多线程同步算法 ,给出它们在Delphi中的实现并用典型计算实例在多CPU计算机上进行测试 .
关键词 稠密线性方程组 多线程同步算法 cpu计算机 并行解法 计算数学
下载PDF
嵌入式系统的细粒度多处理器实时抢占式调度算法 被引量:2
15
作者 李扬 王春明 《计算机应用与软件》 北大核心 2019年第4期202-209,共8页
现有的嵌入式实时系统调度算法一般以任务级为调度单位,对此提出一种细粒度的线程级多处理器实时调度算法。采用DAG图描述实时系统的任务,并采用任务分解法将其分解为线程形式;为任务级调度采用基于干扰的可调度性分析,为线程级调度采... 现有的嵌入式实时系统调度算法一般以任务级为调度单位,对此提出一种细粒度的线程级多处理器实时调度算法。采用DAG图描述实时系统的任务,并采用任务分解法将其分解为线程形式;为任务级调度采用基于干扰的可调度性分析,为线程级调度采用基于工作负载的可调度性分析;将线程的偏移、截止期与优先级作为三个调度目标,设计混合线程级调度算法。仿真实验结果表明,算法对于多线程任务的实时系统具有较好的性能。 展开更多
关键词 多核处理器 并行任务 云计算 多线程任务 调度算法 嵌入式系统
下载PDF
并行计算在虚拟油泥模型离散中的应用
16
作者 刘飞 侯增选 闫锋欣 《现代制造工程》 CSCD 2008年第6期18-21,共4页
在基于压缩体素模型的虚拟油泥造型系统中,虚拟油泥模型离散是影响虚拟油泥造型速度的重要因素,为了进一步提高虚拟油泥造型系统造型速度,在双CPU工作站中采用多线程技术,对虚拟油泥模型离散进行并行化处理,实验结果表明,并行处理技术... 在基于压缩体素模型的虚拟油泥造型系统中,虚拟油泥模型离散是影响虚拟油泥造型速度的重要因素,为了进一步提高虚拟油泥造型系统造型速度,在双CPU工作站中采用多线程技术,对虚拟油泥模型离散进行并行化处理,实验结果表明,并行处理技术可使虚拟油泥模型离散速度提高近2倍。 展开更多
关键词 cpu工作站 多线程 并行计算 离散 虚拟油泥模型
下载PDF
双核心处理器概述
17
作者 张济仕 郭念 《电脑知识与技术》 2007年第12期1367-1370,共4页
随着人们对PC机高性能需求的增加,双核心处理器正在不断涌向市场,被人们所认知。那么,何为双核心处理器?为什么它能被市场认定?本文将从双核心处理器的发展、定义和分类,AMD的双核心方案,超线程技术和双核心技术的区别与联系几... 随着人们对PC机高性能需求的增加,双核心处理器正在不断涌向市场,被人们所认知。那么,何为双核心处理器?为什么它能被市场认定?本文将从双核心处理器的发展、定义和分类,AMD的双核心方案,超线程技术和双核心技术的区别与联系几个方面出发.详细概述了双核心处理器,使人们对其有一个全面的认识。 展开更多
关键词 双核心处理器 超线程 缓存 双核与双芯
下载PDF
基于NUMECA FINE/Turbo的并行计算测试 被引量:1
18
作者 董晶 《计算机辅助工程》 2014年第6期108-110,112,共4页
为具体了解CFD软件NUMECA FINE/Turbo的并行计算性能,良好把握后续的科研工作进度,分别研究在激活超线程情况下单节点计算与多节点并行计算以及CPU在激活超线程前、后计算速度的差异.结果表明:在多节点并行计算时,计算速度与实际参加并... 为具体了解CFD软件NUMECA FINE/Turbo的并行计算性能,良好把握后续的科研工作进度,分别研究在激活超线程情况下单节点计算与多节点并行计算以及CPU在激活超线程前、后计算速度的差异.结果表明:在多节点并行计算时,计算速度与实际参加并行计算的CPU物理核心数量成正比;在激活超线程的情况下,并行计算节点数在超过实际物理核心数后明显降低计算速度的提升. 展开更多
关键词 并行计算 超线程 计算节点数 cpu核心数量 计算速度 NUMECA FINE/Turbo
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部