期刊文献+
共找到66篇文章
< 1 2 4 >
每页显示 20 50 100
信创CPU与Intel CPU在NUMA架构方面的调优实践
1
作者 徐光龙 金鹰 《计算机应用文摘》 2024年第3期35-37,共3页
通过选取具有代表性的基准测试工具,文章对比了信创CPU和IntelCPU在多核性能方面的表现。同时,针对NUMA架构的特点进行了调优实验,并通过分析性能数据得出了调优前后的性能差异。结果表明,通过NUMA调优可以有效提高处理器的性能。
关键词 numa调优 信创CPU IntelCPU 性能对比测试 基准测试工具 处理器性能
下载PDF
基于NUMA延迟发送的时变图弱连通分量求解
2
作者 梁锐杰 程永利 《计算机系统应用》 2023年第3期322-329,共8页
时变图连通分量已经被广泛应用到不同场景,如交通路网建设、推荐系统的信息推送等.然而当前多数连通分量求解方法忽视了NUMA体系结构对计算效率产生的影响,即过高的远程内存访问延迟导致低下的算法执行效率.本文针对时变图的弱连通分量... 时变图连通分量已经被广泛应用到不同场景,如交通路网建设、推荐系统的信息推送等.然而当前多数连通分量求解方法忽视了NUMA体系结构对计算效率产生的影响,即过高的远程内存访问延迟导致低下的算法执行效率.本文针对时变图的弱连通分量求解问题,提出一种基于NUMA延迟发送的时变图弱连通分量求解方法,它通过合理的数据内存布局,合理控制NUMA节点间的信息交换次数,最大限度减少远程内存访问数量,显著提高了算法执行效率.实验结果表明,该方法的性能明显优于当前流行的图处理系统Ligra和Polymer提供的方法. 展开更多
关键词 弱连通分量 numa 延迟发送 时变图 图计算
下载PDF
面向能源感知的虚拟机深度强化学习调度算法研究
3
作者 王杨民 胡成玉 +1 位作者 颜雪松 曾德泽 《计算机科学》 CSCD 北大核心 2024年第2期293-299,共7页
随着计算机技术的快速发展,云计算技术成为了解决用户存储、算力需求的最佳方法之一。其中,基于NUMA架构的动态虚拟机调度成为了学术界和工业界关注的热点方向。但是,目前的研究中,基于启发式的算法难以对虚拟机进行实时调度,并且大多... 随着计算机技术的快速发展,云计算技术成为了解决用户存储、算力需求的最佳方法之一。其中,基于NUMA架构的动态虚拟机调度成为了学术界和工业界关注的热点方向。但是,目前的研究中,基于启发式的算法难以对虚拟机进行实时调度,并且大多数文献没有考虑NUMA架构下虚拟机调度产生的能耗等问题。对此,提出了一种基于深度强化学习的大型移动云中心虚拟机服务迁移框架,构建了NUMA架构下的能耗模型;提出了自适应奖励的分层自适应柔性演员评论家算法(Hie-rarchical Adaptive Sampling Soft Actor Critic,HASAC);在云计算场景下,将所提算法与3种经典的深度强化学习方法进行实验对比。实验结果表明,所提改进算法在不同场景下可以处理更多的用户请求,且消耗的能源较少。此外,对算法中各种策略进行消融实验,证明了所提策略的有效性。 展开更多
关键词 numa架构 深度学习 强化学习 能源感知 分层缓冲区
下载PDF
核有丝分裂器蛋白NuMA在人脑胶质瘤中的表达 被引量:1
4
作者 肖瑾 万经海 +3 位作者 李长元 冯春国 徐培坤 胡向阳 《安徽医科大学学报》 CAS 北大核心 2007年第1期42-44,共3页
目的检测核有丝分裂器蛋白(NuMA)在人脑胶质瘤中的表达及其与胶质瘤临床病理学特征之间的关系。方法采用免疫组化SP法检测65例人脑胶质瘤标本和15例正常脑组织标本中NuMA蛋白的表达情况。结果NuMA在Ⅱ级、Ⅲ级、Ⅳ级人脑胶质瘤中的表达... 目的检测核有丝分裂器蛋白(NuMA)在人脑胶质瘤中的表达及其与胶质瘤临床病理学特征之间的关系。方法采用免疫组化SP法检测65例人脑胶质瘤标本和15例正常脑组织标本中NuMA蛋白的表达情况。结果NuMA在Ⅱ级、Ⅲ级、Ⅳ级人脑胶质瘤中的表达分别为42.9%、66.7%、82.4%;在正常脑组织中NuMA的表达率为20%。结论NuMA的过高表达与胶质瘤的组织病理学分级显著相关,而与肿瘤的组织学类型无关。 展开更多
关键词 numa 胶质瘤 免疫组织化学
下载PDF
NuMA蛋白的生物学作用及其研究进展 被引量:1
5
作者 杨立琳 孙露双 +1 位作者 曾晓 曹允考 《东北农业大学学报》 CAS CSCD 2008年第10期127-130,共4页
NuMA存在于动、植物细胞中,是细胞核基质的重要组成部分,参与纺锤体极的组装与分解、核重组等过程,调节细胞周期,对细胞的有丝分裂和减数分裂具有重要作用。此外,对细胞凋亡也发挥重要作用,NuMA的降解是早期细胞调亡的标志。
关键词 numa 细胞 功能
下载PDF
基于NUMA MPSoC的FFT并行化算法设计及实现 被引量:1
6
作者 张冰 杜高明 +1 位作者 李丽 杨盛光 《微电子学与计算机》 CSCD 北大核心 2007年第12期109-112,共4页
如何充分利用多个处理器任务级并行或线程级并行的特点提高性能已成为MPSoC设计的关键问题之一。在建立基于非均匀存储型(Non-Uniform Memory Access Architecture,NUMA)MPSoC平台的基础上,以快速傅里叶变换为例,遵循减少核间通讯及平... 如何充分利用多个处理器任务级并行或线程级并行的特点提高性能已成为MPSoC设计的关键问题之一。在建立基于非均匀存储型(Non-Uniform Memory Access Architecture,NUMA)MPSoC平台的基础上,以快速傅里叶变换为例,遵循减少核间通讯及平均分配工作负载的原则,提出其并行化方法,设计出相应的并行程序及底层驱动,在FPGA原型芯片的运行环境下分析系统性能。试验结果表明,在4核MPSoC的FPGA原型系统中最高加速比可达2.65,具有较好的并行执行效率。 展开更多
关键词 numa 多核片上系统 FFT 并行算法
下载PDF
植物细胞核基质(Nuclear Matrix)的形态结构及其NuMA蛋白成分的研究 被引量:1
7
作者 汪健 孙英丽 翟中和 《实验生物学报》 CSCD 1997年第4期417-429,共13页
应用细胞选择性抽提并结合DGD包埋去包埋剂电镜技术对植物细胞核基质的形态结构进行了观察。结果显示胡萝卜悬浮培养细胞、银杏花粉细胞和精子细胞的细胞核内存在一个非染色质性的纤维蛋白网络体系。免疫荧光染色结果说明植物细胞核基... 应用细胞选择性抽提并结合DGD包埋去包埋剂电镜技术对植物细胞核基质的形态结构进行了观察。结果显示胡萝卜悬浮培养细胞、银杏花粉细胞和精子细胞的细胞核内存在一个非染色质性的纤维蛋白网络体系。免疫荧光染色结果说明植物细胞核基质中含有与动物NuMA多抗交叉反应的多肽。免疫印迹反应显示胡萝卜悬浮培养细胞核基质蛋白与NuMA蛋白多抗的阳性反应条带为74KD和76 KD;银杏花粉细胞只有78 KD一条阳性带。以动物核基质NuMA蛋白保守杆状区的cDNA片段作为探针,与白菜子叶总DNA进行Southern杂交的结果表明植物细胞基因组中含有动物NuMA蛋白cDNA的同源序列。 展开更多
关键词 植物细胞 核基质 numa 蛋白
下载PDF
四膜虫大核基质中含有NuMA类似蛋白
8
作者 孙英丽 陈丹英 高崇明 《动物学报》 SCIE CAS CSCD 2000年第1期104-107,共4页
SUN Ying Li CHEN Dan Ying GAO Chong Ming) (College of Life Sciences, Peking University, Beijing 100871, China)
关键词 四膜虫 numa 核基质
下载PDF
Linux NUMA关键技术研究
9
作者 吴庆波 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第z1期556-562,共7页
NUMA(Non-Uniform Memory Access Architecture)系统在市场上的应用越来越广泛,许多厂商都成功推出了基于NUMA架构的服务器,重点讨论当前Linux内核中的NUMA技术,主要包括:存储管理和NUMA调度,并在SGI Altix 350 NUMA系统上对Linux进行... NUMA(Non-Uniform Memory Access Architecture)系统在市场上的应用越来越广泛,许多厂商都成功推出了基于NUMA架构的服务器,重点讨论当前Linux内核中的NUMA技术,主要包括:存储管理和NUMA调度,并在SGI Altix 350 NUMA系统上对Linux进行了基本测试,为操作系统进行NUMA技术的研究提供了有力的借鉴. 展开更多
关键词 存储管理 numa 操作系统
下载PDF
NUMA架构内多个节点间访存延时平衡的内存分配策略 被引量:4
10
作者 李慧娟 栾钟治 +2 位作者 王辉 杨海龙 钱德沛 《计算机学报》 EI CSCD 北大核心 2017年第9期2111-2126,共16页
随着多核架构的发展和普及,NUMA多核架构凭借其本地访存低延时的优势,被各大商业数据中心以及科学计算集群广泛采用.NUMA架构通过增加多个内存控制器,缓解了多核架构下对同一个内存控制器的争用问题,但同时也增加了内存管理的负担.Linu... 随着多核架构的发展和普及,NUMA多核架构凭借其本地访存低延时的优势,被各大商业数据中心以及科学计算集群广泛采用.NUMA架构通过增加多个内存控制器,缓解了多核架构下对同一个内存控制器的争用问题,但同时也增加了内存管理的负担.Linux的系统开发者为了实现充分利用NUMA本地访存低延时的特点,在为进程分配内存时,选择进程当前正在运行的NUMA节点作为分配内存的目标节点.这种分配会导致进/线程之间共享内存的不公平.例如,一个在当前本地节点被分配很多内存的进程,可能被调度到远端节点运行,这样会导致进程的性能波动.针对这一问题,该文设计了一种保证NUMA架构内各内存节点间访存延时平衡的内存分配策略,并在Linux系统中实现和验证.延时的获取方法依赖平台,但是系统内核的策略是通用的.实验结果表明,与Linux默认的内存分配策略相比,进/线程间的不公平性平均降低了16%(最多34%),并且各进/线程的性能没有较大抖动. 展开更多
关键词 numa架构 内存分配策略 访存延时 访存延时感知 访存延时平衡
下载PDF
面向多处理器虚拟机的动态NUMA方法 被引量:2
11
作者 施继成 陈海波 臧斌宇 《小型微型计算机系统》 CSCD 北大核心 2015年第4期677-682,共6页
NUMA内存技术在增加了计算机系统内存带宽的同时,其跨节点访存延迟高的特点也增加了虚拟化平台的内存管理难度.现有的多核虚拟机NUMA优化方法大多为静态方法,即无需动态调节虚拟机状态.这些方法大都限制了虚拟化监控器调度虚拟CPU的灵活... NUMA内存技术在增加了计算机系统内存带宽的同时,其跨节点访存延迟高的特点也增加了虚拟化平台的内存管理难度.现有的多核虚拟机NUMA优化方法大多为静态方法,即无需动态调节虚拟机状态.这些方法大都限制了虚拟化监控器调度虚拟CPU的灵活性,降低了虚拟化平台负载均衡的能力,而影响虚拟机的运行效率.针对该问题,提出动态NUMA方法——在告知虚拟机NUMA拓扑结构的情况下,该方法通过调节虚拟机内操作系统NUMA相关数据结构方法,达到配合虚拟机监控器任务调度器的目的,实现虚拟机运行效率的提升.相较于静态方法,本文提出调节虚拟机NUMA数据结构,以适应虚拟机监控器调度器的动态方法.此方法提高了虚拟CPU的调度灵活性,提高了虚拟化平台负载均衡的能力,从而保证了多处理器虚拟机的运行效率. 展开更多
关键词 虚拟机监控器 多处理器 虚拟化 numa
下载PDF
基于CC-NUMA的多处理器系统研究 被引量:1
12
作者 桑钊 张君毅 贺占庄 《现代电子技术》 2009年第2期16-18,22,共4页
针对当前多处理器发展形势,提出一种新型的CC-MUMA架构。CC-NUMA是广泛应用于多处理机系统的一种体系结构,兼具SMP和MPP的一些优点。简要介绍CC-NUMA多处理器系统的特点;分析其基本架构;详细讨论两种比较新的架构,并在此基础上提出一种... 针对当前多处理器发展形势,提出一种新型的CC-MUMA架构。CC-NUMA是广泛应用于多处理机系统的一种体系结构,兼具SMP和MPP的一些优点。简要介绍CC-NUMA多处理器系统的特点;分析其基本架构;详细讨论两种比较新的架构,并在此基础上提出一种简单、实用的新型架构,在灵活度、延迟、可扩展性方面均优于以前的架构,同时对其可行性及性能进行了全面分析。 展开更多
关键词 CC—numa Origin2000 ALPHA 21364 OPTERON 平均访问路程
下载PDF
面向NUMA集群的代数多重网格算法优化 被引量:1
13
作者 顾坚 刘伟 《计算机科学》 CSCD 北大核心 2014年第6期113-118,共6页
代数多重网格(AMG)是众多数值模拟应用的核心算法,在基于多核的NUMA架构的机群系统上,AMG的并行扩展性暴露了新的问题。通过设计感知NUMA架构的内存分配器,将划分给多个线程的数据分割并绑定到运行对应线程的CPU所属的NUMA存储节点上,... 代数多重网格(AMG)是众多数值模拟应用的核心算法,在基于多核的NUMA架构的机群系统上,AMG的并行扩展性暴露了新的问题。通过设计感知NUMA架构的内存分配器,将划分给多个线程的数据分割并绑定到运行对应线程的CPU所属的NUMA存储节点上,从而改善了OpenMP多线程并行的数据局部性,使BoomerAMG程序在大规模多核计算平台上具有更好的并行扩展性。在单节点和小规模机群的测试中,使用NAAlloc分配器分别获得了最高16%和60%的性能提升。 展开更多
关键词 代数多重网格 numa 多核 局部性
下载PDF
MySQL中InnoDB存储引擎在NUMA系统上的优化 被引量:2
14
作者 周渊 王力生 《科技传播》 2011年第1期155-156,共2页
本文对InnoDB引擎进行了代码级的深入研究,详细剖析了NUMA系统中软件优化的要点并将InnoDB针对NUMA特性进行了优化,有效减小系统中的内存访问开销。在Intel的最新Xeon7500系列处理器上进行了性能评测,结果显示该方案取得了一定的成果。
关键词 MYSQL InnoDB存储引擎 numa系统
下载PDF
面向NUMA架构的虚拟网络功能部署技术研究 被引量:1
15
作者 许道强 邹云峰 +2 位作者 邓君华 李浩 钱柱中 《计算机工程与应用》 CSCD 北大核心 2019年第21期115-121,157,共8页
针对非一致内存访问架构的集群系统,探讨了虚拟网络功能链的时延问题,以及重用已部署的虚拟网络功能提升资源利用率机制。形式化定义了面向最小化时延的虚拟网络功能部署问题,证明其为NP难问题,提出了基于马尔可夫链概率迭代的部署算法M... 针对非一致内存访问架构的集群系统,探讨了虚拟网络功能链的时延问题,以及重用已部署的虚拟网络功能提升资源利用率机制。形式化定义了面向最小化时延的虚拟网络功能部署问题,证明其为NP难问题,提出了基于马尔可夫链概率迭代的部署算法MarVNFP。实验证明,与典型的虚拟网络功能部署算法MRP相比,MarVNFP算法能减少虚拟网络功能链近40%的跨域数据传输,有效降低了时延。 展开更多
关键词 网络功能虚拟化 numa 资源调度 马尔可夫链
下载PDF
NUMA结构的高效实时稳定的垃圾回收算法
16
作者 廖彬 傅杰 +4 位作者 靳国杰 王一光 王磊 章隆兵 王剑 《高技术通讯》 CAS CSCD 北大核心 2015年第2期125-134,共10页
针对非一致性内存访问架构(NUMA)在垃圾回收(GC)过程中存在大量的远程内存读写导致GC性能降低的问题,对GC过程的各个阶段进行分析与研究,提出了一种基于NUMA结构的高效实时稳定的GC算法。该算法首先基于NUMA结构改进传统分代GC机... 针对非一致性内存访问架构(NUMA)在垃圾回收(GC)过程中存在大量的远程内存读写导致GC性能降低的问题,对GC过程的各个阶段进行分析与研究,提出了一种基于NUMA结构的高效实时稳定的GC算法。该算法首先基于NUMA结构改进传统分代GC机制的堆空间布局,然后通过控制GC过程中扫描活跃对象阶段的初始根对象选取、动态负载均衡阶段截取任务队列的选取以及复制活跃对象阶段对象复制位置的选取,大大减少GC过程中的远程访问次数。这种改进的GC机制对所有NUMA结构具有通用性。以Godson-3处理器的NUMA平台为例进行的实验结果显示,优化的GC机制极大地缩短了GC的时间,而且提高了应用程序的性能以及稳定性。在SPECjvm2008测试中,GC时间平均缩短了14.6%(GC总时间缩短4.1%-41.58%),应用程序的性能平均提升了4.68%(最高提升17.8%),应用程序的性能稳定性提升了76.2%。 展开更多
关键词 非一致性内存访问架构(numa) 垃圾回收(GC) 分代GC 活跃对象 根对象 动态负载均衡
下载PDF
内存管理系统对NUMA的支持及优化
17
作者 杨梦梦 卢凯 卢锡城 《计算机工程》 EI CAS CSCD 北大核心 2005年第16期80-82,109,共4页
阐述非一致性存储访问(NUMA)体系结构中存储结构的特点,分析该结构对操作系统存储管理子系统的影响,介绍针对NUMA存储结构特点在操作系统存储管理子系统的不连续内存支持、节点存储关系描述、存储资源分配等方面所作的工作和优化技术。... 阐述非一致性存储访问(NUMA)体系结构中存储结构的特点,分析该结构对操作系统存储管理子系统的影响,介绍针对NUMA存储结构特点在操作系统存储管理子系统的不连续内存支持、节点存储关系描述、存储资源分配等方面所作的工作和优化技术。通过实际系统的验证,文中所提出的技术方案较好地支持了NUMA系统复杂存储结构的管理需求,减少了存储访问延迟,提高了系统性能。 展开更多
关键词 操作系统 内存管理 非一致性存储访问体系结构 numa
下载PDF
NUMA架构下数据热度的内存数据库日志恢复技术 被引量:5
18
作者 吴刚 阿卜杜热西提·热合曼 +2 位作者 李梁 乔百友 韩东红 《计算机科学与探索》 CSCD 北大核心 2019年第6期941-949,共9页
在内存数据库故障恢复技术中,命令日志是针对内存数据库设计的粗粒度的、轻量级的日志记录方式。但在非统一内存访问(non-uniform memory access,NUMA)体系架构下面向数据的数据库设计中利用命令日志进行故障恢复时,由于数据访问频率不... 在内存数据库故障恢复技术中,命令日志是针对内存数据库设计的粗粒度的、轻量级的日志记录方式。但在非统一内存访问(non-uniform memory access,NUMA)体系架构下面向数据的数据库设计中利用命令日志进行故障恢复时,由于数据访问频率不均衡,导致负责高频数据恢复的CPU线程负载加重,而其他CPU相对空闲。针对这种工作负载不均衡所导致的恢复时间开销增大的情况,提出了NUMA体系架构下基于热度记录的内存数据库日志恢复算法。该算法中,每一条数据的访问次数作为该数据的热度记录下来。在并行恢复时,根据数据热度,将数据比较均衡地划分到各个节点的CPU线程执行恢复操作,以此来提高数据库的恢复速度。实验结果表明,该方案比NUMA架构下的常规恢复方案快,而且数据的热度越高,恢复速度的提升越明显,最高提升了19%。 展开更多
关键词 内存数据库 日志 检查点 故障恢复 非统一内存访问(numa)架构
下载PDF
基于NUMA架构的解释器访存优化设计与实现
19
作者 任彤 傅杰 靳国杰 《高技术通讯》 CAS CSCD 北大核心 2015年第7期661-668,共8页
为了提高非一致内存访问(NUMA)架构虚拟机解释器的访存性能,研究了解释器在NUMA架构下的访存优化技术,提出了一种NUMA架构下的解释器访存优化方案,而且设计并实现了解释器的静态指令分派优化方法和动态指令分派优化方法。根据这一方案... 为了提高非一致内存访问(NUMA)架构虚拟机解释器的访存性能,研究了解释器在NUMA架构下的访存优化技术,提出了一种NUMA架构下的解释器访存优化方案,而且设计并实现了解释器的静态指令分派优化方法和动态指令分派优化方法。根据这一方案虚拟机启动时首先获取NUMA节点信息,并在每个NUMA节点中自动生成解释器所需的全部数据结构;解释器在运行时,通过静态或动态的指令分派技术来实现其执行线程在NUMA节点上访存的局部化。试验结果表明,上述方法能够显著提升解释器在NUMA系统中的性能。在DaCapo测试集上的总体性能提升了8%,最高性能提升幅度高达23%,而且算法实现代价低,适用于绝大多数的NUMA服务器系统。 展开更多
关键词 非一致内存访问(numa) 虚拟机 解释器 响应速度 启动性能 访存优化
下载PDF
NUMA架构的龙芯3A板级设计及工程化技术研究 被引量:1
20
作者 赵东阳 刘瑞 孟英谦 《计算机工程与应用》 CSCD 北大核心 2017年第8期260-266,共7页
针对关键应用对信息处理能力提出的性能要求以及国产化需求,在分析龙芯3A处理器架构特点的基础上,设计了基于NUMA并行处理架构的龙芯3A高性能处理模块,并对抗恶劣环境的关键问题进行了分析和设计,解决了散热、电源监控及供电优化、启动... 针对关键应用对信息处理能力提出的性能要求以及国产化需求,在分析龙芯3A处理器架构特点的基础上,设计了基于NUMA并行处理架构的龙芯3A高性能处理模块,并对抗恶劣环境的关键问题进行了分析和设计,解决了散热、电源监控及供电优化、启动速度等问题。通过测试验证,性能可以满足关键应用对信息处理能力的要求,从而有效解决了龙芯3A访存能力有限的问题。同时对SMP和NUMA架构下,龙芯3A处理器CPU数量的增加对访存性能的提升的关系进行了探讨。 展开更多
关键词 非统一内存访问架构(numa) 龙芯3A VPX COTS
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部