期刊文献+
共找到70篇文章
< 1 2 4 >
每页显示 20 50 100
信创CPU与Intel CPU在NUMA架构方面的调优实践
1
作者 徐光龙 金鹰 《计算机应用文摘》 2024年第3期35-37,共3页
通过选取具有代表性的基准测试工具,文章对比了信创CPU和IntelCPU在多核性能方面的表现。同时,针对NUMA架构的特点进行了调优实验,并通过分析性能数据得出了调优前后的性能差异。结果表明,通过NUMA调优可以有效提高处理器的性能。
关键词 numa调优 信创CPU IntelCPU 性能对比测试 基准测试工具 处理器性能
下载PDF
NuMA核型阳性患者的临床特征分析
2
作者 申甫英 魏彬 罗敏 《国际检验医学杂志》 CAS 2023年第S02期113-117,共5页
目的分析抗有丝分裂体(NuMA)核型阳性患者的临床特征,为医生对该类患者临床诊治提供参考依据。方法纳入2019年5月至2020年12月于四川大学华西医院行抗核抗体(ANA)检测的患者为研究对象,收集并分析其中NuMA型阳性患者的临床诊疗及实验室... 目的分析抗有丝分裂体(NuMA)核型阳性患者的临床特征,为医生对该类患者临床诊治提供参考依据。方法纳入2019年5月至2020年12月于四川大学华西医院行抗核抗体(ANA)检测的患者为研究对象,收集并分析其中NuMA型阳性患者的临床诊疗及实验室检测特点。结果114215例筛查ANA的患者中,ANA阴性75475例(66.08%),ANA阳性38740例(33.92%),滴度1∶100的NuMA型174例(54.55%),其中NuMA1有166例(52.04%),NuMA2有8例(2.51%);滴度大于等于1∶320的NuMA型145例(45.45%),其中NuMA1有133例(41.69%),NuMA2有12例(3.76%)NuMA阳性率为0.28%(319/114215)。NuMA核型阳性可出现在全身各系统的疾病中,其中(NuMA≥320)排名前三位的为自身免疫性疾病43.45%(63/145)、呼吸系统疾病15.17%(22/145)、肾脏病5.51%(8/145)。结论NuMA型是一种少见的荧光核型,流行率低,疾病分布范围广,主要分布在自身免疫性疾病,可作为自身免疫性疾病的潜在提示指标;也可为其他疾病提供参考依据。 展开更多
关键词 自身抗体 抗有丝分裂体 流行率 实验室检查
下载PDF
基于NUMA延迟发送的时变图弱连通分量求解
3
作者 梁锐杰 程永利 《计算机系统应用》 2023年第3期322-329,共8页
时变图连通分量已经被广泛应用到不同场景,如交通路网建设、推荐系统的信息推送等.然而当前多数连通分量求解方法忽视了NUMA体系结构对计算效率产生的影响,即过高的远程内存访问延迟导致低下的算法执行效率.本文针对时变图的弱连通分量... 时变图连通分量已经被广泛应用到不同场景,如交通路网建设、推荐系统的信息推送等.然而当前多数连通分量求解方法忽视了NUMA体系结构对计算效率产生的影响,即过高的远程内存访问延迟导致低下的算法执行效率.本文针对时变图的弱连通分量求解问题,提出一种基于NUMA延迟发送的时变图弱连通分量求解方法,它通过合理的数据内存布局,合理控制NUMA节点间的信息交换次数,最大限度减少远程内存访问数量,显著提高了算法执行效率.实验结果表明,该方法的性能明显优于当前流行的图处理系统Ligra和Polymer提供的方法. 展开更多
关键词 弱连通分量 numa 延迟发送 时变图 图计算
下载PDF
面向众核处理器的阴阳K-means算法优化
4
作者 周天阳 王庆林 +4 位作者 李荣春 梅松竹 尹尚飞 郝若晨 刘杰 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第1期93-102,共10页
传统阴阳K-means算法处理大规模聚类问题时计算开销十分昂贵。针对典型众核处理器的体系结构特征,提出了一种阴阳K-means算法高效并行加速实现。该实现基于一种新内存数据布局,采用众核处理器中的向量单元来加速阴阳K-means中的距离计算... 传统阴阳K-means算法处理大规模聚类问题时计算开销十分昂贵。针对典型众核处理器的体系结构特征,提出了一种阴阳K-means算法高效并行加速实现。该实现基于一种新内存数据布局,采用众核处理器中的向量单元来加速阴阳K-means中的距离计算,并面向非一致内存访问(non-unified memory access, NUMA)特性进行了针对性的访存优化。与阴阳K-means算法的开源多线程实现相比,该实现在ARMv8和x86众核平台上分别获得了最高约5.6与8.7的加速比。因此上述优化方法在众核处理器上成功实现了对阴阳K-means算法的加速。 展开更多
关键词 K-MEANS 非一致内存访问 向量化 众核处理器 性能优化
下载PDF
面向能源感知的虚拟机深度强化学习调度算法研究
5
作者 王杨民 胡成玉 +1 位作者 颜雪松 曾德泽 《计算机科学》 CSCD 北大核心 2024年第2期293-299,共7页
随着计算机技术的快速发展,云计算技术成为了解决用户存储、算力需求的最佳方法之一。其中,基于NUMA架构的动态虚拟机调度成为了学术界和工业界关注的热点方向。但是,目前的研究中,基于启发式的算法难以对虚拟机进行实时调度,并且大多... 随着计算机技术的快速发展,云计算技术成为了解决用户存储、算力需求的最佳方法之一。其中,基于NUMA架构的动态虚拟机调度成为了学术界和工业界关注的热点方向。但是,目前的研究中,基于启发式的算法难以对虚拟机进行实时调度,并且大多数文献没有考虑NUMA架构下虚拟机调度产生的能耗等问题。对此,提出了一种基于深度强化学习的大型移动云中心虚拟机服务迁移框架,构建了NUMA架构下的能耗模型;提出了自适应奖励的分层自适应柔性演员评论家算法(Hie-rarchical Adaptive Sampling Soft Actor Critic,HASAC);在云计算场景下,将所提算法与3种经典的深度强化学习方法进行实验对比。实验结果表明,所提改进算法在不同场景下可以处理更多的用户请求,且消耗的能源较少。此外,对算法中各种策略进行消融实验,证明了所提策略的有效性。 展开更多
关键词 numa架构 深度学习 强化学习 能源感知 分层缓冲区
下载PDF
植物细胞中NuMA类似蛋白的分布及其在细胞周期中的变化 被引量:3
6
作者 孙英丽 赵允 +1 位作者 汪健 翟中和 《Acta Botanica Sinica》 CSCD 1999年第3期235-240,共6页
免疫荧光染色结果说明植物细胞核内含有与抗动物NuMA多抗呈阳性交叉反应的多肽。选择性抽提并结合免疫荧光染色结果说明这种多肽位于核基质纤维蛋白网络上。免疫印迹反应显示胡萝卜(DaucuscarotaL.)悬浮培养细胞核... 免疫荧光染色结果说明植物细胞核内含有与抗动物NuMA多抗呈阳性交叉反应的多肽。选择性抽提并结合免疫荧光染色结果说明这种多肽位于核基质纤维蛋白网络上。免疫印迹反应显示胡萝卜(DaucuscarotaL.)悬浮培养细胞核基质蛋白与抗动物NuMA蛋白多抗的阳性反应条带为74kD和76kD。有丝分裂各期免疫荧光染色的结果表明植物细胞中的NuMA类似蛋白在有丝分裂过程中呈现有规律的变化。结合选择性抽提的有丝分裂各期的免疫荧光染色的结果表明核基质在此过程中也发生明显变化。应用选择性抽提并结合DGD包埋去包埋电镜技术对植物细胞间期及有丝分裂期核基质的形态结构进行了观察。结果显示胡萝卜悬浮培养细胞间期核内存在一个非染色质性的纤维蛋白网络体系,而在正处于分裂的细胞中则未观察到。以上结果说明NuMA类似蛋白是核基质的组分之一并与有丝分裂密切相关。 展开更多
关键词 核基质 NuM基质 有丝分裂 植物细胞
下载PDF
核有丝分裂器蛋白NuMA在人脑胶质瘤中的表达 被引量:1
7
作者 肖瑾 万经海 +3 位作者 李长元 冯春国 徐培坤 胡向阳 《安徽医科大学学报》 CAS 北大核心 2007年第1期42-44,共3页
目的检测核有丝分裂器蛋白(NuMA)在人脑胶质瘤中的表达及其与胶质瘤临床病理学特征之间的关系。方法采用免疫组化SP法检测65例人脑胶质瘤标本和15例正常脑组织标本中NuMA蛋白的表达情况。结果NuMA在Ⅱ级、Ⅲ级、Ⅳ级人脑胶质瘤中的表达... 目的检测核有丝分裂器蛋白(NuMA)在人脑胶质瘤中的表达及其与胶质瘤临床病理学特征之间的关系。方法采用免疫组化SP法检测65例人脑胶质瘤标本和15例正常脑组织标本中NuMA蛋白的表达情况。结果NuMA在Ⅱ级、Ⅲ级、Ⅳ级人脑胶质瘤中的表达分别为42.9%、66.7%、82.4%;在正常脑组织中NuMA的表达率为20%。结论NuMA的过高表达与胶质瘤的组织病理学分级显著相关,而与肿瘤的组织学类型无关。 展开更多
关键词 numa 胶质瘤 免疫组织化学
下载PDF
基于NUMA MPSoC的FFT并行化算法设计及实现 被引量:1
8
作者 张冰 杜高明 +1 位作者 李丽 杨盛光 《微电子学与计算机》 CSCD 北大核心 2007年第12期109-112,共4页
如何充分利用多个处理器任务级并行或线程级并行的特点提高性能已成为MPSoC设计的关键问题之一。在建立基于非均匀存储型(Non-Uniform Memory Access Architecture,NUMA)MPSoC平台的基础上,以快速傅里叶变换为例,遵循减少核间通讯及平... 如何充分利用多个处理器任务级并行或线程级并行的特点提高性能已成为MPSoC设计的关键问题之一。在建立基于非均匀存储型(Non-Uniform Memory Access Architecture,NUMA)MPSoC平台的基础上,以快速傅里叶变换为例,遵循减少核间通讯及平均分配工作负载的原则,提出其并行化方法,设计出相应的并行程序及底层驱动,在FPGA原型芯片的运行环境下分析系统性能。试验结果表明,在4核MPSoC的FPGA原型系统中最高加速比可达2.65,具有较好的并行执行效率。 展开更多
关键词 numa 多核片上系统 FFT 并行算法
下载PDF
NuMA蛋白的生物学作用及其研究进展 被引量:1
9
作者 杨立琳 孙露双 +1 位作者 曾晓 曹允考 《东北农业大学学报》 CAS CSCD 2008年第10期127-130,共4页
NuMA存在于动、植物细胞中,是细胞核基质的重要组成部分,参与纺锤体极的组装与分解、核重组等过程,调节细胞周期,对细胞的有丝分裂和减数分裂具有重要作用。此外,对细胞凋亡也发挥重要作用,NuMA的降解是早期细胞调亡的标志。
关键词 numa 细胞 功能
下载PDF
CC-NUMA系统中一种块传输通讯机制的设计与实现 被引量:1
10
作者 张峻 庞征斌 +3 位作者 郑义 谢旻 徐炜遐 周兴铭 《计算机工程与科学》 CSCD 2008年第1期138-141,共4页
本文描述了一种CC-NUMA结点控制器内实现的通信机制,通信请求通过描述符进行提交,利用CC-NUMA硬件实现的Cache一致性协议,实现高性能的一致性数据传输。基于这种通信机制,实现了高速通信软件接口,使用用户级通信技术,将硬件的通讯功能... 本文描述了一种CC-NUMA结点控制器内实现的通信机制,通信请求通过描述符进行提交,利用CC-NUMA硬件实现的Cache一致性协议,实现高性能的一致性数据传输。基于这种通信机制,实现了高速通信软件接口,使用用户级通信技术,将硬件的通讯功能抽象出来给应用层使用,在测试中获得了较好的性能。 展开更多
关键词 CC-numa 描述符 一致性块传输 通信接口
下载PDF
基于CC-NUMA系统模拟器的并行程序性能分析 被引量:1
11
作者 陈渝 庞立会 +1 位作者 杨学军 陈福接 《计算机工程与科学》 CSCD 2001年第1期86-89,96,共5页
针对 CC- NUMA并行系统的特点 ,本文描述了模拟器—AMY的设计与实现。该模拟器运行在 x86PC机上的 L inux操作系统环境下 ,采用多项优化技术 ,能够较精确地统计并行程序的时间开销和 CC- NUMA并行系统的各项参数 ,具有执行速度快、精度... 针对 CC- NUMA并行系统的特点 ,本文描述了模拟器—AMY的设计与实现。该模拟器运行在 x86PC机上的 L inux操作系统环境下 ,采用多项优化技术 ,能够较精确地统计并行程序的时间开销和 CC- NUMA并行系统的各项参数 ,具有执行速度快、精度高和内存开销小等特点。在 AMY模拟器环境下 ,通过对几个典型的并行测试程序的模拟执行 ,文章给出了统计的模拟结果 ,分析了并行测试程序的执行行为和开销 ,最后得出了在 CC- NUMA并行系统中对并行程序进行性能优化的有益的指导原则。 展开更多
关键词 CC-numa 并行系统模拟器 性能分析 并行程序
下载PDF
四膜虫大核基质中含有NuMA类似蛋白
12
作者 孙英丽 陈丹英 高崇明 《动物学报》 SCIE CAS CSCD 2000年第1期104-107,共4页
SUN Ying Li CHEN Dan Ying GAO Chong Ming) (College of Life Sciences, Peking University, Beijing 100871, China)
关键词 四膜虫 numa 核基质
下载PDF
一种CC-NUMA系统模拟环境的研究与实现
13
作者 庞立会 陈渝 《计算机工程》 EI CAS CSCD 北大核心 2005年第3期82-85,共4页
描述了CC-NUMA模拟环境——AMY的研究与实现。它采用多项优化技术,能在X86 PC机上的Linux操作系统环境下运行,能够较精确地统计并行程序的时间开销和CC-NUMA并行系统的各项参数,它特别适合于分析并行程序在CC-NUMA系统下的执行行为和开... 描述了CC-NUMA模拟环境——AMY的研究与实现。它采用多项优化技术,能在X86 PC机上的Linux操作系统环境下运行,能够较精确地统计并行程序的时间开销和CC-NUMA并行系统的各项参数,它特别适合于分析并行程序在CC-NUMA系统下的执行行为和开销,能够有效指导并行程序的优化和对CC-NUMA并行系统进行深入研究。最后将AMY模拟环境与CC-NUMA系统以及其它的模拟环境进行比较分析,对它的精确性、灵活性和有效性进行了检验。 展开更多
关键词 并行程序 CC-numa 并行系统 LINUX操作系统 开销 PC机 模拟环境 有效指导 灵活性 有效性
下载PDF
CC-NUMA并行系统通信优化的变换技术
14
作者 陈渝 nudt.edu.cn +2 位作者 李春江 杨学军 陈福接 《软件学报》 EI CSCD 北大核心 2000年第4期507-514,共8页
减少通信开销是并行编译优化的主要目标之一 .该文针对具有 cache一致性的非一致存储访问并行系统 ( CC- NUMA)的特点 ,提出通过结合计算变换和数据变换 ,在统一的代数框架下对并行程序进行通信优化的策略和方法 .通过实验测试 。
关键词 并行编译 通信优化 数据变换 CC-numa
下载PDF
面向多处理器虚拟机的动态NUMA方法 被引量:2
15
作者 施继成 陈海波 臧斌宇 《小型微型计算机系统》 CSCD 北大核心 2015年第4期677-682,共6页
NUMA内存技术在增加了计算机系统内存带宽的同时,其跨节点访存延迟高的特点也增加了虚拟化平台的内存管理难度.现有的多核虚拟机NUMA优化方法大多为静态方法,即无需动态调节虚拟机状态.这些方法大都限制了虚拟化监控器调度虚拟CPU的灵活... NUMA内存技术在增加了计算机系统内存带宽的同时,其跨节点访存延迟高的特点也增加了虚拟化平台的内存管理难度.现有的多核虚拟机NUMA优化方法大多为静态方法,即无需动态调节虚拟机状态.这些方法大都限制了虚拟化监控器调度虚拟CPU的灵活性,降低了虚拟化平台负载均衡的能力,而影响虚拟机的运行效率.针对该问题,提出动态NUMA方法——在告知虚拟机NUMA拓扑结构的情况下,该方法通过调节虚拟机内操作系统NUMA相关数据结构方法,达到配合虚拟机监控器任务调度器的目的,实现虚拟机运行效率的提升.相较于静态方法,本文提出调节虚拟机NUMA数据结构,以适应虚拟机监控器调度器的动态方法.此方法提高了虚拟CPU的调度灵活性,提高了虚拟化平台负载均衡的能力,从而保证了多处理器虚拟机的运行效率. 展开更多
关键词 虚拟机监控器 多处理器 虚拟化 numa
下载PDF
面向CC-NUMA体系结构的事务内存冲突规避方法 被引量:1
16
作者 王睿伯 卢锡城 +1 位作者 卢凯 王绍刚 《计算机学报》 EI CSCD 北大核心 2011年第4期676-683,共8页
现有的事务内存研究主要面向多核处理器和SMP机器,缺少对CC-NUMA系统的研究.而CC-NUMA是高端服务器的重要体系结构,随着用户对并行处理能力需求的不断上升,高端服务器将占据越来越重要的地位.文中概要阐述事务内存研究的基本情况,通过... 现有的事务内存研究主要面向多核处理器和SMP机器,缺少对CC-NUMA系统的研究.而CC-NUMA是高端服务器的重要体系结构,随着用户对并行处理能力需求的不断上升,高端服务器将占据越来越重要的地位.文中概要阐述事务内存研究的基本情况,通过详尽的实验数据,深入分析了CC-NUMA结构的本地、远程访存差异特性对事务内存性能的影响,提出了一种面向CC-NUMA体系结构的冲突规避方法PBC.PBC在事务启动之前,对冲突可能性进行预测,并根据预测结果对事务进行调度,以降低事务的失败率.实验表明,文中提出的PBC方法可以显著提高CC-NUMA机器上运行事务内存的整体性能. 展开更多
关键词 事务内存 CC-numa 冲突规避
下载PDF
基于CC-NUMA的多处理器系统研究 被引量:1
17
作者 桑钊 张君毅 贺占庄 《现代电子技术》 2009年第2期16-18,22,共4页
针对当前多处理器发展形势,提出一种新型的CC-MUMA架构。CC-NUMA是广泛应用于多处理机系统的一种体系结构,兼具SMP和MPP的一些优点。简要介绍CC-NUMA多处理器系统的特点;分析其基本架构;详细讨论两种比较新的架构,并在此基础上提出一种... 针对当前多处理器发展形势,提出一种新型的CC-MUMA架构。CC-NUMA是广泛应用于多处理机系统的一种体系结构,兼具SMP和MPP的一些优点。简要介绍CC-NUMA多处理器系统的特点;分析其基本架构;详细讨论两种比较新的架构,并在此基础上提出一种简单、实用的新型架构,在灵活度、延迟、可扩展性方面均优于以前的架构,同时对其可行性及性能进行了全面分析。 展开更多
关键词 CC—numa Origin2000 ALPHA 21364 OPTERON 平均访问路程
下载PDF
面向NUMA集群的代数多重网格算法优化 被引量:1
18
作者 顾坚 刘伟 《计算机科学》 CSCD 北大核心 2014年第6期113-118,共6页
代数多重网格(AMG)是众多数值模拟应用的核心算法,在基于多核的NUMA架构的机群系统上,AMG的并行扩展性暴露了新的问题。通过设计感知NUMA架构的内存分配器,将划分给多个线程的数据分割并绑定到运行对应线程的CPU所属的NUMA存储节点上,... 代数多重网格(AMG)是众多数值模拟应用的核心算法,在基于多核的NUMA架构的机群系统上,AMG的并行扩展性暴露了新的问题。通过设计感知NUMA架构的内存分配器,将划分给多个线程的数据分割并绑定到运行对应线程的CPU所属的NUMA存储节点上,从而改善了OpenMP多线程并行的数据局部性,使BoomerAMG程序在大规模多核计算平台上具有更好的并行扩展性。在单节点和小规模机群的测试中,使用NAAlloc分配器分别获得了最高16%和60%的性能提升。 展开更多
关键词 代数多重网格 numa 多核 局部性
下载PDF
CC-NUMA架构下4路龙芯3B服务器设计与实现 被引量:2
19
作者 张鹏 《计算机工程与科学》 CSCD 北大核心 2018年第12期2141-2145,共5页
针对特定领域中服务器的高性能计算、高带宽通信以及自主可控需求,在分析龙芯3B3000处理器架构特点的基础上,设计了基于CC-NUMA并行处理架构的4路龙芯3B3000高性能服务器核心模块,通过使用TOE芯片提高了网络响应效率,同时大幅降低了10G... 针对特定领域中服务器的高性能计算、高带宽通信以及自主可控需求,在分析龙芯3B3000处理器架构特点的基础上,设计了基于CC-NUMA并行处理架构的4路龙芯3B3000高性能服务器核心模块,通过使用TOE芯片提高了网络响应效率,同时大幅降低了10G以太网接口对处理器资源的占用消耗,有效提高了服务器的综合性能。通过测试验证,该服务器能够实现高效的并行计算能力和10G以太网通信能力,且国产元器件种类占比和数量占比均可达95%以上。 展开更多
关键词 服务器 CC-numa 龙芯3B3000 TOE 自主可控
下载PDF
NUMA结构的高效实时稳定的垃圾回收算法
20
作者 廖彬 傅杰 +4 位作者 靳国杰 王一光 王磊 章隆兵 王剑 《高技术通讯》 CAS CSCD 北大核心 2015年第2期125-134,共10页
针对非一致性内存访问架构(NUMA)在垃圾回收(GC)过程中存在大量的远程内存读写导致GC性能降低的问题,对GC过程的各个阶段进行分析与研究,提出了一种基于NUMA结构的高效实时稳定的GC算法。该算法首先基于NUMA结构改进传统分代GC机... 针对非一致性内存访问架构(NUMA)在垃圾回收(GC)过程中存在大量的远程内存读写导致GC性能降低的问题,对GC过程的各个阶段进行分析与研究,提出了一种基于NUMA结构的高效实时稳定的GC算法。该算法首先基于NUMA结构改进传统分代GC机制的堆空间布局,然后通过控制GC过程中扫描活跃对象阶段的初始根对象选取、动态负载均衡阶段截取任务队列的选取以及复制活跃对象阶段对象复制位置的选取,大大减少GC过程中的远程访问次数。这种改进的GC机制对所有NUMA结构具有通用性。以Godson-3处理器的NUMA平台为例进行的实验结果显示,优化的GC机制极大地缩短了GC的时间,而且提高了应用程序的性能以及稳定性。在SPECjvm2008测试中,GC时间平均缩短了14.6%(GC总时间缩短4.1%-41.58%),应用程序的性能平均提升了4.68%(最高提升17.8%),应用程序的性能稳定性提升了76.2%。 展开更多
关键词 非一致性内存访问架构(numa) 垃圾回收(GC) 分代GC 活跃对象 根对象 动态负载均衡
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部