期刊文献+
共找到71篇文章
< 1 2 4 >
每页显示 20 50 100
Bowtie 2-NUMA:具有NUMA体系结构适应性的基因序列比对应用
1
作者 王强 孙彦洁 +1 位作者 齐星云 徐佳庆 《计算机工程与科学》 CSCD 北大核心 2024年第12期2117-2127,共11页
Bowtie 2作为生物信息领域使用最广泛的二代测序软件之一,具有计算密集的特点。如何根据多核平台的体系结构进行适应性优化以提高并行效率,成为亟待解决的问题。首先分析了非一致性访存架构的多样性,以及Bowtie 2在多种非一致性访存架... Bowtie 2作为生物信息领域使用最广泛的二代测序软件之一,具有计算密集的特点。如何根据多核平台的体系结构进行适应性优化以提高并行效率,成为亟待解决的问题。首先分析了非一致性访存架构的多样性,以及Bowtie 2在多种非一致性访存架构下内存访问拥塞和最后一级缓存命中率低的结构性瓶颈。然后,基于Bowtie 2在不同非一致性访存平台的表现特点,在复制索引、内存分配以及数据划分3个方面进行优化,提出了Bowtie 2-NUMA。最后,通过实验表明,Bowtie 2-NUMA面向不同计算平台,能够基于体系结构进行适应性优化,实现并行效率的提升。 展开更多
关键词 非一致性访存 Bowtie 2 适应性优化 体系结构 内存带宽 最后一级缓存
下载PDF
NUMA架构下不平衡多线程网络通信延迟检测
2
作者 何珏 黄怀霖 +2 位作者 陈崇明 李为明 丁伟锋 《电子设计工程》 2024年第23期131-135,共5页
针对不平衡动态多线程网络通信延迟检测不精准的问题,提出了NUMA架构下不平衡多线程网络通信延迟检测方法。引入通信进程性能降低比例,分析NUMA架构下的不平衡多线程网络通信延迟结构。计算不平衡多线程的网络通信延迟数据并行处理时间... 针对不平衡动态多线程网络通信延迟检测不精准的问题,提出了NUMA架构下不平衡多线程网络通信延迟检测方法。引入通信进程性能降低比例,分析NUMA架构下的不平衡多线程网络通信延迟结构。计算不平衡多线程的网络通信延迟数据并行处理时间,确定静态、动态延迟路径。分析NUMA架构延迟节点组织形式,计算从发生时间到发送时间产生的延迟,并根据静态、动态信息帧检测相应延迟。由实验结果可知,所研究方法静态通信情况下的延迟时间最长为1.45 min,最短为0.5 min,与实际延迟时间一致;动态通信情况下的延迟时间最长为9 min,最短为3.1 min,与实际延迟时间仅存在最大为0.3 min的误差。 展开更多
关键词 numa架构 不平衡多线程 网络通信 延迟检测
下载PDF
信创CPU与Intel CPU在NUMA架构方面的调优实践
3
作者 徐光龙 金鹰 《计算机应用文摘》 2024年第3期35-37,共3页
通过选取具有代表性的基准测试工具,文章对比了信创CPU和IntelCPU在多核性能方面的表现。同时,针对NUMA架构的特点进行了调优实验,并通过分析性能数据得出了调优前后的性能差异。结果表明,通过NUMA调优可以有效提高处理器的性能。
关键词 numa调优 信创CPU IntelCPU 性能对比测试 基准测试工具 处理器性能
下载PDF
植物细胞中NuMA类似蛋白的分布及其在细胞周期中的变化 被引量:3
4
作者 孙英丽 赵允 +1 位作者 汪健 翟中和 《Acta Botanica Sinica》 CSCD 1999年第3期235-240,共6页
免疫荧光染色结果说明植物细胞核内含有与抗动物NuMA多抗呈阳性交叉反应的多肽。选择性抽提并结合免疫荧光染色结果说明这种多肽位于核基质纤维蛋白网络上。免疫印迹反应显示胡萝卜(DaucuscarotaL.)悬浮培养细胞核... 免疫荧光染色结果说明植物细胞核内含有与抗动物NuMA多抗呈阳性交叉反应的多肽。选择性抽提并结合免疫荧光染色结果说明这种多肽位于核基质纤维蛋白网络上。免疫印迹反应显示胡萝卜(DaucuscarotaL.)悬浮培养细胞核基质蛋白与抗动物NuMA蛋白多抗的阳性反应条带为74kD和76kD。有丝分裂各期免疫荧光染色的结果表明植物细胞中的NuMA类似蛋白在有丝分裂过程中呈现有规律的变化。结合选择性抽提的有丝分裂各期的免疫荧光染色的结果表明核基质在此过程中也发生明显变化。应用选择性抽提并结合DGD包埋去包埋电镜技术对植物细胞间期及有丝分裂期核基质的形态结构进行了观察。结果显示胡萝卜悬浮培养细胞间期核内存在一个非染色质性的纤维蛋白网络体系,而在正处于分裂的细胞中则未观察到。以上结果说明NuMA类似蛋白是核基质的组分之一并与有丝分裂密切相关。 展开更多
关键词 核基质 NuM基质 有丝分裂 植物细胞
下载PDF
核有丝分裂器蛋白NuMA在人脑胶质瘤中的表达 被引量:1
5
作者 肖瑾 万经海 +3 位作者 李长元 冯春国 徐培坤 胡向阳 《安徽医科大学学报》 CAS 北大核心 2007年第1期42-44,共3页
目的检测核有丝分裂器蛋白(NuMA)在人脑胶质瘤中的表达及其与胶质瘤临床病理学特征之间的关系。方法采用免疫组化SP法检测65例人脑胶质瘤标本和15例正常脑组织标本中NuMA蛋白的表达情况。结果NuMA在Ⅱ级、Ⅲ级、Ⅳ级人脑胶质瘤中的表达... 目的检测核有丝分裂器蛋白(NuMA)在人脑胶质瘤中的表达及其与胶质瘤临床病理学特征之间的关系。方法采用免疫组化SP法检测65例人脑胶质瘤标本和15例正常脑组织标本中NuMA蛋白的表达情况。结果NuMA在Ⅱ级、Ⅲ级、Ⅳ级人脑胶质瘤中的表达分别为42.9%、66.7%、82.4%;在正常脑组织中NuMA的表达率为20%。结论NuMA的过高表达与胶质瘤的组织病理学分级显著相关,而与肿瘤的组织学类型无关。 展开更多
关键词 numa 胶质瘤 免疫组织化学
下载PDF
基于NUMA MPSoC的FFT并行化算法设计及实现 被引量:1
6
作者 张冰 杜高明 +1 位作者 李丽 杨盛光 《微电子学与计算机》 CSCD 北大核心 2007年第12期109-112,共4页
如何充分利用多个处理器任务级并行或线程级并行的特点提高性能已成为MPSoC设计的关键问题之一。在建立基于非均匀存储型(Non-Uniform Memory Access Architecture,NUMA)MPSoC平台的基础上,以快速傅里叶变换为例,遵循减少核间通讯及平... 如何充分利用多个处理器任务级并行或线程级并行的特点提高性能已成为MPSoC设计的关键问题之一。在建立基于非均匀存储型(Non-Uniform Memory Access Architecture,NUMA)MPSoC平台的基础上,以快速傅里叶变换为例,遵循减少核间通讯及平均分配工作负载的原则,提出其并行化方法,设计出相应的并行程序及底层驱动,在FPGA原型芯片的运行环境下分析系统性能。试验结果表明,在4核MPSoC的FPGA原型系统中最高加速比可达2.65,具有较好的并行执行效率。 展开更多
关键词 numa 多核片上系统 FFT 并行算法
下载PDF
NuMA蛋白的生物学作用及其研究进展 被引量:1
7
作者 杨立琳 孙露双 +1 位作者 曾晓 曹允考 《东北农业大学学报》 CAS CSCD 2008年第10期127-130,共4页
NuMA存在于动、植物细胞中,是细胞核基质的重要组成部分,参与纺锤体极的组装与分解、核重组等过程,调节细胞周期,对细胞的有丝分裂和减数分裂具有重要作用。此外,对细胞凋亡也发挥重要作用,NuMA的降解是早期细胞调亡的标志。
关键词 numa 细胞 功能
下载PDF
面向CC-NUMA体系结构的事务内存冲突规避方法 被引量:1
8
作者 王睿伯 卢锡城 +1 位作者 卢凯 王绍刚 《计算机学报》 EI CSCD 北大核心 2011年第4期676-683,共8页
现有的事务内存研究主要面向多核处理器和SMP机器,缺少对CC-NUMA系统的研究.而CC-NUMA是高端服务器的重要体系结构,随着用户对并行处理能力需求的不断上升,高端服务器将占据越来越重要的地位.文中概要阐述事务内存研究的基本情况,通过... 现有的事务内存研究主要面向多核处理器和SMP机器,缺少对CC-NUMA系统的研究.而CC-NUMA是高端服务器的重要体系结构,随着用户对并行处理能力需求的不断上升,高端服务器将占据越来越重要的地位.文中概要阐述事务内存研究的基本情况,通过详尽的实验数据,深入分析了CC-NUMA结构的本地、远程访存差异特性对事务内存性能的影响,提出了一种面向CC-NUMA体系结构的冲突规避方法PBC.PBC在事务启动之前,对冲突可能性进行预测,并根据预测结果对事务进行调度,以降低事务的失败率.实验表明,文中提出的PBC方法可以显著提高CC-NUMA机器上运行事务内存的整体性能. 展开更多
关键词 事务内存 CC-numa 冲突规避
下载PDF
CC-NUMA系统中一种块传输通讯机制的设计与实现 被引量:1
9
作者 张峻 庞征斌 +3 位作者 郑义 谢旻 徐炜遐 周兴铭 《计算机工程与科学》 CSCD 2008年第1期138-141,共4页
本文描述了一种CC-NUMA结点控制器内实现的通信机制,通信请求通过描述符进行提交,利用CC-NUMA硬件实现的Cache一致性协议,实现高性能的一致性数据传输。基于这种通信机制,实现了高速通信软件接口,使用用户级通信技术,将硬件的通讯功能... 本文描述了一种CC-NUMA结点控制器内实现的通信机制,通信请求通过描述符进行提交,利用CC-NUMA硬件实现的Cache一致性协议,实现高性能的一致性数据传输。基于这种通信机制,实现了高速通信软件接口,使用用户级通信技术,将硬件的通讯功能抽象出来给应用层使用,在测试中获得了较好的性能。 展开更多
关键词 CC-numa 描述符 一致性块传输 通信接口
下载PDF
基于CC-NUMA系统模拟器的并行程序性能分析 被引量:1
10
作者 陈渝 庞立会 +1 位作者 杨学军 陈福接 《计算机工程与科学》 CSCD 2001年第1期86-89,96,共5页
针对 CC- NUMA并行系统的特点 ,本文描述了模拟器—AMY的设计与实现。该模拟器运行在 x86PC机上的 L inux操作系统环境下 ,采用多项优化技术 ,能够较精确地统计并行程序的时间开销和 CC- NUMA并行系统的各项参数 ,具有执行速度快、精度... 针对 CC- NUMA并行系统的特点 ,本文描述了模拟器—AMY的设计与实现。该模拟器运行在 x86PC机上的 L inux操作系统环境下 ,采用多项优化技术 ,能够较精确地统计并行程序的时间开销和 CC- NUMA并行系统的各项参数 ,具有执行速度快、精度高和内存开销小等特点。在 AMY模拟器环境下 ,通过对几个典型的并行测试程序的模拟执行 ,文章给出了统计的模拟结果 ,分析了并行测试程序的执行行为和开销 ,最后得出了在 CC- NUMA并行系统中对并行程序进行性能优化的有益的指导原则。 展开更多
关键词 CC-numa 并行系统模拟器 性能分析 并行程序
下载PDF
CC-NUMA架构下4路龙芯3B服务器设计与实现 被引量:2
11
作者 张鹏 《计算机工程与科学》 CSCD 北大核心 2018年第12期2141-2145,共5页
针对特定领域中服务器的高性能计算、高带宽通信以及自主可控需求,在分析龙芯3B3000处理器架构特点的基础上,设计了基于CC-NUMA并行处理架构的4路龙芯3B3000高性能服务器核心模块,通过使用TOE芯片提高了网络响应效率,同时大幅降低了10G... 针对特定领域中服务器的高性能计算、高带宽通信以及自主可控需求,在分析龙芯3B3000处理器架构特点的基础上,设计了基于CC-NUMA并行处理架构的4路龙芯3B3000高性能服务器核心模块,通过使用TOE芯片提高了网络响应效率,同时大幅降低了10G以太网接口对处理器资源的占用消耗,有效提高了服务器的综合性能。通过测试验证,该服务器能够实现高效的并行计算能力和10G以太网通信能力,且国产元器件种类占比和数量占比均可达95%以上。 展开更多
关键词 服务器 CC-numa 龙芯3B3000 TOE 自主可控
下载PDF
四膜虫大核基质中含有NuMA类似蛋白
12
作者 孙英丽 陈丹英 高崇明 《动物学报》 SCIE CAS CSCD 2000年第1期104-107,共4页
SUN Ying Li CHEN Dan Ying GAO Chong Ming) (College of Life Sciences, Peking University, Beijing 100871, China)
关键词 四膜虫 numa 核基质
下载PDF
一种CC-NUMA系统模拟环境的研究与实现
13
作者 庞立会 陈渝 《计算机工程》 EI CAS CSCD 北大核心 2005年第3期82-85,共4页
描述了CC-NUMA模拟环境——AMY的研究与实现。它采用多项优化技术,能在X86 PC机上的Linux操作系统环境下运行,能够较精确地统计并行程序的时间开销和CC-NUMA并行系统的各项参数,它特别适合于分析并行程序在CC-NUMA系统下的执行行为和开... 描述了CC-NUMA模拟环境——AMY的研究与实现。它采用多项优化技术,能在X86 PC机上的Linux操作系统环境下运行,能够较精确地统计并行程序的时间开销和CC-NUMA并行系统的各项参数,它特别适合于分析并行程序在CC-NUMA系统下的执行行为和开销,能够有效指导并行程序的优化和对CC-NUMA并行系统进行深入研究。最后将AMY模拟环境与CC-NUMA系统以及其它的模拟环境进行比较分析,对它的精确性、灵活性和有效性进行了检验。 展开更多
关键词 并行程序 CC-numa 并行系统 LINUX操作系统 开销 PC机 模拟环境 有效指导 灵活性 有效性
下载PDF
CC-NUMA并行系统通信优化的变换技术
14
作者 陈渝 nudt.edu.cn +2 位作者 李春江 杨学军 陈福接 《软件学报》 EI CSCD 北大核心 2000年第4期507-514,共8页
减少通信开销是并行编译优化的主要目标之一 .该文针对具有 cache一致性的非一致存储访问并行系统 ( CC- NUMA)的特点 ,提出通过结合计算变换和数据变换 ,在统一的代数框架下对并行程序进行通信优化的策略和方法 .通过实验测试 。
关键词 并行编译 通信优化 数据变换 CC-numa
下载PDF
CC-NUMA结构计算机含错技术研究
15
作者 金丽娜 《长春大学学报》 2008年第12期28-30,共3页
主要研究CC-NUMA结构计算机的主存共享状态下含错技术问题。本文对主存共享、含错区域划分进行了说明,并深入分析了在主存共享状态下的含错区域划分、乱写防护等含错技术支持和保障。
关键词 CC—numa 主存共享 含错技术
下载PDF
面向多处理器虚拟机的动态NUMA方法 被引量:2
16
作者 施继成 陈海波 臧斌宇 《小型微型计算机系统》 CSCD 北大核心 2015年第4期677-682,共6页
NUMA内存技术在增加了计算机系统内存带宽的同时,其跨节点访存延迟高的特点也增加了虚拟化平台的内存管理难度.现有的多核虚拟机NUMA优化方法大多为静态方法,即无需动态调节虚拟机状态.这些方法大都限制了虚拟化监控器调度虚拟CPU的灵活... NUMA内存技术在增加了计算机系统内存带宽的同时,其跨节点访存延迟高的特点也增加了虚拟化平台的内存管理难度.现有的多核虚拟机NUMA优化方法大多为静态方法,即无需动态调节虚拟机状态.这些方法大都限制了虚拟化监控器调度虚拟CPU的灵活性,降低了虚拟化平台负载均衡的能力,而影响虚拟机的运行效率.针对该问题,提出动态NUMA方法——在告知虚拟机NUMA拓扑结构的情况下,该方法通过调节虚拟机内操作系统NUMA相关数据结构方法,达到配合虚拟机监控器任务调度器的目的,实现虚拟机运行效率的提升.相较于静态方法,本文提出调节虚拟机NUMA数据结构,以适应虚拟机监控器调度器的动态方法.此方法提高了虚拟CPU的调度灵活性,提高了虚拟化平台负载均衡的能力,从而保证了多处理器虚拟机的运行效率. 展开更多
关键词 虚拟机监控器 多处理器 虚拟化 numa
下载PDF
基于CC-NUMA的多处理器系统研究 被引量:1
17
作者 桑钊 张君毅 贺占庄 《现代电子技术》 2009年第2期16-18,22,共4页
针对当前多处理器发展形势,提出一种新型的CC-MUMA架构。CC-NUMA是广泛应用于多处理机系统的一种体系结构,兼具SMP和MPP的一些优点。简要介绍CC-NUMA多处理器系统的特点;分析其基本架构;详细讨论两种比较新的架构,并在此基础上提出一种... 针对当前多处理器发展形势,提出一种新型的CC-MUMA架构。CC-NUMA是广泛应用于多处理机系统的一种体系结构,兼具SMP和MPP的一些优点。简要介绍CC-NUMA多处理器系统的特点;分析其基本架构;详细讨论两种比较新的架构,并在此基础上提出一种简单、实用的新型架构,在灵活度、延迟、可扩展性方面均优于以前的架构,同时对其可行性及性能进行了全面分析。 展开更多
关键词 CC—numa Origin2000 ALPHA 21364 OPTERON 平均访问路程
下载PDF
面向NUMA集群的代数多重网格算法优化 被引量:1
18
作者 顾坚 刘伟 《计算机科学》 CSCD 北大核心 2014年第6期113-118,共6页
代数多重网格(AMG)是众多数值模拟应用的核心算法,在基于多核的NUMA架构的机群系统上,AMG的并行扩展性暴露了新的问题。通过设计感知NUMA架构的内存分配器,将划分给多个线程的数据分割并绑定到运行对应线程的CPU所属的NUMA存储节点上,... 代数多重网格(AMG)是众多数值模拟应用的核心算法,在基于多核的NUMA架构的机群系统上,AMG的并行扩展性暴露了新的问题。通过设计感知NUMA架构的内存分配器,将划分给多个线程的数据分割并绑定到运行对应线程的CPU所属的NUMA存储节点上,从而改善了OpenMP多线程并行的数据局部性,使BoomerAMG程序在大规模多核计算平台上具有更好的并行扩展性。在单节点和小规模机群的测试中,使用NAAlloc分配器分别获得了最高16%和60%的性能提升。 展开更多
关键词 代数多重网格 numa 多核 局部性
下载PDF
NUMA结构的高效实时稳定的垃圾回收算法
19
作者 廖彬 傅杰 +4 位作者 靳国杰 王一光 王磊 章隆兵 王剑 《高技术通讯》 CAS CSCD 北大核心 2015年第2期125-134,共10页
针对非一致性内存访问架构(NUMA)在垃圾回收(GC)过程中存在大量的远程内存读写导致GC性能降低的问题,对GC过程的各个阶段进行分析与研究,提出了一种基于NUMA结构的高效实时稳定的GC算法。该算法首先基于NUMA结构改进传统分代GC机... 针对非一致性内存访问架构(NUMA)在垃圾回收(GC)过程中存在大量的远程内存读写导致GC性能降低的问题,对GC过程的各个阶段进行分析与研究,提出了一种基于NUMA结构的高效实时稳定的GC算法。该算法首先基于NUMA结构改进传统分代GC机制的堆空间布局,然后通过控制GC过程中扫描活跃对象阶段的初始根对象选取、动态负载均衡阶段截取任务队列的选取以及复制活跃对象阶段对象复制位置的选取,大大减少GC过程中的远程访问次数。这种改进的GC机制对所有NUMA结构具有通用性。以Godson-3处理器的NUMA平台为例进行的实验结果显示,优化的GC机制极大地缩短了GC的时间,而且提高了应用程序的性能以及稳定性。在SPECjvm2008测试中,GC时间平均缩短了14.6%(GC总时间缩短4.1%-41.58%),应用程序的性能平均提升了4.68%(最高提升17.8%),应用程序的性能稳定性提升了76.2%。 展开更多
关键词 非一致性内存访问架构(numa) 垃圾回收(GC) 分代GC 活跃对象 根对象 动态负载均衡
下载PDF
面向NUMA架构的虚拟网络功能部署技术研究 被引量:1
20
作者 许道强 邹云峰 +2 位作者 邓君华 李浩 钱柱中 《计算机工程与应用》 CSCD 北大核心 2019年第21期115-121,157,共8页
针对非一致内存访问架构的集群系统,探讨了虚拟网络功能链的时延问题,以及重用已部署的虚拟网络功能提升资源利用率机制。形式化定义了面向最小化时延的虚拟网络功能部署问题,证明其为NP难问题,提出了基于马尔可夫链概率迭代的部署算法M... 针对非一致内存访问架构的集群系统,探讨了虚拟网络功能链的时延问题,以及重用已部署的虚拟网络功能提升资源利用率机制。形式化定义了面向最小化时延的虚拟网络功能部署问题,证明其为NP难问题,提出了基于马尔可夫链概率迭代的部署算法MarVNFP。实验证明,与典型的虚拟网络功能部署算法MRP相比,MarVNFP算法能减少虚拟网络功能链近40%的跨域数据传输,有效降低了时延。 展开更多
关键词 网络功能虚拟化 numa 资源调度 马尔可夫链
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部