期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
面向多核CPU与GPU平台的图处理系统关键技术综述
1
作者 张园 曹华伟 +5 位作者 张婕 申玥 孙一鸣 敦明 安学军 叶笑春 《计算机研究与发展》 EI CSCD 北大核心 2024年第6期1401-1428,共28页
图计算作为分析与挖掘关联关系的一种关键技术,已在智慧医疗、社交网络分析、金融反欺诈、地图道路规划、计算科学等领域广泛应用.当前,通用CPU与GPU架构的并行结构、访存结构、互连结构及同步机制的不断发展,使得多核CPU与GPU成为图处... 图计算作为分析与挖掘关联关系的一种关键技术,已在智慧医疗、社交网络分析、金融反欺诈、地图道路规划、计算科学等领域广泛应用.当前,通用CPU与GPU架构的并行结构、访存结构、互连结构及同步机制的不断发展,使得多核CPU与GPU成为图处理加速的常用平台.但由于图处理具有处理数据规模大、数据依赖复杂、访存计算比高等特性,加之现实应用场景下的图数据分布不规则且图中的顶点与边呈现动态变化,给图处理的性能提升和高可扩展性带来严峻挑战.为应对上述挑战,大量基于多核CPU与GPU平台的图处理系统被提出,并在该领域取得显著成果.为了让读者了解多核CPU与GPU平台上图处理优化相关技术的演化,首先剖析了图数据、图算法、图应用特性,并阐明图处理所面临的挑战.然后分类梳理了当前已有的基于多核CPU与GPU平台的图处理系统,并从加速图处理设计的角度,详细、系统地总结了关键优化技术,包括图数据预处理、访存优化、计算加速和数据通信优化等.最后对已有先进图处理系统的性能、可扩展性等进行分析,并从不同角度对图处理未来发展趋势进行展望,希望对从事图处理系统研究的学者有一定的启发. 展开更多
关键词 多核CPU与GPU平台 图处理系统 图数据表示 负载均衡 不规则访存 动态图处理
下载PDF
HSEGRL:一种分层可自解释的图表示学习模型
2
作者 李平 宋舒寒 +3 位作者 张园 曹华伟 叶笑春 唐志敏 《计算机研究与发展》 EI CSCD 北大核心 2024年第8期1993-2007,共15页
近年来,随着图神经网络(graph neural network,GNN)技术在社交、信息、化学、生物等领域的广泛应用,GNN可解释性也受到广泛的关注.然而,现有的解释方法无法捕获层次化的解释信息,同时,这些层次信息未能被充分利用以提升图分类任务的准确... 近年来,随着图神经网络(graph neural network,GNN)技术在社交、信息、化学、生物等领域的广泛应用,GNN可解释性也受到广泛的关注.然而,现有的解释方法无法捕获层次化的解释信息,同时,这些层次信息未能被充分利用以提升图分类任务的准确率.基于这一问题,提出了一种层次化自解释的图表示学习(hierarchical self-explanation graph representation learning,HSEGRL)模型,该模型通过发现图结构中的层次信息进行图分类预测的同时,输出层次化的模型自解释结果.具体而言,针对图层次信息的发现设计了提取信息的基本单元——解释子,该解释子由提取节点特征的编码器获取层次化解释感知子图的池化层和抽取高阶解释信息的解码器组成.其中,为了准确提取层次化的解释子图,针对该模型的池化操作进行了解释感知优化设计,该设计通过评估模型的拓扑及特征重要性,层次化地筛选解释子图,实现分层自解释的同时完成图分类任务.HSEGRL是一个功能完备且便于迁移的图表示学习自解释模型,可以层次化综合考虑模型的拓扑信息与节点特征信息.在模型有效性验证层面,分别在分子、蛋白质和社交数据集上进行大量实验,实验结果表明所提模型在图分类任务中的分类准确率高于已有的先进的GNN自解释模型和GNN模型,并通过可视化分层解释结果的信息证明了该解释方法可信. 展开更多
关键词 图表示学习 图神经网络 可自解释模型 图拓扑 消息传递机制
下载PDF
面向低精度神经网络的数据流体系结构优化 被引量:1
3
作者 范志华 吴欣欣 +4 位作者 李文明 曹华伟 安学军 叶笑春 范东睿 《计算机研究与发展》 EI CSCD 北大核心 2023年第1期43-58,共16页
数据流架构的执行方式与神经网络算法具有高度匹配性,能充分挖掘数据的并行性.然而,随着神经网络向更低精度的发展,数据流架构的研究并未面向低精度神经网络展开,在传统数据流架构部署低精度(INT8,INT4或者更低)神经网络时,会面临3个问... 数据流架构的执行方式与神经网络算法具有高度匹配性,能充分挖掘数据的并行性.然而,随着神经网络向更低精度的发展,数据流架构的研究并未面向低精度神经网络展开,在传统数据流架构部署低精度(INT8,INT4或者更低)神经网络时,会面临3个问题:1)传统数据流架构的计算部件数据通路与低精度数据不匹配,无法体现低精度神经网络的性能和能效优势;2)向量化并行计算的低精度数据在片上存储中要求顺序排列,然而它在片外存储层次中是分散排列的,使得数据的加载和写回操作变得复杂,传统数据流架构的访存部件无法高效支持这种复杂的访存模式;3)传统数据流架构中使用双缓冲机制掩盖数据的传输延迟,但是,当传输低精度数据时,传输带宽的利用率显著降低,导致计算延迟无法掩盖数据传输延迟,双缓冲机制面临失效风险,进而影响数据流架构的性能和能效.为解决这3个问题,设计了面向低精度神经网络的数据流加速器DPU_Q.首先,设计了灵活可重构的计算单元,根据指令的精度标志位动态重构数据通路,一方面能高效灵活地支持多种低精度数据运算,另一方面能进一步提高计算并行性和吞吐量.另外,为解决低精度神经网络复杂的访存模式,设计了Scatter引擎,该引擎将在低层次或者片外存储中地址空间离散分布的低精度数据进行拼接、预处理,以满足高层次或者片上存储对数据排列的格式要求.同时,Scatter引擎能有效解决传输低精度数据时带宽利用率低的问题,解决了双缓冲机制失效的问题.最后,从软件方面提出了基于数据流执行模式的低精度神经网络映射算法,兼顾负载均衡的同时能对权重、激活值数据进行充分复用,减少了访存和数据流图节点间的数据传输开销.实验表明,相比于同精度的GPU(Titan Xp)、数据流架构(Eyeriss)和低精度神经网络加速器(BitFusion),DPU_Q分别获得3.18倍、6.05倍、1.52倍的性能提升和4.49倍、1.6倍、1.13倍的能效提升. 展开更多
关键词 数据流架构 低精度神经网络 量化 可重构架构 直接内存访问
下载PDF
面向高通量计算机的图算法优化技术 被引量:10
4
作者 张承龙 曹华伟 +4 位作者 王国波 郝沁汾 张洋 叶笑春 范东睿 《计算机研究与发展》 EI CSCD 北大核心 2020年第6期1152-1163,共12页
随着互联网技术的蓬勃发展,图数据的规模呈爆炸式增长.如何高效地处理大规模图数据逐渐成为工业界和学术界关注的焦点.宽度优先搜索算法是解决图遍历问题的经典算法,也是Graph500基准的核心测试程序之一.高通量计算机采用ARM架构的众核... 随着互联网技术的蓬勃发展,图数据的规模呈爆炸式增长.如何高效地处理大规模图数据逐渐成为工业界和学术界关注的焦点.宽度优先搜索算法是解决图遍历问题的经典算法,也是Graph500基准的核心测试程序之一.高通量计算机采用ARM架构的众核体系结构,具有高并发、强实时、低功耗等适于大数据计算的特点.在单节点上,BFS算法的优化已取得一系列进展,首先对现有的优化技术进行系统的介绍,并在此基础上提出2种面向高通量计算机的优化手段,通过减少冗余访存和提高缓存局部性,有效提高了算法的访存效率.通过这些优化手段,在高通量计算机上对BFS算法的性能进行了系统的评估.对于顶点规模为230的Kronecker图(顶点数为230,边数为234),优化后的BFS算法在高通量计算机上的平均性能为24.26 GTEPS.与两路x86架构服务器相比,单节点具有1.18倍的性能优势.在性能功耗比方面,高通量计算机的结果为181.04 MTEPS W.在2019年6月份的Green Graph500面向大数据集的排行榜上取得第2名的成绩.综上,高通量计算机的高并发和低功耗等特点非常适合处理大规模图计算等数据密集型应用. 展开更多
关键词 宽度优先搜索 高通量 Graph500 图算法 超算
下载PDF
Influence of a TiAlN Coating on the Mechanical Properties of a Heat Resistant Steel at Room Temperature and 650℃ 被引量:2
5
作者 张程煜 cao huawei +2 位作者 HAN Dong QIAO Shengru 郭永 《Journal of Wuhan University of Technology(Materials Science)》 SCIE EI CAS 2013年第5期1029-1033,共5页
A TiA1N coating was deposited on a heat resistant steel X12CrMoWVNbN10-1-1 by vacuum arc ion plating. The tensile and fatigue properties of the coated steel were investigated at room temperature (RT) and 650 ℃. The... A TiA1N coating was deposited on a heat resistant steel X12CrMoWVNbN10-1-1 by vacuum arc ion plating. The tensile and fatigue properties of the coated steel were investigated at room temperature (RT) and 650 ℃. The results reveal that the TiA1N coating is compact, on which a small number of large particle and pits are present. The Ti/Al atomic ratio in the coating is about 0.94. The average hardness of the coating is 1 868 HV0.1 and the interface bonding force between TiAIN coating and the substrate is about 3 l N. The elastic modulus and the strength of the steel are improved by the deposition of TiAIN coating. The influence of the TiA1N coating on the tensile properties of the steel can be ignored at both RT and 650 ℃. Moreover, there is no obvious decrease of the fatigue limit of substrate when the steel is coated by the coating at the investigated temperature. 展开更多
关键词 TiA1N coating TENSILE FATIGUE vacuum arc ion plating
下载PDF
肾移植受者衰弱患病情况及相关因素分析
6
作者 曹华伟 张建东 +1 位作者 王玮 胥青芝 《中华医学杂志》 CAS CSCD 北大核心 2023年第20期1531-1537,共7页
目的调查肾移植受者衰弱的患病率并分析肾移植受者术后衰弱的相关因素。方法回顾性纳入2020年11月至2022年5月在首都医科大学附属北京朝阳医院泌尿外科门诊随访的201例肾移植受者资料。以Fried衰弱表型(包括意外体重下降、步行速度慢、... 目的调查肾移植受者衰弱的患病率并分析肾移植受者术后衰弱的相关因素。方法回顾性纳入2020年11月至2022年5月在首都医科大学附属北京朝阳医院泌尿外科门诊随访的201例肾移植受者资料。以Fried衰弱表型(包括意外体重下降、步行速度慢、握力差、体力活动少、疲惫5个方面)为诊断标准,调查肾移植受者衰弱患病情况。分别建立logistic回归模型和CART决策树模型,分析肾移植术后衰弱的影响因素。结果肾移植受者衰弱患病率为25.9%(52例)。衰弱组年龄[M(Q 1,Q 3)]高于非衰弱组,分别为57(49,62)和46(38,56)岁(P<0.001);男性分别占51.9%(27例)、62.4%(93例),性别构成差异无统计学意义(P=0.244)。在Fried衰弱表型的5个组分中,意外体重下降发生率最低,为19.4%(39/201)。衰弱组发生率最高的衰弱组合为步行速度慢+低体力活动+疲惫,为19.2%(10/52)。logistic回归模型显示,高龄(OR=1.062,95%CI:1.005~1.123)、急性排斥史(OR=16.776,95%CI:2.288~123.028)、高中性粒细胞/淋巴细胞比值(NLR)(OR=2.096,95%CI:1.158~3.792)和患共病(OR=10.600,95%CI:1.828~61.482)是肾移植受者衰弱的危险因素,高血清白蛋白水平(OR=0.623,95%CI:0.488~0.795)是保护因素。CART决策树生长3层,共有4个终末节点,筛选出3个解释变量:血清白蛋白、NLR和年龄。logistic回归模型的准确度为87.1%(95%CI:82.5%~91.7%),灵敏度为69.2%(95%CI:54.7%~80.9%),特异度为93.3%(95%CI:87.7%~96.6%),受试者工作特征(ROC)曲线下面积(AUC)为0.951(95%CI:0.923~0.978);决策树模型的准确度为91.0%(95%CI:87.0%~95.0%),灵敏度为82.7%(95%CI:69.2%~91.3%),特异度为94.0%(95%CI:88.5%~97.0%),AUC为0.883(95%CI:0.819~0.948)。结论本研究中肾移植受者衰弱的患病率为25.9%;高龄、急性排斥史、低血清白蛋白水平、NLR升高和患共病可能与肾移植受者术后长期衰弱相关。 展开更多
关键词 肾移植 衰弱 患病率 影响因素 横断面研究
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部