期刊文献+
共找到87篇文章
< 1 2 5 >
每页显示 20 50 100
基于国产DCU异构平台的图匹配算法移植与优化
1
作者 郝萌 田雪洋 +3 位作者 鲁刚钊 刘义 张伟哲 何慧 《计算机科学》 CSCD 北大核心 2024年第4期67-77,共11页
子图匹配是一种基础的图算法,被广泛应用于社交网络、图神经网络等众多领域。随着图数据规模的增长,人们迫切需要高效的子图匹配算法。GENEVA是一种基于GPU的并行子图匹配算法,其利用区间索引的图存储结构和并行匹配优化方法,能够大幅... 子图匹配是一种基础的图算法,被广泛应用于社交网络、图神经网络等众多领域。随着图数据规模的增长,人们迫切需要高效的子图匹配算法。GENEVA是一种基于GPU的并行子图匹配算法,其利用区间索引的图存储结构和并行匹配优化方法,能够大幅度减少存储开销,提升子图匹配性能。但由于平台底层硬件架构和编译环境的不同,GENEVA无法直接应用到国产DCU异构平台。为了解决该问题,提出了GENEVA面向国产DCU的移植和优化方案。IO时间开销是GENEVA算法主要的性能瓶颈,文中采用锁页内存、预加载、调度器3种优化策略来突破该瓶颈。其中,锁页内存技术避免了从可分页内存到临时锁页内存的额外数据传输,在DCU平台上大幅度减少了IO传输的时间开销;预加载技术将IO数据传输与DCU核函数计算重叠,掩盖了IO时间开销;调度器在满足预加载需求的同时,减少了冗余数据的传输。在3个不同规模的真实数据集上进行实验,结果表明,采用优化策略后算法性能显著提高。在92.6%的测试用例上,经过优化的GENEVA-HIP算法在国产DCU平台的执行时间比移植前的GENEVA算法在GPU服务器的执行时间短。在较大规模的数据集上,优化的GENEVA-HIP算法在DCU平台上的执行时间相比移植前的GENEVA算法在GPU服务器的执行时间减少了52.73%。 展开更多
关键词 子图匹配 dcu 异构平台 HIP 移植和优化
下载PDF
基于国产化分体式DCU与博世ECU交互性验证研究
2
作者 檀在先 余国成 王再兴 《内燃机与配件》 2024年第11期25-28,共4页
现阶段SCR(Selective Catalytic Reduction)技术是柴油机降低尾气中NOx的最主要手段之一。随着国产化进程的推进,具有高度集成化后处理控制单元DCU被广泛关注,本文从理论上解释了国产化后处理控制系统DCU与发动机主控单元ECU之间信息交... 现阶段SCR(Selective Catalytic Reduction)技术是柴油机降低尾气中NOx的最主要手段之一。随着国产化进程的推进,具有高度集成化后处理控制单元DCU被广泛关注,本文从理论上解释了国产化后处理控制系统DCU与发动机主控单元ECU之间信息交互的方式,并通过台架排放循环和整车试验说明了该方式满足中国第六阶段法规要求,进一步的扩展和肯定了国产化后处理应用市场的潜力。 展开更多
关键词 柴油机 国产化 SCR dcu
下载PDF
AI芯片受限 海光信息DCU能否担起替代重任?
3
作者 孙永杰 《通信世界》 2024年第6期4-4,共1页
众所周知,随着非市场因素的不断变化,中国相关产业和企业在发展AI的过程中,获得和使用英伟达AI芯片的限制越来越多。那么问题来了,除了英伟达之外,中国是否具备自主替代的能力?近日,媒体频频报道称,海光信息的DCU有望成为英伟达芯片最... 众所周知,随着非市场因素的不断变化,中国相关产业和企业在发展AI的过程中,获得和使用英伟达AI芯片的限制越来越多。那么问题来了,除了英伟达之外,中国是否具备自主替代的能力?近日,媒体频频报道称,海光信息的DCU有望成为英伟达芯片最佳替代者。 展开更多
关键词 非市场因素 AI 替代者 dcu 产业和企业 芯片 信息
下载PDF
面向国产异构DCU平台的大规模并行矩量法研究
4
作者 贾瑞鹏 林中朝 +2 位作者 左胜 张玉 杨美红 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期76-83,共8页
面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配... 面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配的问题,实现了矩量法异构并行计算过程的负载均衡。采用细粒度任务划分策略与异步通信技术,对深度计算处理器计算过程进行了流水线优化设计,实现了计算与通信重叠,提升了矩量法异构协同计算的效率。通过与有限元法的仿真结果对比,验证了CPU+DCU异构并行矩量法的准确性。基于国产深度计算处理器异构平台的可扩展性分析结果表明,与单纯CPU计算相比,所实现的CPU+DCU异构协同计算方法能够获得5.5~7.0倍的加速效果,且在国家超级计算西安中心能够实现全系统运行,并行规模从360节点扩展到3 600节点(共1 036 800个处理器核心),并行效率可以达到约73.5%。 展开更多
关键词 高阶矩量法 国产异构并行系统 深度计算处理器 异构协同并行计算
下载PDF
面向DCU的LDS访存向量化优化 被引量:1
5
作者 杨思驰 赵荣彩 +1 位作者 韩林 王洪生 《计算机工程》 CAS CSCD 北大核心 2024年第2期206-213,共8页
在深度计算器(DCU)中,本地数据共享(LDS)是相较于全局内存延迟更低、带宽更高的关键存储部件。随着异构程序对LDS的使用越来越频繁,LDS访存效率低下成为限制异构程序性能的重要因素。此外,LDS访问过程中存在bank冲突的特性,使LDS的访问... 在深度计算器(DCU)中,本地数据共享(LDS)是相较于全局内存延迟更低、带宽更高的关键存储部件。随着异构程序对LDS的使用越来越频繁,LDS访存效率低下成为限制异构程序性能的重要因素。此外,LDS访问过程中存在bank冲突的特性,使LDS的访问应遵循一定原则才能高效利用,当线程间的数据访问呈现重叠的访存特征时,访问向量化指令会因此产生延迟。针对此问题,提出面向DCU的LDS访存向量化优化方法。通过实现连续数据访问的向量化,减少LDS的访问次数,降低访存耗时,由此提高程序访存效率。在此基础上,通过设计访存特征的判断方法,提出能够有效解决数据重叠的LDS访存向量化方法,实现一种面向国产通用加速器的LDS高效访存技术,确保向量化方法对访存效率的有效提升。实验结果表明:在使用LDS的异构程序中,LDS访存向量化实现后程序性能平均提升了22.6%,验证了所提方法的有效性;同时,向量化方法能够实现LDS线程间访存数据重叠问题的优化,使异构程序得到平均30%的性能提升。 展开更多
关键词 深度计算器 本地数据共享 访存向量化 访存特征 bank冲突
下载PDF
面向DCU非一致控制流的编译优化 被引量:2
6
作者 杨小艺 赵荣彩 +2 位作者 王洪生 韩林 徐坤坤 《计算机应用》 CSCD 北大核心 2023年第10期3170-3177,共8页
国产DCU采用单指令多线程(SIMT)的并行执行模型,在程序执行时核函数内会产生非一致控制流,导致线程束中的线程部分只能串行执行,即线程束分化。针对核函数的性能因线程束分化受到严重制约的问题,提出一种减少线程束分化时间的编译优化... 国产DCU采用单指令多线程(SIMT)的并行执行模型,在程序执行时核函数内会产生非一致控制流,导致线程束中的线程部分只能串行执行,即线程束分化。针对核函数的性能因线程束分化受到严重制约的问题,提出一种减少线程束分化时间的编译优化方法——部分控制流合并(PCFM)。首先,通过散度分析找到同构且含有大量相同指令和相似指令的可融合发散区域;其次,统计合并后节省的指令周期百分比,从而评估可融合发散区域的融合盈利;最后,查找对齐序列,并合并有收益的可融合发散区域。在DCU上使用PCFM测试从图形处理器(GPU)基准测试套件Rodinia和经典的排序算法中选择的测试用例,实验结果表明,PCFM对测试用例能够取得1.146的平均加速比,与分支融合+尾合并方法相比,使用PCFM的加速比平均提高了5.72%。可见,所提方法减少线程束分化的效果更好。 展开更多
关键词 dcu 单指令多线程 线程束分化 复杂控制流 编译优化
下载PDF
基于曙光CPU-DCU架构的市区噪声地图计算
7
作者 张天宇 李楠 +2 位作者 王祉涵 刘斌 冯涛 《智能计算机与应用》 2023年第3期16-24,共9页
为了应对城市交通噪声地图的频繁更新,实现大规模环境噪声地图的快速求解,提出了CPU-DCU并行计算方法,并使用“曙光”超级计算平台上的DCU加速卡进行内核计算。首先,设计了噪声计算数据文件,将GIS数据、噪声监测数据等多源异构数据储存... 为了应对城市交通噪声地图的频繁更新,实现大规模环境噪声地图的快速求解,提出了CPU-DCU并行计算方法,并使用“曙光”超级计算平台上的DCU加速卡进行内核计算。首先,设计了噪声计算数据文件,将GIS数据、噪声监测数据等多源异构数据储存为统一的噪声计算数据,通过定向包围盒等方法将建筑物进行几何简化,实现DCU算法优化。其次,针对“曙光”超级计算平台多DCU的优势,实现了在4张DCU加速卡上灵活分配计算任务,4块DCU加速卡对比单DCU加速卡并行效率达到88.2%。最后,对上述方法进行了正确性验证与性能测试,对比了不同计算规模下CPU与DCU的计算效率。结果表明,CPU-DCU并行计算方法能够应用在大规模环境噪声地图研究中,也验证了噪声地图求解在“曙光”超级计算平台系统上的可能性。 展开更多
关键词 噪声地图 噪声预测 并行加速 dcu加速器
下载PDF
含DCU控制的机器人车门开闭耐久试验方法研究
8
作者 陈海潮 程俊东 +2 位作者 刘明 许俊杰 朱文彬 《汽车零部件》 2023年第9期12-15,共4页
为了在车门开闭耐久试验中搭载验证车门电器件功能,基于LabVIEW编程语言和PC-CAN信号收发器,编制CAN报文收发程序,实现了在试验过程中对DCU(door control module)的控制。为了提升试验精度,开发出能使机器人在高低温环境下长期运行的混... 为了在车门开闭耐久试验中搭载验证车门电器件功能,基于LabVIEW编程语言和PC-CAN信号收发器,编制CAN报文收发程序,实现了在试验过程中对DCU(door control module)的控制。为了提升试验精度,开发出能使机器人在高低温环境下长期运行的混合护甲及工装,结合报文控制和机器人控制,探索出基于机器人的含DCU控制的车门开闭耐久试验台架及试验方法。 展开更多
关键词 机器人 dcu 无框玻璃 隐藏把手 LABVIEW
下载PDF
柴油机选择催化还原系统的DCU控制研究 被引量:2
9
作者 刘军 李敏 秦国振 《汽车技术》 北大核心 2013年第1期12-14,19,共4页
简述选择性催化还原系统的工作原理,并着重对其电子控制单元DCU的控制策略进行研究。该控制策略是通过试验得到某柴油机原机排放相关数据,并利用网格节点插值计算方法将相关数据存储到DCU单元中,然后根据物理化学反应计算出尿素溶液的... 简述选择性催化还原系统的工作原理,并着重对其电子控制单元DCU的控制策略进行研究。该控制策略是通过试验得到某柴油机原机排放相关数据,并利用网格节点插值计算方法将相关数据存储到DCU单元中,然后根据物理化学反应计算出尿素溶液的基本需求量,同时用试验得到的NOx转化率MAP图和修正系数MAP图对尿素溶液的需求量进行稳态修正和瞬态修正。试验表明,该DCU控制策略能够控制NOx排放满足法规要求。 展开更多
关键词 柴油机 选择性催化还原系统 dcu 控制策略
下载PDF
地铁车辆DCU牵引控制单元测试装置 被引量:3
10
作者 陈明可 吴德义 李晓威 《电力机车与城轨车辆》 2010年第5期47-49,共3页
根据广州地铁一号线车辆DCU牵引控制单元检修、测试、培训等方面的需求,提出一种新的解决方案,并且利用广州地铁现有的备件和技术力量,成功实现方案所要求的测试装置。
关键词 dcu 牵引控制器 测试装置
下载PDF
柴油机SCR系统中DCU的研发 被引量:1
11
作者 刘军 熊明路 +2 位作者 聂斐 蔡骏宇 陶昌岭 《内燃机工程》 EI CAS CSCD 北大核心 2016年第5期80-85,共6页
简述尿素喷射控制单元(dosing control unit,DCU)的基本工作原理,对DCU的电源模块、信号输入调理模块、输出功率驱动模块、CAN通讯模块等硬件电路进行设计;并对DCU中的尿素喷射量、计量泵状态、车载诊断系统(OBD)等控制策略进行了深入研... 简述尿素喷射控制单元(dosing control unit,DCU)的基本工作原理,对DCU的电源模块、信号输入调理模块、输出功率驱动模块、CAN通讯模块等硬件电路进行设计;并对DCU中的尿素喷射量、计量泵状态、车载诊断系统(OBD)等控制策略进行了深入研究;最后将自主开发的DCU与整个选择性催化还原(SCR)系统连接,在发动机台架上进行了欧洲稳态循环(ESC)、欧洲瞬态循环(ETC)及OBD故障诊断试验。试验结果表明:所开发的DCU能较好的控制SCR系统,使柴油机的排放达到国Ⅳ标准,并且可以对SCR系统进行实时故障诊断。 展开更多
关键词 内燃机 选择性催化还原系统 尿素喷射控制单元 车载诊断系统 控制策略 开发
下载PDF
用于DCU仿真测试的压控恒流源研究
12
作者 刘伟良 李小文 +1 位作者 苏理 刘丽君 《机车电传动》 北大核心 2015年第1期91-94,共4页
针对DCU仿真测试的应用需求,研究了一种基于运算放大器的压控恒流源电路,从理论计算和仿真分析的角度阐述了方案的可行性。通过试验验证,该电路的各项功能、性能指标均达标,实际应用效果良好。
关键词 dcu 仿真测试 压控恒流源 运算放大器 瞬态响应 环路增益
下载PDF
Lampsite与DCU联合解决4G网络室内覆盖方案探索 被引量:2
13
作者 王清轶 《信息通信》 2018年第8期192-196,共5页
数据显示70%的业务量、90%的数据业务发生在室内,高价值商务客户80%的工作时间都位于室内,20%的室内覆盖未来将为运营商带来80%的收益,室内覆盖的重要性自然不言而喻。如何做好室内覆盖,就成为未来的重中之重。近年来,由于室内覆盖容量... 数据显示70%的业务量、90%的数据业务发生在室内,高价值商务客户80%的工作时间都位于室内,20%的室内覆盖未来将为运营商带来80%的收益,室内覆盖的重要性自然不言而喻。如何做好室内覆盖,就成为未来的重中之重。近年来,由于室内覆盖容量需求不断增加,LampSite解决方案应运而生。采用该方案能针对室内无线场景建立微微站覆盖布局,解决宏基站对室内覆盖不足,同时吸纳室内用户容量。 展开更多
关键词 室内覆盖 Lampsite dcu 合路
下载PDF
有高效改进式有轨交通安全门DCU模块
14
《科技资讯》 2016年第3期191-191,共1页
该实用新型提供一种有高效改进式有轨交通安全门DCU模块,包括从动轮和驱动轮、驱动控制器、CAN总线、第一电机、第二电机、第一电机控制器、第二电机控制器、第一电池、第二电池、大齿轮及离合器,监测部件内部设置有电压检测模块、继电... 该实用新型提供一种有高效改进式有轨交通安全门DCU模块,包括从动轮和驱动轮、驱动控制器、CAN总线、第一电机、第二电机、第一电机控制器、第二电机控制器、第一电池、第二电池、大齿轮及离合器,监测部件内部设置有电压检测模块、继电器输出电路及串行通信单元,电压检测模块和串行通信单元均与继电器输出电路电路连接,继电器输出电路与总控装置电路连接;监测部件与报警单元电路连接,所述报警单元内部设置有蜂鸣器、门信息监测电路及单片机监测电路,所述蜂鸣器和所述单片机监测电路均与所述门信息监测电路电连接,所述门信息监测电路与所述继电器输出电路电路连接。 展开更多
关键词 继电器输出 交通安全 dcu 信息监测 内部设置 电机控制器 通信单元 述报 驱动控制器 实用新型
下载PDF
DCu200型宫内节育器改良前后节育效果比较
15
作者 刘平 张玉森 《河北医药》 CAS 1995年第6期342-343,共2页
DCu200型宫内节育器改良前后节育效果比较066002秦皇岛港务局港口医院刘平,张玉森宫内节育器(IUD)是一种调节生育的重要措施,也是一种安全、有效、简便的避孕工具,目前节育器已成为我国妇女普遍使用的节育工具之一... DCu200型宫内节育器改良前后节育效果比较066002秦皇岛港务局港口医院刘平,张玉森宫内节育器(IUD)是一种调节生育的重要措施,也是一种安全、有效、简便的避孕工具,目前节育器已成为我国妇女普遍使用的节育工具之一。我院自1991年以来采用开放式钢... 展开更多
关键词 宫内节育器 dcu200型
下载PDF
软件测试工作量估算方法在DCU测试中的应用
16
作者 陈明奎 段静 《电子世界》 2017年第22期114-116,共3页
DCU是列车牵引系统核心控制部件,在列车正式上线运行前,需对DCU软件进行充分测试。软件测试工作量的估算对于DCU测试工程化管理至关重要,为此,本文对目前较为常见的DCU工作量测试估算方法进行介绍,提出提高估算准确度的计算方法优化策略... DCU是列车牵引系统核心控制部件,在列车正式上线运行前,需对DCU软件进行充分测试。软件测试工作量的估算对于DCU测试工程化管理至关重要,为此,本文对目前较为常见的DCU工作量测试估算方法进行介绍,提出提高估算准确度的计算方法优化策略,以某DCU测试项目为实际操作用例,进行项目统计、测试设计,和估计值与实际值之间的偏差结果分析,探讨软件测试工作量估算方法在DCU测试中的应用方法。 展开更多
关键词 dcu测试 软件测试 工作量估算 估算方法
下载PDF
DSU、DCU、BA-Ⅰ系列ATSE智能控制器
17
作者 向平 《电力系统装备》 2004年第2期47-47,共1页
所有的电源自动转换开关装置(ATSE)都由两部分组成,即转换电源的开关装置和控制转换的控制单元。上海梅兰日兰电器有限公司根据市场需求,研制生产了DSU、DCU、BA-Ⅰ系列ATSE智能控制器。其中DSU型用于控制由单线圈或双线圈组成的两... 所有的电源自动转换开关装置(ATSE)都由两部分组成,即转换电源的开关装置和控制转换的控制单元。上海梅兰日兰电器有限公司根据市场需求,研制生产了DSU、DCU、BA-Ⅰ系列ATSE智能控制器。其中DSU型用于控制由单线圈或双线圈组成的两位置ATSE,不具有缺相、欠压转换功能; 展开更多
关键词 DSU dcu BA-Ⅰ系列ATSE智能控制器 电磁干扰 电源自动转换开关装置 上海梅兰日兰电器有限公司
下载PDF
基于TCP的DCU实时波形监视系统 被引量:1
18
作者 陈俊波 戴计生 +2 位作者 罗凌波 李程 李益 《大功率变流技术》 2015年第6期60-63,共4页
介绍了应用于轨道交通的传动控制单元(DCU)实时波形监视系统的设计思路及系统组成。根据实际的需求,该系统采用TCP通信,实时显示并保存DCU运行过程中各种状态信息和控制信息;能帮助技术人员进行调试,且节省调试时间。
关键词 TCP通信 波形监视系统 传动控制单元
下载PDF
基于μC/OS-Ⅱ的机车DCU模拟板设计
19
作者 耿红伟 黎步银 《仪表技术与传感器》 CSCD 北大核心 2015年第10期43-45,74,共4页
针对韶山3型(SS3B)货运列车机车传动控制单元(DCU)模拟板存在的问题,从一定通用性、高稳定性、高性能3个方面出发,采用模块化的方法,提出了一种基于飞思卡尔平台的硬件和软件解决方案。系统硬件采用冗余电路设计,滤波设计,给出了硬件原... 针对韶山3型(SS3B)货运列车机车传动控制单元(DCU)模拟板存在的问题,从一定通用性、高稳定性、高性能3个方面出发,采用模块化的方法,提出了一种基于飞思卡尔平台的硬件和软件解决方案。系统硬件采用冗余电路设计,滤波设计,给出了硬件原理图。系统软件移植了实时操作系统μC/OS-Ⅱ,在此基础上编写了应用软件和新的滤波算法。多层设计的硬件结构,可靠的主控芯片以及实时操作系统,提高了系统运行的稳定性和实时性。实验调试表明各项功能符合设计要求。 展开更多
关键词 传动控制单元 冗余 飞思卡尔 实时操作系统 可靠性
下载PDF
国产DCU加速卡与MPS方法结合高效模拟带障碍物溃坝流动问题
20
作者 黄聪祎 赵伟文 万德成 《水动力学研究与进展(A辑)》 CSCD 北大核心 2024年第2期187-195,共9页
移动粒子半隐式方法(Moving Particle Semi-implicit, MPS)因其拉格朗日特性而具有独特优势,尤其适合用于模拟具有自由表面大变形特征的强非线性问题。然而,邻居粒子搜索和压力泊松方程求解的高计算开销限制了该方法在大规模应用场景中... 移动粒子半隐式方法(Moving Particle Semi-implicit, MPS)因其拉格朗日特性而具有独特优势,尤其适合用于模拟具有自由表面大变形特征的强非线性问题。然而,邻居粒子搜索和压力泊松方程求解的高计算开销限制了该方法在大规模应用场景中的实用性。图形处理器(GPU)因其多核架构,非常适合用于并行模拟处理这种相似且大量的问题。该文将自主开发的基于GPU加速的MPS算法程序移植到基于HIP编程环境的国产自主类GPU平台DCU (Deep Computing Unit,深度计算单元)上运行,开发了MPSDCU-SJTU求解器。利用MPSDCU-SJTU模拟了三维溃坝流动,其模拟结果与已公开发表的实验结果吻合良好。进一步比较了DCU平台加速前后的计算时长,证明MPSDCU-SJTU求解器能显著提升MPS方法的计算效率。 展开更多
关键词 移动粒子半隐式方法(MPS) 自由表面流动 深度计算单元(dcu) 异构计算
原文传递
上一页 1 2 5 下一页 到第
使用帮助 返回顶部