期刊文献+
共找到239篇文章
< 1 2 12 >
每页显示 20 50 100
Towards efficient deep neural network training by FPGA-based batch-level parallelism 被引量:2
1
作者 Cheng Luo Man-Kit Sit +3 位作者 Hongxiang Fan Shuanglong Liu Wayne Luk Ce Guo 《Journal of Semiconductors》 EI CAS CSCD 2020年第2期51-62,共12页
Training deep neural networks(DNNs)requires a significant amount of time and resources to obtain acceptable results,which severely limits its deployment in resource-limited platforms.This paper proposes DarkFPGA,a nov... Training deep neural networks(DNNs)requires a significant amount of time and resources to obtain acceptable results,which severely limits its deployment in resource-limited platforms.This paper proposes DarkFPGA,a novel customizable framework to efficiently accelerate the entire DNN training on a single FPGA platform.First,we explore batch-level parallelism to enable efficient FPGA-based DNN training.Second,we devise a novel hardware architecture optimised by a batch-oriented data pattern and tiling techniques to effectively exploit parallelism.Moreover,an analytical model is developed to determine the optimal design parameters for the DarkFPGA accelerator with respect to a specific network specification and FPGA resource constraints.Our results show that the accelerator is able to perform about 10 times faster than CPU training and about a third of the energy consumption than GPU training using 8-bit integers for training VGG-like networks on the CIFAR dataset for the Maxeler MAX5 platform. 展开更多
关键词 deep neural network training FPGA batch-level parallelism
下载PDF
Research of 6-DOF Serial-Parallel Mechanism Platform for Stability Training of Legged-Walking Robot 被引量:1
2
作者 Wei-Guo Wu Wen-Qian Du 《Journal of Harbin Institute of Technology(New Series)》 EI CAS 2014年第2期75-82,共8页
The concept of legged-robot stability training with a training platform is proposed and a serial-parallel mechanism platform with 6 degrees of freedom is designed for this target. The designed platform is composed of ... The concept of legged-robot stability training with a training platform is proposed and a serial-parallel mechanism platform with 6 degrees of freedom is designed for this target. The designed platform is composed of 4-DOF parallel mechanism with spherical joints and prismatic pairs,and 2-DOF serial mechanism with prismatic pairs. With this design,the platform has advantages of low platform countertop,big workspace,high carrying capacity and high stiffness. On the basis of DOF analysis and computation of space mechanism,weight supporting auxiliary mechanism and raceways-balls supporting mechanism are designed,so as to improve the stiffness of designed large platform and payload capacity of servo motors. And then the whole structure design work of the platform is done. Meanwhile,this paper derives the analytical solutions of forward kinematics, inverse kinematics and inverse dynamics. The error analysis model of position and orientation is established. And then the simulation is done in ADAMS to ensure the correctness and feasibility of this design. 展开更多
关键词 6-DOF serial-parallel mechanism forward kinematics stability training legged-walking robot
下载PDF
“双线并行、五措并举”的高职学生党员培养路径创新研究
3
作者 李洪淼 谢淑玲 张利 《辽宁农业职业技术学院学报》 2024年第2期69-72,共4页
学生党员培养是高校党建工作的重要内容之一,党员培养质量关系着党和国家事业的发展。分析了高职学生党员培养的必要性及存在问题,提出了打造高职院校党务工作专业化队伍、创新“线上+线下”并行和“必修+选修”并重的党员培养方式、创... 学生党员培养是高校党建工作的重要内容之一,党员培养质量关系着党和国家事业的发展。分析了高职学生党员培养的必要性及存在问题,提出了打造高职院校党务工作专业化队伍、创新“线上+线下”并行和“必修+选修”并重的党员培养方式、创新“精选+情感培养”的入党动机教育方法、建立“1+1+1”三段式党员长效培养机制和构建“4+15”党员考核评价体系“五措并举”的学生党员培养创新路径,旨在提升新媒体时代高职学生党员培养质量。 展开更多
关键词 高职院校 学生党员培养 双线并行 五措并举
下载PDF
分布式训练系统及其优化算法综述
4
作者 王恩东 闫瑞栋 +1 位作者 郭振华 赵雅倩 《计算机学报》 EI CAS CSCD 北大核心 2024年第1期1-28,共28页
人工智能利用各种优化技术从海量训练样本中学习关键特征或知识以提高解的质量,这对训练方法提出了更高要求.然而,传统单机训练无法满足存储与计算性能等方面的需求.因此,利用多个计算节点协同的分布式训练系统成为热点研究方向之一.本... 人工智能利用各种优化技术从海量训练样本中学习关键特征或知识以提高解的质量,这对训练方法提出了更高要求.然而,传统单机训练无法满足存储与计算性能等方面的需求.因此,利用多个计算节点协同的分布式训练系统成为热点研究方向之一.本文首先阐述了单机训练面临的主要挑战.其次,分析了分布式训练系统亟需解决的三个关键问题.基于上述问题归纳了分布式训练系统的通用框架与四个核心组件.围绕各个组件涉及的技术,梳理了代表性研究成果.在此基础之上,总结了基于并行随机梯度下降算法的中心化与去中心化架构研究分支,并对各研究分支优化算法与应用进行综述.最后,提出了未来可能的研究方向. 展开更多
关键词 分布式训练系统 (去)中心化架构 中心化架构算法 (异)同步算法 并行随机梯度下降 收敛速率
下载PDF
临床医学硕士专业学位研究生人文素养培养模式探讨
5
作者 潘晓彤 邢晓明 +5 位作者 曹彩霞 钟丽娜 徐音飞 代黎明 孔越 孙茜 《中国继续医学教育》 2024年第7期25-28,共4页
现代“生理一心理一社会一环境”医学模式强调人文素养在医学研究生培养中的重要性,当前并轨培养模式下我国临床医学硕士专业学位研究生(专硕)培养存在人文课程设置欠合理、规培医院对人文素养的培养不够重视等问题。文章以青岛大学附... 现代“生理一心理一社会一环境”医学模式强调人文素养在医学研究生培养中的重要性,当前并轨培养模式下我国临床医学硕士专业学位研究生(专硕)培养存在人文课程设置欠合理、规培医院对人文素养的培养不够重视等问题。文章以青岛大学附属医院临床医学硕士专业学位研究生为研究对象,设计医学人文素养调查问卷探讨并轨培养模式下临床医学硕士专业学位研究生人文素养现状,构建医学院-医院-学科-专硕四位一体的人文素养培养模式,以提高临床医学硕士专业学位研究生的综合素养,从而更好地适应医学教育发展的趋势和要求。 展开更多
关键词 专业学位研究生 临床医学 并轨培养 住院医师规范化培训 人文素养 教学改革
下载PDF
基于伪触发词的并行预测篇章级事件抽取方法
6
作者 秦海涛 线岩团 +1 位作者 相艳 黄于欣 《电子技术应用》 2024年第4期67-74,共8页
篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能按照预定义的... 篇章级事件抽取一般将事件抽取任务分为候选实体识别、事件检测和论元识别3个子任务,然后采用级联的方式依次进行,这样的方式会造成误差传递;另外,现有的大多数模型在解码事件时,对事件数量的预测隐含在解码过程中,且只能按照预定义的事件顺序及预定义的角色顺序预测事件论元,使得先抽取的事件并没有考虑到后面抽取的事件。针对以上问题提出一种多任务联合的并行预测事件抽取框架。首先,使用预训练语言模型作为文档句子的编码器,检测文档中存在的事件类型,并使用结构化自注意力机制获取伪触发词特征,预测每种事件类型的事件数量;然后将伪触发词特征与候选论元特征进行交互,并行预测每个事件对应的事件论元,在大幅缩减模型训练时间的同时获得与基线模型相比更好的性能。最终事件抽取结果F1值为78%,事件类型检测子任务F1值为98.7%,事件数量预测子任务F1值为90.1%,实体识别子任务F1值为90.3%。 展开更多
关键词 篇章级事件抽取 多任务联合 预训练语言模型 结构化自注意力机制 并行预测
下载PDF
基于仿真实验的智能并行训练方法
7
作者 马春华 《指挥控制与仿真》 2024年第1期93-99,共7页
智能训练是利用机器学习算法对神经网络智能体模型进行训练优化的过程,智能体模型通过不断试错的训练方式实现智能提升。大规模训练数据是智能训练的必要条件,通常难以从现实世界中直接获取,如何通过仿真的方式生成大量有效的训练数据,... 智能训练是利用机器学习算法对神经网络智能体模型进行训练优化的过程,智能体模型通过不断试错的训练方式实现智能提升。大规模训练数据是智能训练的必要条件,通常难以从现实世界中直接获取,如何通过仿真的方式生成大量有效的训练数据,是智能训练的重要研究方向。对此提出一种基于仿真实验的智能并行训练方法,利用仿真实验管理可快速生成批量仿真实验想定,并支持节点自动部署和运行,通过合理的训练架构设计和有效训练流程设计实现智能并行训练。通过实际案例展示了智能训练的仿真实验管理过程,并结合训练效果证明了给出的方法提高了智能训练效率和智能体泛化性。 展开更多
关键词 强化学习 智能训练 并行训练 仿真实验
下载PDF
一种基于3-UU并联机构的腕关节康复机器人研制
8
作者 田培良 刘智飞 +2 位作者 王炜博 马晓宝 兰媛 《机械传动》 北大核心 2024年第4期162-171,共10页
在3-UU并联机构基础上研制腕关节康复机器人样机,辅助中风患者进行腕关节康复训练。回顾了3-UU机构演化过程和自由度,根据3-UU机构的约束关系和几何特性,采用球坐标法和滚动-俯仰-偏航(Roll-Pitch-Yaw,RPY)法分析机构逆运动学,得到机构... 在3-UU并联机构基础上研制腕关节康复机器人样机,辅助中风患者进行腕关节康复训练。回顾了3-UU机构演化过程和自由度,根据3-UU机构的约束关系和几何特性,采用球坐标法和滚动-俯仰-偏航(Roll-Pitch-Yaw,RPY)法分析机构逆运动学,得到机构平台和驱动的关系式;将研制的样机与经典的3-RRR腕关节康复机构进行对比,得出本机构不存在多解和奇异值等优点;对样机运动性能以及前臂两大肌群的肌电信号进行了测试。实验表明,该机构的最大横滚角度为-90°~90°,俯仰角度为-90°~90°,虚拟偏航角度为-180°~180°,最高能产生950 mV的肌电信号。上述结果表明,所研制的样机能满足腕关节运动需求,对前臂肌群进行训练。 展开更多
关键词 腕关节训练 并联机构 逆运动学 康复机器人
下载PDF
基于Seed-PCG法的列车-轨道-地基土三维随机振动GPU并行计算方法
9
作者 朱志辉 冯杨 +2 位作者 杨啸 李昊 邹有 《Journal of Central South University》 SCIE EI CAS CSCD 2024年第1期302-316,共15页
为了解决列车-轨道-地基土三维有限元模型随机多样本计算效率低的问题,本文提出了一种基于Seed-PCG法的高效并行计算方法。基于有限元法和虚拟激励法建立轨道不平顺激励下的三维列车-轨道-地基土耦合随机振动分析模型;针对车致地基土随... 为了解决列车-轨道-地基土三维有限元模型随机多样本计算效率低的问题,本文提出了一种基于Seed-PCG法的高效并行计算方法。基于有限元法和虚拟激励法建立轨道不平顺激励下的三维列车-轨道-地基土耦合随机振动分析模型;针对车致地基土随机振动分析产生的多右端项线性方程组求解问题,采用Seed-PCG方法进行求解。通过PCG方法求解种子系统得到的Krylov子空间进行投影,以改进其余线性方程组的初始解和对应的初始残量,有效提高了PCG法的收敛速度,最后,在MATLABCUDA混合平台上开发了并行计算程序。数值算例表明:相同计算平台下的该方法相比多点同步算法获得了104.2倍的加速;相比PCG法逐个求解方案减少了18%的迭代次数,获得了1.21倍的加速。 展开更多
关键词 Seed-PCG法 多右端项线性方程组 随机振动 GPU并行计算 列车-轨道-地基土耦合模型
下载PDF
Train energy simulation with locomotive adhesion model
10
作者 Qing Wu Maksym Spiryagin Colin Cole 《Railway Engineering Science》 2020年第1期75-84,共10页
Railway train energy simulation is an important and popular research topic.Locomotive traction force simulations are a fundamental part of such research.Conventional energy calculation models are not able to consider ... Railway train energy simulation is an important and popular research topic.Locomotive traction force simulations are a fundamental part of such research.Conventional energy calculation models are not able to consider locomotive wheel-rail adhesions,traction adhesion control,and locomotive dynamics.This paper has developed two models to fill this research gap.The first model uses a 2D locomotive model with 27 degrees of freedom and a simplified wheel-rail contact model.The second model uses a 3D locomotive model with 54 degrees of freedom and a fully detailed wheel-rail contact model.Both models were integrated into a longitudinal train dynamics model with the consideration of locomotive adhesion control.Energy consumption simulations using a conventional model(1D model)and the two new models(2D and 3D models)were conducted and compared.The results show that,due to the consideration of wheel-rail adhesion model and traction control in the 3D model,it reports less energy consumption than the 1D model.The maximum difference in energy consumption rate between the 3D model and the 1D model was 12.5%.Due to the consideration of multiple wheel-rail contact points in the 3D model,it reports higher energy consumption than the 2D model.An 8.6%maximum difference in energy consumption rate between the 3D model and the 1D model was reported during curve negotiation. 展开更多
关键词 Energy consumption ADHESION MODEL TRACTION control Longitudinal train dynamics parallel CO-SIMULATION
下载PDF
索驱动机构在航天工程领域的应用综述 被引量:1
11
作者 唐晓强 王禹衡 +2 位作者 侯森浩 黄伟 隋毅 《实验技术与管理》 CAS 北大核心 2023年第1期1-14,共14页
索驱动机构相比于刚性机构有着工作空间大、较高的载荷质量比、易于重新布置等诸多优势,近年来成为机器人学研究的一个热点,其在天文观测、物流搬运、康复医疗和航天工程等诸多领域得到了广泛的应用。该文将集中介绍索驱动机构在航天工... 索驱动机构相比于刚性机构有着工作空间大、较高的载荷质量比、易于重新布置等诸多优势,近年来成为机器人学研究的一个热点,其在天文观测、物流搬运、康复医疗和航天工程等诸多领域得到了广泛的应用。该文将集中介绍索驱动机构在航天工程领域的各类应用,从针对航天器的应用和针对宇航员的应用两方面进行详细的介绍。最后,给出了索驱动机构未来在航天工程领域应用的展望。 展开更多
关键词 索驱动机构 索驱动并联机器人 航天工程 重力卸载 航天员训练
下载PDF
研究生课程“并行算法”教学内容优化设计研究
12
作者 吴建平 银福康 +2 位作者 杨锦辉 彭军 汪祥 《教育教学论坛》 2023年第8期75-78,共4页
研究生课程“并行算法”是在大规模科学与工程计算需求越来越大的情况下开设的,旨在让学生学会如何实现并行计算的方法,熟练掌握并行计算的实现过程。基于课程教学经验和实践,论述了侧重并行计算思维训练和理论实践相结合的教学理念,以... 研究生课程“并行算法”是在大规模科学与工程计算需求越来越大的情况下开设的,旨在让学生学会如何实现并行计算的方法,熟练掌握并行计算的实现过程。基于课程教学经验和实践,论述了侧重并行计算思维训练和理论实践相结合的教学理念,以及基于该理念与模块化方式,从基本概念、基本技术、具体算法到编程实践等层面对教学内容的优化设计,以提升学生的学习效果与综合素质。 展开更多
关键词 教学内容 模块化 并行算法 思维训练 综合素质
下载PDF
并列相邻桥梁气动干扰对车桥耦合振动的影响研究
13
作者 郭向荣 肖一凡 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2023年第10期3831-3840,共10页
公铁两用桥梁主要有公铁合建和公铁分建双梁2种形式,公铁分建形式以安全隐患小、运营维护方便的原因被广泛应用。采用公铁分建形式时,并列相邻桥梁之间的气动干扰导致其周围流场与单铁路桥梁周围流场不同,横风作用下车桥耦合振动响应也... 公铁两用桥梁主要有公铁合建和公铁分建双梁2种形式,公铁分建形式以安全隐患小、运营维护方便的原因被广泛应用。采用公铁分建形式时,并列相邻桥梁之间的气动干扰导致其周围流场与单铁路桥梁周围流场不同,横风作用下车桥耦合振动响应也较单铁路桥梁不同。为研究并列相邻桥梁气动干扰对车桥耦合振动的影响,以某公铁分建形式斜拉桥为研究对象,通过数值模拟获得并列主梁和单主梁下的车桥系统三分力系数,进行风洞试验并验证了数值模拟的合理性和准确性,根据弹性系统动力学总势能不变值原理对并列主梁和单主梁形式分别建立风-车-桥耦合振动仿真计算与分析模型,计算了2种形式下车桥耦合振动响应。研究结果表明:铁路梁位于背风侧时,与单铁路梁相比,铁路梁阻力系数减小,升力系数与扭矩系数增大,列车阻力系数及扭矩系数增大,升力系数减小,列车通过桥梁时的桥梁横向位移及列车动力响应显著增大,桥梁竖向位移基本不变;铁路梁位于迎风侧时,与单铁路梁相比,桥梁与列车三分力系数变化不明显,列车通过桥梁时的桥梁与列车动力响应变化不大。铁路梁位于背风侧且环境风速越大时,并列桥梁的气动干扰效应对车桥耦合振动动力响应的影响不容忽略。 展开更多
关键词 并列桥梁 斜拉桥 数值模拟 耦合振动 动力响应
下载PDF
考虑舒适性的自动驾驶轨道列车牵引电机节能控制
14
作者 高熙贺 《机械与电子》 2023年第10期29-34,38,共7页
为提升乘客在自动驾驶轨道列车中的体验感,保证自动驾驶轨道列车的安全运行,提出考虑舒适性的自动驾驶轨道列车牵引电机节能控制技术。构建自动驾驶轨道列车运动学模型,分析牵引和制动电机能耗。依据分析结果建立列车牵引电机节能控制... 为提升乘客在自动驾驶轨道列车中的体验感,保证自动驾驶轨道列车的安全运行,提出考虑舒适性的自动驾驶轨道列车牵引电机节能控制技术。构建自动驾驶轨道列车运动学模型,分析牵引和制动电机能耗。依据分析结果建立列车牵引电机节能控制目标函数,并以行驶速度、舒适性、准时性和精确停车设置约束条件。利用混沌算法和蛙跳算法改进标准差分进化算法求解目标函数,获取最优解,实现自动驾驶轨道列车牵引电机节能控制。实验结果表明,所提方法在预期速度跟踪性能、节能性、舒适性、精准停车和准点中表现更为优异,验证了所提方法应用下的自动驾驶轨道列车在满足乘客舒适性要求的基础上,获取了较好的牵引电机节能控制效果。 展开更多
关键词 牵引电机 自动驾驶轨道列车 节能控制 运动学模型 混合差分进化算法
下载PDF
问答ChatGPT之后:超大预训练模型的机遇和挑战 被引量:25
15
作者 卢经纬 郭超 +4 位作者 戴星原 缪青海 王兴霞 杨静 王飞跃 《自动化学报》 EI CAS CSCD 北大核心 2023年第4期705-717,共13页
超大预训练模型(Pre-trained model,PTM)是人工智能领域近年来迅速崛起的研究方向,在自然语言处理(Natural language processing,NLP)和计算机视觉等多种任务中达到了有史以来的最佳性能,促进了人工智能生成内容(Artificial intelligenc... 超大预训练模型(Pre-trained model,PTM)是人工智能领域近年来迅速崛起的研究方向,在自然语言处理(Natural language processing,NLP)和计算机视觉等多种任务中达到了有史以来的最佳性能,促进了人工智能生成内容(Artificial intelligence-generated content,AIGC)的发展和落地.ChatGPT作为当下最火热的PTM,更是以优异的表现获得各界的广泛关注.本文围绕ChatGPT展开.首先概括PTM的基本思想并对其发展历程进行梳理;接着,详细探讨ChatGPT的技术细节,并以平行智能的视角阐述ChatGPT;最后,从技术、范式以及应用等多个方面对PTM的发展趋势进行展望. 展开更多
关键词 预训练模型 ChatGPT TRANSFORMER 人工智能生成内容 平行智能 社会化大闭环
下载PDF
面向执行-学习者的在线强化学习并行训练方法 被引量:2
16
作者 孙正伦 乔鹏 +2 位作者 窦勇 李青青 李荣春 《计算机学报》 EI CAS CSCD 北大核心 2023年第2期229-243,共15页
近年来,深度强化学习(Deep Reinforcement Learning,DRL)已经成为了人工智能领域中的研究热点.为了加速DRL训练,人们提出了分布式强化学习方法用于提升训练速度.目前分布式强化学习可以分为同策略方法、异策略方法以及最新的近同策略方... 近年来,深度强化学习(Deep Reinforcement Learning,DRL)已经成为了人工智能领域中的研究热点.为了加速DRL训练,人们提出了分布式强化学习方法用于提升训练速度.目前分布式强化学习可以分为同策略方法、异策略方法以及最新的近同策略方法.近同策略方法改善了同策略方法和异策略方法的问题,但是由于其共享内存并行模型的限制,近同策略模型难以扩展到以网络互连的计算集群上,低可扩展性限制了近同策略方法能够利用的资源数量,增加了计算节点的负载,最终导致训练耗时增加.为了提升近同策略方法的可扩展性,提升收敛速度,本文提出了一种以消息传递为基础,使用Gossip算法与模型融合方法的并行执行者-学习者训练框架(Parallel Actor-Learner Architecture,PALA),这一方法通过增强训练的并行性和可扩展性来提升收敛速度.首先,该框架以Gossip算法作为通信基础,借助全局数据代理并使用消息传递模型创建了一套可扩展的多个并行单智能体训练方法.其次,为了保证探索-利用的同策略性,维持训练稳定,本文创建了一套可以用于多机之间进行隐式同步的进程锁.其次,本文面向含有CUDA张量的模型数据,提出了一种序列化方法,以保证模型数据能够通过节点间网络传递、聚合.最后,本文使用模型聚合方法对训练进行加速.基于上述优化和改进,PALA训练方法能够将负载均衡地映射到整个计算集群上,减少由于高负载而造成的长等待时间,提升收敛速度.实验表明,相较于之前使用共享内存模式的方法,PALA训练的智能体在达到相同水平时,训练时间缩减了20%以上,同时,PALA还有着较好的可扩展性,PALA可以扩展的硬件资源数量是原有方法的6倍以上.与其他方法相对比,PALA训练的智能体最终策略在几乎所有测试环境中达到了最优水平. 展开更多
关键词 Gossip算法 强化学习 同策略学习 分布式强化学习 并行训练方法
下载PDF
PointMLP-FD:基于多级自适应下采样的点云分类模型 被引量:1
17
作者 梁奥 李峙含 花海洋 《图学学报》 CSCD 北大核心 2023年第1期112-119,共8页
针对受硬件条件、物体遮挡和背景杂波等客观因素的影响,传感器采集的目标点云具有较强的稀疏性和密度不均匀性,导致分类模型对点云特征的学习效率低、分类泛化能力差的问题,提出了一种基于多级自适应下采样的点云分类模型PointMLP-FD。... 针对受硬件条件、物体遮挡和背景杂波等客观因素的影响,传感器采集的目标点云具有较强的稀疏性和密度不均匀性,导致分类模型对点云特征的学习效率低、分类泛化能力差的问题,提出了一种基于多级自适应下采样的点云分类模型PointMLP-FD。该模型设计了多个MLP模块作为网络分支,以点云的浅层特征为输入得到每个点云类别维度上的特征表达,之后再根据特征表达进行排序,选择具有更强语义特征的点构成下采样点集。通过过滤背景和与目标相关性低的信息来自适应保留反应目标本质特征的信息。最后分别计算分支网络的损失,与骨干网络并行训练来优化点云特征,减少模型参数。该方法在ScanObjectNN数据集上进行测试,结果表明相较于PointMLP-elite分类精度更高,mAcc提升1%,OA提升0.8%,以更少的参数量接近SOTA模型的性能。 展开更多
关键词 点云分类 自适应 下采样 并行训练 真实环境
下载PDF
东平水道特大桥并联混合式减振方案研究
18
作者 郑成成 陈永祁 +3 位作者 郑久建 欧阳辉来 马良喆 陈刚 《铁道学报》 EI CAS CSCD 北大核心 2023年第11期173-180,共8页
为增强桥梁结构的抗震能力和耐久性,针对大跨度铁路桥梁车致振动及地震响应的动力特点,以东平水道特大桥为工程背景,提出一种并联混合式减振方案,研究黏滞阻尼器对纵向滑移体系桥梁地震响应的控制效果,分析不同控制体系对列车荷载引起... 为增强桥梁结构的抗震能力和耐久性,针对大跨度铁路桥梁车致振动及地震响应的动力特点,以东平水道特大桥为工程背景,提出一种并联混合式减振方案,研究黏滞阻尼器对纵向滑移体系桥梁地震响应的控制效果,分析不同控制体系对列车荷载引起结构响应的影响。研究结果表明,黏滞阻尼器能显著减小大跨度铁路桥的地震结构位移和内力响应;泄压阀锁定装置对列车制动力和行车荷载的抑振能力优于黏滞阻尼器;当黏滞阻尼器和泄压阀锁定装置协同工作时,在降低二者出力值的同时可实现对列车荷载更好的控制效果,由于传力路径的改变,控制后的墩底剪力和弯矩均有所增大,但锁定装置的增大效应更小。 展开更多
关键词 铁路桥 地震 列车荷载 并联设置 减振
下载PDF
基于FPGA加速的低功耗的MobileNetV2 网络识别系统 被引量:1
19
作者 孙小坚 林瑞全 +1 位作者 方子卿 马驰 《计算机测量与控制》 2023年第5期221-227,234,共8页
近年来,卷积神经网络由于其出色的性能被广泛应用在各个领域,如图像识别、语音识别与翻译和自动驾驶等;但是传统卷积神经网络(CNN,convolutional neural network)存在参数多,计算量大,部署在CPU与GPU上推理速度慢、功耗大的问题;针对上... 近年来,卷积神经网络由于其出色的性能被广泛应用在各个领域,如图像识别、语音识别与翻译和自动驾驶等;但是传统卷积神经网络(CNN,convolutional neural network)存在参数多,计算量大,部署在CPU与GPU上推理速度慢、功耗大的问题;针对上述问题,采用量化感知训练(QAT,quantization aware training)的方式在保证图像分类准确率的前提下,将网络参数总量压缩为原网络的1/4;将网络权重全部部署在FPGA的片内资源上,克服了片外存储带宽的限制,减少了访问片外存储资源带来的功耗;在MobileNetV2网络的层内以及相邻的点卷积层之间提出一种协同配合的流水线结构,极大地提高了网络的实时性;提出一种存储器与数据读取的优化策略,根据并行度调整数据的存储排列方式及读取顺序,进一步节约了片内BRAM资源。最终在Xilinx的Virtex-7 VC707开发板上实现了一套性能优、功耗小的轻量级卷积神经网络MobileNetV2识别系统,200 MHz时钟下达到了170.06 GOP/s的吞吐量,功耗仅为6.13 W,能耗比达到了27.74 GOP/s/W,是CPU的92倍,GPU的25倍,性能较其他实现有明显的优势。 展开更多
关键词 硬件加速 量化感知训练 MobileNet 并行计算 流水线结构
下载PDF
基于GPU的列车卫星定位接收机捕获引擎设计
20
作者 黄颂 巴晓辉 +2 位作者 蔡伯根 姜维 王剑 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2023年第8期3093-3104,共12页
下一代列控系统中提出了应用卫星导航提供位置服务的需求,相应的卫星导航硬件接收机价格高昂,不能兼具场景测试的灵活性和设备的便携性。传统软件接收机可根据需求更改基带算法,灵活性高,但由于串行捕获的原因导致其耗时较长,影响用户... 下一代列控系统中提出了应用卫星导航提供位置服务的需求,相应的卫星导航硬件接收机价格高昂,不能兼具场景测试的灵活性和设备的便携性。传统软件接收机可根据需求更改基带算法,灵活性高,但由于串行捕获的原因导致其耗时较长,影响用户首次定位的时间。本文针对铁路沿线开阔和存在遮挡的强弱卫星信号场景,设计了基于GPU的双模捕获引擎,分析了信号捕获速度以及灵敏度。首先,介绍了基于FFT的并行码相位捕获算法;其次,利用GPU与CPU异构并行计算平台,设计了强弱信号的并行捕获架构;然后,对捕获的各个模块进行并行性设计,通过对载波多普勒、多颗星并行实现强星的搜索,对于弱信号捕获,提出一种间断性补偿码多普勒的全比特法来提高捕获速度。最后,使用现场轨道坐标测量数据仿真生成了不同载噪比的中频数据来验证并行捕获的正确性,并对捕获耗时、灵敏度进行了分析与对比。仿真结果表明:5 MHz采样率下,冷启动搜索12颗GPS/BDS强星信号只需32.5 ms;对25 dBHz的弱信号,GPS与BDS的捕获概率分别达到90%和80%,捕获时间减少了29.3%,在保证灵敏度的同提升了捕获速度。对2种铁路场景设计了相应的并行捕获架构,在铁路沿线捕获强弱卫星信号的同时能够降低列车首次定位时间,为列车专用软件接收机捕获引擎的设计提供了参考。 展开更多
关键词 列车定位 双模软件接收机 捕获 CUDA 并行计算
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部