期刊文献+
共找到3,811篇文章
< 1 2 191 >
每页显示 20 50 100
面向检验试车的涡扇发动机多目标性能优化
1
作者 魏博飞 王玉婷 +4 位作者 郭泽轩 刘峰 席锋 司书宾 蔡志强 《西北工业大学学报》 EI CAS CSCD 北大核心 2024年第5期847-856,共10页
涡扇发动机因其高推进效率、低燃油消耗率等特点广泛应用于军民用飞机,其性能直接影响飞行任务的安全与稳定。针对涡扇发动机不同状态下涡轮前温度与高压转速比指标进行性能优化,从而提高其一次检验试车通过率,具有重要现实意义。提出... 涡扇发动机因其高推进效率、低燃油消耗率等特点广泛应用于军民用飞机,其性能直接影响飞行任务的安全与稳定。针对涡扇发动机不同状态下涡轮前温度与高压转速比指标进行性能优化,从而提高其一次检验试车通过率,具有重要现实意义。提出涡扇发动机的多目标性能优化框架,在某型号涡扇发动机历史生产数据集上,以检验试车过程中不同状态下涡轮前温度与高压转速比为目标变量,以某面积a、某面积b、某角度c为属性变量,建立涡扇发动机多目标性能模型并与目前主流算法模型对比验证,最后结合通过检验试车的后验概率推理与状态组合全局搜索,给出推荐状态组合表,辅助企业制定零部件生产制造装配标准,从而优化涡扇发动机性能、减少重新装配次数并提高一次检验试车通过率。 展开更多
关键词 树增强贝叶斯网络 性能优化框架 涡扇发动机 多目标性能优化
下载PDF
基于多绘制管线的大规模并行体绘制性能优化技术
2
作者 王华维 刘若妍 +1 位作者 艾志玮 曹轶 《计算机工程》 CAS CSCD 北大核心 2024年第8期207-215,共9页
针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担... 针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担体绘制任务,从而引起了采样数据并行通信的可扩展性瓶颈。为充分利用国产自主CPU高性能计算机来高效完成体绘制任务,针对大规模并行体绘制提出一种基于多绘制管线的性能优化技术,通过多管线、多进程的两级并行模式来降低单条管线的并行规模。在大规模并行体绘制中,该技术将绘制目标图像划分成多个子区域,绘制进程则相应分组,每个进程组独立执行一条绘制管线,以完成图像相应子区域的绘制,最后再收集所有的图像子区域,形成完整图像并输出。实验结果表明,优化后的体绘制算法在国产自主CPU高性能计算机上可以扩展到万核规模,并能有效完成体绘制任务。 展开更多
关键词 体绘制 多管线 两级并行 并行可扩展性 性能优化
下载PDF
运用米勒循环与生物柴油对柴油机性能优化分析
3
作者 胡玲玲 辛华健 +4 位作者 李晓萍 胡杰 姜峰 曹文通 周俊明 《广西科技大学学报》 CAS 2024年第2期9-16,共8页
本文基于GT-Power软件,对比分析了B20生物柴油在1000 r/min转速、2种负荷工况(100%和50%)下的2种米勒循环最佳方案,找到关于动力、经济、排放性能最佳的进气门提前关闭角;再基于米勒循环方案,对其性能进行了优化和分析,得出了B20生物柴... 本文基于GT-Power软件,对比分析了B20生物柴油在1000 r/min转速、2种负荷工况(100%和50%)下的2种米勒循环最佳方案,找到关于动力、经济、排放性能最佳的进气门提前关闭角;再基于米勒循环方案,对其性能进行了优化和分析,得出了B20生物柴油发动机在2种工况下功率、油耗、soot排放与NOx排放最佳性能的进气正时方案。结果表明:变气门重叠角米勒循环在整体性能方面优于变凸轮型线米勒循环,变气门重叠角米勒循环燃用B20生物柴油在2种不同负荷工况下,当处于进气门提前关闭角30℃A时功率性能最佳,并且通过模型优化后2种工况分别在进气门正时179.0℃aA和排气门正时174.0℃aA、进气门正时224.5℃aA和排气门正时119.0℃aA区域内有功率极大值;同理,油耗、soot与NOx排放也同样存在相对应的最佳进气门提前关闭角与优化后相对应的区域。 展开更多
关键词 生物柴油 机车柴油机 米勒循环 性能优化
下载PDF
基于模糊分析的船用柴油机燃用生物柴油性能优化
4
作者 李品芳 杨晨曦 +4 位作者 张佩存 才正 叶子枭 范金宇 黄加亮 《舰船科学技术》 北大核心 2024年第21期76-80,共5页
为优化生物柴油/柴油船用发动机的综合性能,利用AVL-Fire软件构建混合燃料发动机燃烧室模型,将仿真值与台架试验值进行对比验证其准确性,并通过燃用不同比例的生物柴油确立其最佳掺混比;最后,采用正交试验设计安排5个发动机运行参数进... 为优化生物柴油/柴油船用发动机的综合性能,利用AVL-Fire软件构建混合燃料发动机燃烧室模型,将仿真值与台架试验值进行对比验证其准确性,并通过燃用不同比例的生物柴油确立其最佳掺混比;最后,采用正交试验设计安排5个发动机运行参数进行多参数优化匹配,将NO排放量和指示功率作为评价指标,权重分别设置为0.6和0.4,对试验结果进行模糊数学分析。结果表明:对发动机性能影响大小顺序为EGR率(a_(1))、进气压力(a_(2))、进气温度(a_(3))、喷油提前角(a_(4))、喷油孔直径(a_(5));最优参数组合为:生物柴油掺混比30%、a_(1)=12.5%、a_(2)=0.173MPa、a_(3)=315.15K、a_(4)=18.6°CA、a_(5)=0.32mm,该组指示功率为52.7kW与原机55kW相比略低,NO排放量为5.37×10^(-5)%相比于原机8.5×10^(4)%降低了94.7%。该方法可以在保证发动机动力性的前提下,大幅降低NO排放量。 展开更多
关键词 船用柴油机 生物柴油 模糊分析 正交试验设计 性能优化
下载PDF
有机工质向心透平气动设计与性能优化研究
5
作者 卢绪祥 宋增 +2 位作者 刘瑞 丁海霞 李逸轩 《动力工程学报》 CAS CSCD 北大核心 2024年第8期1181-1188,共8页
为提升有机工质向心透平的效率与性能,对400 kW有机工质向心透平进行了一维气动设计。在一维气动设计结果的基础上进行建模,并结合三维数值模拟预测了有机工质向心透平在设计工况下的性能。以向心透平等熵效率为目标,采用均匀试验法对... 为提升有机工质向心透平的效率与性能,对400 kW有机工质向心透平进行了一维气动设计。在一维气动设计结果的基础上进行建模,并结合三维数值模拟预测了有机工质向心透平在设计工况下的性能。以向心透平等熵效率为目标,采用均匀试验法对动叶轮的子午流道进行优化设计。结果表明:与原始向心透平相比,优化后的向心透平流场压力分布层次更加分明,整体熵增减小,产生的摩擦损失、尾迹损失明显减小,叶片做功能力增大,向心透平内部的流动情况得到了改善,等熵效率由原来的82.33%提高到85.92%,输出功率也增大了18.04 kW。 展开更多
关键词 向心透平 子午流道 性能优化 均匀试验法 数值模拟
下载PDF
基于GPGPU-sim的多kernel场景下GPGPU性能优化实验方法
6
作者 张军 魏继桢 +2 位作者 沈凡凡 谭海 何炎祥 《实验技术与管理》 CAS 北大核心 2024年第7期87-93,共7页
该文介绍了基于GPGPU-sim的多kernel环境下GPGPU性能优化实验方法,旨在为初学者开展多kernenl场景下GPGPU性能优化研究提供实验方法参考,也能为计算机系统结构教学提供案例。文中重点分析讨论了基于GPGPU-sim模拟器、多kernel场景下的... 该文介绍了基于GPGPU-sim的多kernel环境下GPGPU性能优化实验方法,旨在为初学者开展多kernenl场景下GPGPU性能优化研究提供实验方法参考,也能为计算机系统结构教学提供案例。文中重点分析讨论了基于GPGPU-sim模拟器、多kernel场景下的一种自适应线程块调度方法的改进思想、实验方法及过程,还对GPGPU的微系统结构、GPGPU-sim模拟器及源代码结构进行了介绍。实验结果表明,该文阐述的实验方法可行,相对于基准方法,该文提出的改进策略可以提升多kernel场景下GPGPU的执行效率。 展开更多
关键词 多kernel场境 GPGPU GPGPU-sim 性能优化
下载PDF
基于机器学习算法的在线推荐系统设计与性能优化研究 被引量:2
7
作者 魏芬 《信息与电脑》 2024年第3期89-91,共3页
传统运营方式已经难以应对日益复杂的业务场景。特别是电商领域,采用个性化推荐系统对于改善用户体验、促进商品销售、提高广告点击率具有重要意义。文章以电商场景为例,设计了基于机器学习算法的在线推荐系统,并对该系统进行了性能优化。
关键词 机器学习算法 在线推荐系统 性能优化
下载PDF
基于ELK的日志系统性能优化 被引量:1
8
作者 叶惠仙 《电脑与信息技术》 2024年第1期113-115,共3页
在IT的运维与安全工作中,健全日志是帮助技术人员快速定位问题、分析故障原因以及优化系统的一个重要手段。在业务量大和并发量高的项目中,单节点的ELK会带来数据丢失、查询慢等问题。文章提出使用Elasticsearch集群和多节点logstash的... 在IT的运维与安全工作中,健全日志是帮助技术人员快速定位问题、分析故障原因以及优化系统的一个重要手段。在业务量大和并发量高的项目中,单节点的ELK会带来数据丢失、查询慢等问题。文章提出使用Elasticsearch集群和多节点logstash的解决方案,实现中大型系统的日志性能优化。 展开更多
关键词 性能优化 Elasticsearch集群 多节点Logstash
下载PDF
基于PCA/PSO的3T1R并联机构性能优化
9
作者 蒲志新 潘玉奇 +2 位作者 郭建伟 程轶 白杨溪 《农业机械学报》 EI CAS CSCD 北大核心 2024年第6期404-413,共10页
根据少自由度并联机构应用广泛的优点,提出了一种3T1R并联机构,该机构具有构型简单、结构对称、定位精度高等特点,可应用于小范围的精密操作,或者是大范围的搬运、分拣以及喷涂等领域。基于方位特征方程的拓扑分析理论,对该并联机构完... 根据少自由度并联机构应用广泛的优点,提出了一种3T1R并联机构,该机构具有构型简单、结构对称、定位精度高等特点,可应用于小范围的精密操作,或者是大范围的搬运、分拣以及喷涂等领域。基于方位特征方程的拓扑分析理论,对该并联机构完成了自由度种类以及数目的分析与验证;基于闭环矢量法完成了运动学模型建立,并通过位置正逆解算例验证了运动学的合理性。基于位置逆解方程利用极限边界搜索法分析了3T1R并联机构可达工作空间;通过速度分析建立了速度雅可比矩阵,并根据该矩阵分析机构的定位精度与可操作度性能指标。利用主成分分析(PCA)与粒子群算法(PSO)对3个性能指标进行优化设计,并对优化结果进行了分析,最终优化后可达工作空间体积从0.2933m3提高到0.4231m3,定位精度误差放大因子从15.5044减小至4.4308,可操作度指数从9.7027减小至1.3996。 展开更多
关键词 并联机构 运动学 主成分分析 粒子群算法 性能优化
下载PDF
胶泥缓冲器与高射机枪动力学性能优化匹配
10
作者 徐忠四 肖有才 符振荣 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第10期89-97,共9页
为了改善机枪的射击稳定性从而提高射击精度,设计一款应用于12.7 mm重型机枪的单出杆式黏弹性胶泥缓冲器,用变刚度Kelvin模型对其进行数学建模.用正交试验法对黏弹性胶泥缓冲器的刚度、阻尼系数和预压力进行优化匹配分析,获得胶泥缓冲... 为了改善机枪的射击稳定性从而提高射击精度,设计一款应用于12.7 mm重型机枪的单出杆式黏弹性胶泥缓冲器,用变刚度Kelvin模型对其进行数学建模.用正交试验法对黏弹性胶泥缓冲器的刚度、阻尼系数和预压力进行优化匹配分析,获得胶泥缓冲器与高射机枪动力学匹配最好的一组性能优化参数.优化匹配的黏弹性胶泥缓冲器与弹簧缓冲器动力学性能仿真比较结果表明,使用胶泥缓冲器的12.7 mm重型机枪后坐力更小,后坐速度变化更平稳,枪口波动更小. 展开更多
关键词 黏弹性胶泥缓冲器 阻尼系数 性能优化匹配 射击精度 正交试验
下载PDF
基于声学参数的OGFC沥青混合料吸声性能优化
11
作者 吴文亮 李陈月 代生林 《郑州大学学报(工学版)》 CAS 北大核心 2024年第6期18-24,共7页
多孔材料吸声系数的唯象模型考虑了声波在空隙结构中传播产生的能量耗散,构建基于声学参数的模型,可对吸声系数进行较好的预测。为了准确获取OGFC沥青混合料的5个声学参数(孔隙率、流阻率、曲折因子、黏性/热效特征长度)以构建声学模型... 多孔材料吸声系数的唯象模型考虑了声波在空隙结构中传播产生的能量耗散,构建基于声学参数的模型,可对吸声系数进行较好的预测。为了准确获取OGFC沥青混合料的5个声学参数(孔隙率、流阻率、曲折因子、黏性/热效特征长度)以构建声学模型,首先,通过实测与反演结合的方法制备了不同孔隙率、不同级配类型的OGFC沥青混合料,使用驻波管测试了吸声系数;其次,开发了适用于混合料的流阻率测量设备,利用实测的空隙率、吸声系数和流阻率,基于遗传算法编写反演程序对OGFC的曲折因子、黏性/热效特征长度进行反演;再次,建立驻波管的有限元模型验证了声学参数的正确性,分析了声学参数单因素对吸声性能的影响;最后,基于声学参数对吸声性能进行了优化。结果表明:OGFC的空隙率越高和公称最大粒径越大,平均吸声系数和峰值吸声系数均越大;所构建的模型能够较好体现混合料的吸声特性,峰值吸声系数及出现的频率与实测值吻合;空隙率、黏性特征长度和热效特征长度增大,以及曲折因子减小,均有利于提高吸声性能,根据声学参数对混合料吸声性能的优化结果,最佳的吸声性能应将空隙率控制在22%左右。 展开更多
关键词 OGFC沥青混合料 声学参数 遗传算法 驻波管模型 吸声性能优化
下载PDF
云存储系统性能优化策略与关键技术研究
12
作者 农嘉 吕俊虎 韦宁 《电脑知识与技术》 2024年第11期63-65,共3页
文章深入分析了提升云存储系统性能的关键策略与技术,概述了云存储系统性能的指标,包括传输带宽、读写响应时间和资源利用效率。分析了影响云存储系统性能的因素,如网络带宽限制、服务器性能和数据冗余机制。文章重点讨论了优化性能的策... 文章深入分析了提升云存储系统性能的关键策略与技术,概述了云存储系统性能的指标,包括传输带宽、读写响应时间和资源利用效率。分析了影响云存储系统性能的因素,如网络带宽限制、服务器性能和数据冗余机制。文章重点讨论了优化性能的策略,包括实施可扩展网络结构、负载均衡机制、数据去冗余和压缩等。通过这些策略,可以显著提高云存储系统的效率和可靠性,满足日益增长的数据存储需求。 展开更多
关键词 云存储系统 性能优化 网络带宽 服务器性能 数据去冗余
下载PDF
应用于人脸识别的多任务卷积神经网络性能优化
13
作者 叶惠仙 《中原工学院学报》 CAS 2024年第1期8-13,共6页
对一种多任务卷积神经网络的人脸识别性能进行研究与优化。该神经网络采用3个独立的任务网络分别进行人脸检测、关键点定位和人脸识别。让3个任务网络在训练过程中共享底层卷积层的特征表示,使得模型能针对多个任务同时进行学习,进而提... 对一种多任务卷积神经网络的人脸识别性能进行研究与优化。该神经网络采用3个独立的任务网络分别进行人脸检测、关键点定位和人脸识别。让3个任务网络在训练过程中共享底层卷积层的特征表示,使得模型能针对多个任务同时进行学习,进而提高其泛化能力和识别精度。为了增强模型对图像的学习能力,采用一种数据增强和迁移学习技术,使人脸识别系统的准确性、鲁棒性和可靠性均得到了显著提升。研究结果为发展人脸识别技术提供了新的思路,尤其在处理复杂场景和多样化人脸图像方面具有一定的应用前景。 展开更多
关键词 多任务学习 多任务卷积神经网络(MTCNN) 人脸识别 网络性能优化
下载PDF
针对功率降低的农用柴油机性能优化技术
14
作者 任瑞恩 《中国农机装备》 2024年第2期6-8,共3页
分析了农用柴油机配气系统、燃油供给系统以及润滑系统的常见故障及其对功率的影响,提出相应的优化措施。通过农用柴油机使用者的培训和教育、改善柴油燃烧质量、针对性优化农用柴油机构造、调整过量空气系数等手段,能有效提高农用柴油... 分析了农用柴油机配气系统、燃油供给系统以及润滑系统的常见故障及其对功率的影响,提出相应的优化措施。通过农用柴油机使用者的培训和教育、改善柴油燃烧质量、针对性优化农用柴油机构造、调整过量空气系数等手段,能有效提高农用柴油机的功率输出和使用寿命。 展开更多
关键词 农用柴油机 功率降低 性能优化 技术
下载PDF
云计算平台的性能优化与管理
15
作者 严旭影 《计算机应用文摘》 2024年第15期156-158,163,共4页
作为一种新兴的计算模式,云计算已在各领域被广泛应用。随着云计算规模的不断扩大和应用场景的增多,云计算平台的性能优化与管理成为亟待解决的重要问题。文章通过对云计算平台性能优化与管理的研究,探讨了当前云计算领域所面临的挑战,... 作为一种新兴的计算模式,云计算已在各领域被广泛应用。随着云计算规模的不断扩大和应用场景的增多,云计算平台的性能优化与管理成为亟待解决的重要问题。文章通过对云计算平台性能优化与管理的研究,探讨了当前云计算领域所面临的挑战,并提出了解决方案和策略,旨在提高云计算平台的性能和效率。 展开更多
关键词 云计算 性能优化 数据储存 数据管理
下载PDF
Apache Flink流式计算模型在数据处理中的应用与性能优化研究
16
作者 徐海霞 《电脑知识与技术》 2024年第7期71-73,共3页
文章旨在研究Apache Flink流式计算模型在数据处理中的应用与性能优化。先从可扩展性、容错性和数据并行处理能力三个方面对Apache Flink流式计算框架技术特点进行论述,再对Apache Flink流式计算框架核心思想与工作流程进行研究,并提出... 文章旨在研究Apache Flink流式计算模型在数据处理中的应用与性能优化。先从可扩展性、容错性和数据并行处理能力三个方面对Apache Flink流式计算框架技术特点进行论述,再对Apache Flink流式计算框架核心思想与工作流程进行研究,并提出一套执行数据处理任务的Java源码,再从并行计算、数据存储和传输、算法参数、系统配置、资源管理与调度、检查点和容错机制、编码和序列化等方面就如何进行Apache Flink性能优化进行分析,最后通过实验手段就优化性能进行分析。实验结果表明,优化后的平均响应时间显著减少,吞吐量相应增加,调整并行度和内存分配等参数可显著提升系统性能,但还需要考虑任务调度和资源分配等方面的综合因素,因此,Apache Flink流式计算框架调优策略具有一定的应用价值。 展开更多
关键词 流式计算 Apache Flink 大规模数据处理 性能优化 并行计算
下载PDF
地热井用两级潜水泵内流熵产诊断及水力性能优化 被引量:1
17
作者 王天任 李瑞霞 +3 位作者 周文博 姬忠礼 张永学 祁紫伟 《流体机械》 CSCD 北大核心 2024年第7期24-32,共9页
为了提升地热井用潜水泵的运行效率,根据地热井用潜水泵的流动参数和实际运行工况,完成了两级潜水泵过流部件水力设计,并进行了全流道流动数值模拟和试验验证;采用熵产分析法定位了潜水泵内流场的高能耗区域,主要集中在级间交汇和动静... 为了提升地热井用潜水泵的运行效率,根据地热井用潜水泵的流动参数和实际运行工况,完成了两级潜水泵过流部件水力设计,并进行了全流道流动数值模拟和试验验证;采用熵产分析法定位了潜水泵内流场的高能耗区域,主要集中在级间交汇和动静部件干涉处;采用正交设计和结构参数敏感性分析方法,确定了结构参数对潜水泵性能的影响规律,以叶轮叶片出口角、出口宽度、叶片包角和导叶轴向长度为优化变量,以扬程和效率为优化目标,通过遗传算法、最优拉丁超立方采样和熵权TOPSIS法对两级潜水泵进行水力优化。结果表明,额定工况下,优化泵的扬程增加了24.9%,效率增加了5.7%,总水力损失减小了1024.9 W,高能耗区域明显降低,水力性能显著提升,分离流、二次回流和冲击流动等不良流动得到显著抑制;大流量工况处理能力大幅度提升,高效区间范围扩大了70%,运行稳定性得到显著提高。研究内容为潜水泵的设计及内流场研究提供理论指导。 展开更多
关键词 地热井用潜水泵 熵产诊断 能量损失 水力性能优化
下载PDF
基于体育科学视角的运动服装设计与性能优化 被引量:5
18
作者 孙李小木 孙羽枫 《染整技术》 CAS 2024年第2期78-80,共3页
随着现代竞技体育的高速发展,运动服装不仅需要满足基本的舒适性和功能性需求,更要在提高运动员的竞技性能、保护运动员免受伤害以及提升运动员心理状态等方面发挥作用。因此,相关研究人员需要基于运动生理学、运动力学和运动心理学等... 随着现代竞技体育的高速发展,运动服装不仅需要满足基本的舒适性和功能性需求,更要在提高运动员的竞技性能、保护运动员免受伤害以及提升运动员心理状态等方面发挥作用。因此,相关研究人员需要基于运动生理学、运动力学和运动心理学等理论探讨运动服装设计与其性能优化。 展开更多
关键词 体育科学 运动服装 服装设计 性能优化
下载PDF
柔性电容式压力传感器性能优化的研究进展 被引量:1
19
作者 党新玉 段沐荣 +2 位作者 吴蓓 孙润军 王秋实 《印染》 CAS 北大核心 2024年第4期72-77,共6页
柔性电容式压力传感器具有低能耗、高灵敏度、高稳定性等优点,在可穿戴设备、电子皮肤等柔性电子领域受到广泛关注。概述了以复合介电层和微结构设计为代表的柔性电容式压力传感器灵敏度提升方法,并介绍了柔性电容式压力传感器在追求高... 柔性电容式压力传感器具有低能耗、高灵敏度、高稳定性等优点,在可穿戴设备、电子皮肤等柔性电子领域受到广泛关注。概述了以复合介电层和微结构设计为代表的柔性电容式压力传感器灵敏度提升方法,并介绍了柔性电容式压力传感器在追求高灵敏度和宽检测范围方面通常采用的多级复合结构、复合机制和混合响应策略,最后对柔性电容式压力传感器发展趋势进行了展望。 展开更多
关键词 电容式压力传感器 结构设计 性能优化 灵敏度 研究进展
下载PDF
基于张量虚拟机的快速卷积自动性能优化 被引量:1
20
作者 陈疆 朱泓霖 +1 位作者 孟金涛 魏彦杰 《集成技术》 2024年第5期3-18,共16页
卷积神经网络作为深度学习的典型代表,是计算机视觉等任务中最常用的神经网络,然而,卷积运算通常占整个卷积神经网络运行时的90%以上,成为卷积神经网络的性能瓶颈。此外,由于当下硬件的复杂性及工作负载的多样性,之前工作中的一些特定... 卷积神经网络作为深度学习的典型代表,是计算机视觉等任务中最常用的神经网络,然而,卷积运算通常占整个卷积神经网络运行时的90%以上,成为卷积神经网络的性能瓶颈。此外,由于当下硬件的复杂性及工作负载的多样性,之前工作中的一些特定优化往往缺乏性能可移植性。对此,作者提出BlazerML,一个基于张量虚拟机(TVM)模板代码自动生成的开源卷积计算库,可为任何输入形状自动生成高性能的卷积实现。BlazerML是基于Winograd算法实现的,因为该算法是快速卷积算法中性能最高的算法。实验结果表明:BlazerML显著优于当下最先进的开源库。在x86 CPU上运行常见的深度学习网络前向推理分别比OnnxRuntime、MNN和TVM社区版本快1.18~2.47倍、1.18~2.27倍和1.01~1.66倍。在ARMCPU上运行常见深度学习网络的单层推理分别比ACL和FastConv快1.26~6.11倍、1.04~4.28倍。 展开更多
关键词 深度学习 卷积神经网络 快速卷积算法 Winograd算法 TVM 自动性能优化
下载PDF
上一页 1 2 191 下一页 到第
使用帮助 返回顶部