期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
高性能异构加速器MiniGo算子优化方法
1
作者 乔鹏 贺周雨 +1 位作者 李荣春 姜晶菲 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第1期131-140,共10页
根据高性能异构加速器的特性和MiniGo的训练模式提出了一种高效的并行计算方法。对片上计算资源进行合理规划,实现异构设备之间的流水并行优化;根据异构设备间存在共享存储段设计了共享内存编码模式,减少数据传输开销;根据数字信号处理... 根据高性能异构加速器的特性和MiniGo的训练模式提出了一种高效的并行计算方法。对片上计算资源进行合理规划,实现异构设备之间的流水并行优化;根据异构设备间存在共享存储段设计了共享内存编码模式,减少数据传输开销;根据数字信号处理簇内具有多计算资源的特点结合算子计算-访存特性设计了不同的算子并行计算优化策略。同时,面向TensorFlow实现了一个易于使用的高性能计算库。实验结果显示,该方法实现了典型算子的多核并行计算。相对于单核,卷积算子加速比为24.69。相较于裁剪版8核FT2000+CPU,该方法训练和自博弈执行速度加速比分别为3.83和1.5。 展开更多
关键词 异构计算 算子优化 卷积神经网络 强化学习
下载PDF
面向大规模图像检索的深度强相关散列学习方法 被引量:3
2
作者 贺周雨 冯旭鹏 +1 位作者 刘利军 黄青松 《计算机研究与发展》 EI CSCD 北大核心 2020年第11期2375-2388,共14页
近年来,随着图像数据量的爆炸式增长,散列方法与深度学习相结合的方法在图像检索领域表现出优异的性能.主流的深度监督散列方法大多采用"成对"策略,利用标签信息生成一个相似矩阵约束散列编码.这类方法的计算开销大,不适用于... 近年来,随着图像数据量的爆炸式增长,散列方法与深度学习相结合的方法在图像检索领域表现出优异的性能.主流的深度监督散列方法大多采用"成对"策略,利用标签信息生成一个相似矩阵约束散列编码.这类方法的计算开销大,不适用于大规模的图像检索.为此,提出了一种一元深度监督散列学习方法——深度强相关散列学习方法,为卷积神经网络添加了一个散列层以得到散列码,通过计算低维散列码之间的汉明距离完成快速图像检索.特别地,为了学习到的散列码更具有区别性,提出了强相关损失函数约束散列码的生成.强相关损失函数通过改变模型对权重矩阵的敏感度调节特征之间的距离,尽可能地增大特征类间距离、缩小类内距离.该方法能够实现快速、准确的大规模图像检索,并且可以广泛地使用在多种卷积神经网络中.在CIFAR-10, NUS-WIDE, SVHN这3个大规模公开数据集中进行了大量实验,结果表明该方法的图像检索性能优于目前主流方法. 展开更多
关键词 近似最近邻搜索 图像检索 卷积神经网络 深度散列学习 损失函数
下载PDF
基于SHN模型的商品图像检索方法 被引量:1
3
作者 贺周雨 冯旭鹏 +1 位作者 刘利军 黄青松 《计算机工程与科学》 CSCD 北大核心 2019年第11期1991-1999,共9页
近年来电子商务行业快速发展,如何通过图像信息在庞大的商品库中快速、准确地找到所需要的商品具有重要的应用价值。针对商品图像数据规模大、类间数据量差异大、被拍摄商品的尺度相差较大以及压缩图像会损失掉细节信息的特点,提出了一... 近年来电子商务行业快速发展,如何通过图像信息在庞大的商品库中快速、准确地找到所需要的商品具有重要的应用价值。针对商品图像数据规模大、类间数据量差异大、被拍摄商品的尺度相差较大以及压缩图像会损失掉细节信息的特点,提出了一个融合金字塔池化策略与哈希学习的空间金字塔池化哈希网络SHN模型,作为本文商品图像检索方法的特征提取部分。为了提高模型对图像形变的鲁棒性,采用金字塔池化策略实现多尺度特征融合;为了使学习到的哈希码具有更好的独立性,使用量化误差损失及附加权值对哈希编码进行约束。本文方法保留了原始图像信息,解决了图像尺度变化所带来的负面影响,通过哈希编码能够实现快速的商品图像检索,商品图像检索实验中的mAP值达到91.9863%,完成一次检索所用时间为0.034856 s,检索性能优于当前主流方法。 展开更多
关键词 商品图像检索 深度卷积神经网络 多尺度池化 哈希学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部