期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
Optical tensor core architecture for neural network training based on dual-layer waveguide topology and homodyne detection 被引量:2
1
作者 徐绍夫 邹卫文 《Chinese Optics Letters》 SCIE EI CAS CSCD 2021年第8期84-89,共6页
We propose an optical tensor core(OTC) architecture for neural network training. The key computational components of the OTC are the arrayed optical dot-product units(DPUs). The homodyne-detection-based DPUs can condu... We propose an optical tensor core(OTC) architecture for neural network training. The key computational components of the OTC are the arrayed optical dot-product units(DPUs). The homodyne-detection-based DPUs can conduct the essential computational work of neural network training, i.e., matrix-matrix multiplication. Dual-layer waveguide topology is adopted to feed data into these DPUs with ultra-low insertion loss and cross talk. Therefore, the OTC architecture allows a large-scale dot-product array and can be integrated into a photonic chip. The feasibility of the OTC and its effectiveness on neural network training are verified with numerical simulations. 展开更多
关键词 optical tensor core neural network training matrix multiplication homodyne detection dual-layer waveguides
原文传递
Robust Core Tensor Dictionary Learning with Modified Gaussian Mixture Model for Multispectral Image Restoration 被引量:1
2
作者 Leilei Geng Chaoran Cui +3 位作者 Qiang Guo Sijie Niu Guoqing Zhang Peng Fu 《Computers, Materials & Continua》 SCIE EI 2020年第10期913-928,共16页
The multispectral remote sensing image(MS-RSI)is degraded existing multi-spectral camera due to various hardware limitations.In this paper,we propose a novel core tensor dictionary learning approach with the robust mo... The multispectral remote sensing image(MS-RSI)is degraded existing multi-spectral camera due to various hardware limitations.In this paper,we propose a novel core tensor dictionary learning approach with the robust modified Gaussian mixture model for MS-RSI restoration.First,the multispectral patch is modeled by three-order tensor and high-order singular value decomposition is applied to the tensor.Then the task of MS-RSI restoration is formulated as a minimum sparse core tensor estimation problem.To improve the accuracy of core tensor coding,the core tensor estimation based on the robust modified Gaussian mixture model is introduced into the proposed model by exploiting the sparse distribution prior in image.When applied to MS-RSI restoration,our experimental results have shown that the proposed algorithm can better reconstruct the sharpness of the image textures and can outperform several existing state-of-the-art multispectral image restoration methods in both subjective image quality and visual perception. 展开更多
关键词 Multispectral remote sensing image restoration modified Gaussian mixture sparse core tensor tensor dictionary learning
下载PDF
面向现代GPU的Winograd卷积加速研究
3
作者 童敢 黄立波 吕雅帅 《电子学报》 EI CAS CSCD 北大核心 2024年第1期244-257,共14页
卷积运算是现代卷积神经网络中必不可少的组成部分,同时也是最耗时的.为了解决卷积算子的性能问题,包括快速傅里叶变换(Fast Fourier Transform,FFT)和Winograd在内的快速卷积算法被提出. Winograd卷积可被用于提高小卷积核的推理性能,... 卷积运算是现代卷积神经网络中必不可少的组成部分,同时也是最耗时的.为了解决卷积算子的性能问题,包括快速傅里叶变换(Fast Fourier Transform,FFT)和Winograd在内的快速卷积算法被提出. Winograd卷积可被用于提高小卷积核的推理性能,是目前卷积神经网络中的主流实现方法 .然而,Winograd卷积在许多高度优化的深度神经网络库和深度学习编译器中的实现比较低效.由于Winograd卷积的四个阶段的复杂数据依赖关系,面向GPU对其进行优化非常具有挑战性.本文针对现代GPU体系结构优化了Winograd卷积算子的性能.本文提出了Winograd计算阶段的等价变化及其利用Tensor Core进行计算的无同步实现,并进一步提出了利用不同GPU内存层级的部分计算核融合方法 PKF(Partial Kernel Fusion).基于张量虚拟机(Tensor Virtual Machine,TVM)和代码重构器PKF-Reconstructor(Partial Kernel Fusion Reconstructor),实现了高性能的Winograd卷积.对真实应用中卷积神经网络的卷积算子的评估表明,与cuDNN相比,本文所提算法实现了7.58~13.69倍的性能提升. 展开更多
关键词 Winograd卷积 低精度 部分计算核融合 卷积加速 GPU内存层级 tensor core
下载PDF
基于“承影”GPGPU的张量处理器设计
4
作者 师雨洁 杨轲翔 +1 位作者 刘旭东 何虎 《微电子学与计算机》 2024年第5期109-116,共8页
针对神经网络对算力和通用性的需求进一步扩大,基于开源项目“承影”GPGPU,设计了张量处理器,可以对卷积、通用矩阵乘进行加速。首先,分析现有张量处理器设计方案及其对应算法,与直接进行卷积计算进行对比,分析性能差异。然后,提出基于... 针对神经网络对算力和通用性的需求进一步扩大,基于开源项目“承影”GPGPU,设计了张量处理器,可以对卷积、通用矩阵乘进行加速。首先,分析现有张量处理器设计方案及其对应算法,与直接进行卷积计算进行对比,分析性能差异。然后,提出基于三维乘法树结构的张量处理器设计,将其部署在Xilinx VCU128开发板上。在VCU128开发板上,张量处理器的工作频率为222 MHz。同时,开发了指数运算单元,辅助完成神经网络运算。在VCU128开发板上的工作频率为159 MHz。最后,利用编写汇编程序的方法,验证张量处理器的功能正确性。引入张量处理器后,预期运行时间明显减少。 展开更多
关键词 通用图形处理器 张量处理器 卷积 通用矩阵乘 指数运算
下载PDF
偶数阶张量core逆的性质和应用 被引量:1
5
作者 王宏兴 张晓燕 《数学物理学报(A辑)》 CSCD 北大核心 2021年第1期1-14,共14页
张量广义逆是张量理论研究的重要内容之一,在近年张量广义逆研究的基础上.该文给出在爱因斯坦积下张量core逆的性质、张量偏序和张量方程A*X=B在条件χ∈R(A)下的最小二乘解等.
关键词 core 爱因斯坦积 偏序 张量方程
下载PDF
A Novel Multichannel Audio Signal Compression Method Based on Tensor Representation and Decomposition 被引量:2
6
作者 WANG Jing XIE Xiang KUANG Jingming 《China Communications》 SCIE CSCD 2014年第3期80-90,共11页
Multichannel audio signal is more difficult to be compressed than mono and stereo ones.A novel multichannel audio signal compression method based on tensor representation and decomposition is proposed in this paper.Th... Multichannel audio signal is more difficult to be compressed than mono and stereo ones.A novel multichannel audio signal compression method based on tensor representation and decomposition is proposed in this paper.The multichannel audio is represented with 3-order tensor space and is decomposed into core tensor with three factor matrices in the way of channel,time and frequency.Only the truncated core tensor is transmitted which will be multiplied by the pre-trained factor matrices to reconstruct the original tensor space.Objective and subjective experiments have been done to show a very noticeable compression capability with an acceptable output quality.The novelty of the proposed compression method is that it enables both high compression capability and backward compatibility with limited signal distortion to the hearing. 展开更多
关键词 音频信号 信号压缩 多通道 分解法 量表 张量空间 压缩方法 抗压能力
下载PDF
运用多模态学习改进张量分解的知识补全方法
7
作者 陈冲 蒙祖强 《计算机工程与设计》 北大核心 2023年第10期2956-2964,共9页
基于单一模态实体之间建立关联所形成的语义关系网难以准确理解现实世界中的多模态语义。为增强多源知识图谱的补全能力以及解决知识图谱语义缺失问题,提出一种基于多模态嵌入张量分解的方法ME-TD(multimodal embedding tensor decompos... 基于单一模态实体之间建立关联所形成的语义关系网难以准确理解现实世界中的多模态语义。为增强多源知识图谱的补全能力以及解决知识图谱语义缺失问题,提出一种基于多模态嵌入张量分解的方法ME-TD(multimodal embedding tensor decomposition)。利用由图像、描述文本和知识构成的三元组作为张量分解模型的输入,分别对图像和文本进行特征提取,研究3种融合方法:相加融合、相乘融合以及连接映射方法,通过高维映射形成一个多模态的三阶张量;经过三模式分解,产生一个核心张量与每一个维度因子矩阵的乘积,通过链接预测计算三元组正确的概率。实验结果表明,ME-TD方法在知识补全中对多模态矩阵预测效果相较于其它方法有较为明显提升。 展开更多
关键词 知识图谱补全 特征提取 多模态嵌入 融合 核心张量 三模式分解 链接预测
下载PDF
基于矢量阵列的信源数估计算法 被引量:1
8
作者 李楠 程锦房 +1 位作者 何光进 张炜 《武汉理工大学学报(交通科学与工程版)》 2013年第1期175-178,共4页
针对单矢量水听器具有同时共点接收多路信号的特点,在矢量信号模型的基础上,将并行因子分析引入到信号谱张量结构中,通过核一致判别算法确定信源数.本方法充分提取了多路信号中包含的信源数信息,在相同信噪比和快拍条件下,与盖氏圆法和... 针对单矢量水听器具有同时共点接收多路信号的特点,在矢量信号模型的基础上,将并行因子分析引入到信号谱张量结构中,通过核一致判别算法确定信源数.本方法充分提取了多路信号中包含的信源数信息,在相同信噪比和快拍条件下,与盖氏圆法和基于信息论的最小描述长度方法相比具有较高的估计准确概率,仿真实验证明了该方法的有效性. 展开更多
关键词 并行因子分析 谱张量 核一致判别 信源数
下载PDF
基于STFD和PARAFAC的欠定盲源分离信源个数估计算法 被引量:1
9
作者 夏江华 郭进 王小敏 《西南交通大学学报》 EI CSCD 北大核心 2013年第6期1084-1089,共6页
为更精确地进行欠定混合条件下的信源个数估计,提出了一种基于空间时频分布(STFP)与平行因子分析(PARAFAC)的欠定盲源分离信源个数估计算法.该算法从空间时频分布矩阵中选择符合单源时频支撑域的时频点构成1个3阶张量,然后由核连续诊断... 为更精确地进行欠定混合条件下的信源个数估计,提出了一种基于空间时频分布(STFP)与平行因子分析(PARAFAC)的欠定盲源分离信源个数估计算法.该算法从空间时频分布矩阵中选择符合单源时频支撑域的时频点构成1个3阶张量,然后由核连续诊断算法计算因子数量,估计出信源个数,并对3阶张量平行因子低秩分解的惟一性条件进行了分析.该算法不需要假设源信号必须满足稀疏性和独立性条件,也不要求其满足高斯分布条件.在计算机仿真实验中,当信噪比为-5 dB时,识别正确率提高18 dB,证明了改进算法的有效性. 展开更多
关键词 空间时频分布 平行因子分析 3阶张量 核连续诊断算法
下载PDF
应用数字岩心对砂岩绝对渗透率研究 被引量:5
10
作者 杜建芬 魏博熙 郭平 《科学技术与工程》 北大核心 2016年第23期166-172,共7页
岩石渗透率作为岩石固有的物性参数,对于研究流体在岩石中的渗流过程具有重要意义;然而传统的研究方法只是在数值方面的计算,并未结合流体的实际流线。通过结合传统计算方法与数字岩心技术,使用Avizo三维重建软件对渗透率的计算结果与... 岩石渗透率作为岩石固有的物性参数,对于研究流体在岩石中的渗流过程具有重要意义;然而传统的研究方法只是在数值方面的计算,并未结合流体的实际流线。通过结合传统计算方法与数字岩心技术,使用Avizo三维重建软件对渗透率的计算结果与流线结合可视化结合处理,可清晰观察到流体流动流线及流体渗透压力分布;并得到渗透率张量的计算结果。可从流线观察得到岩石渗透率的各向异向。通过与实验室岩心所测量结果相对比,发现二者误差极小,说明重建结果可信,可用于工程实际计算。通过对数字岩心进行三维模拟,可以使研究者得到更为直观的结果,有利于进行更加客观的分析,为油藏工作者分析岩石物性参数时提供了一种新的方法。 展开更多
关键词 数字岩心 绝对渗透率 渗透率张量 三维可视化
下载PDF
低秩张量补全算法综述 被引量:2
11
作者 刘慧梅 史加荣 《陕西理工学院学报(自然科学版)》 2016年第2期80-86,共7页
随着现代信息技术的快速发展,待分析的数据大都具有很复杂的结构。在获取高维多线性数据的过程中,部分元素可能丢失,低秩张量补全就是根据数据集的低秩性质来恢复出所有丢失元素。低秩张量补全是压缩感知理论的高阶推广,在数学上可以描... 随着现代信息技术的快速发展,待分析的数据大都具有很复杂的结构。在获取高维多线性数据的过程中,部分元素可能丢失,低秩张量补全就是根据数据集的低秩性质来恢复出所有丢失元素。低秩张量补全是压缩感知理论的高阶推广,在数学上可以描述为核范数最小化问题。对求解低秩张量补全的核范数最小化模型的现有算法进行了综述。介绍了张量的基础知识和低秩张量补全模型,给出了低秩张量补全的几种主流算法,如:简单低秩张量补全、高精度低秩张量补全以及核心张量核范数的张量补全等,指出了现有低秩张量补全算法中值得研究与改进的方向。 展开更多
关键词 张量补全 低秩 核范数最小化 核心张量核范数 交替方向乘子法
下载PDF
注塑工艺参数对矩形薄壁件纤维取向影响模拟研究 被引量:2
12
作者 杨海 李再轲 +3 位作者 陈增红 樊凯 严立专 姜其斌 《广东化工》 CAS 2016年第17期47-48,共2页
以矩形薄壁件为研究对象,基于Folgar-Tucker张量模型,研究了注塑工艺参数:注射时间、模具表面温度、熔体温度对纤维取向的影响,并着重探讨了注射时间对纤维取向沿厚度方向分布的影响。研究结果表明:注射时间对纤维取向的影响最显著;随... 以矩形薄壁件为研究对象,基于Folgar-Tucker张量模型,研究了注塑工艺参数:注射时间、模具表面温度、熔体温度对纤维取向的影响,并着重探讨了注射时间对纤维取向沿厚度方向分布的影响。研究结果表明:注射时间对纤维取向的影响最显著;随着注射时间的增加,平均纤维取向程度大幅降低,而模具表面温度与熔体温度对纤维取向的影响较小,且随着注射时间的增加,核层宽度变窄,而壳层宽度变宽。 展开更多
关键词 薄壁件 Folgar-Tucker张量模型 平均纤维取向 核层 壳层
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部