期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
基于稀疏存储的有限元结构分析高效缩聚并行计算方法 被引量:1
1
作者 苗新强 金先龙 丁峻宏 《农业机械学报》 EI CAS CSCD 北大核心 2015年第4期338-343,共6页
基于稀疏存储技术和直接稀疏求解器提出了一种有限元结构分析高效缩聚并行计算方法。该方法将缩聚过程转换为一系列线性方程组的求解过程,并通过直接稀疏求解器进行求解。它能够避免传统变带宽格式缩聚并行计算方法对带宽内大量零元素... 基于稀疏存储技术和直接稀疏求解器提出了一种有限元结构分析高效缩聚并行计算方法。该方法将缩聚过程转换为一系列线性方程组的求解过程,并通过直接稀疏求解器进行求解。它能够避免传统变带宽格式缩聚并行计算方法对带宽内大量零元素的存储和运算,从而大幅度节省内存空间和有效减少计算量。最后通过发动机曲轴的有限元数值仿真实验对算法的有效性进行了验证。结果表明:相对传统变带宽格式缩聚并行计算方法,稀疏存储格式缩聚并行计算方法能够大幅度节省内存空间和有效提高计算效率;各子区域规模越大,该方法对内存空间的节省和计算效率的提高效果就越明显。 展开更多
关键词 高性能计算 有限元分析 稀疏存储技术 直接稀疏求解器 缩聚
下载PDF
基于稀疏存储Elman神经网络的直线伺服控制
2
作者 左健民 潘超 汪木兰 《中国机械工程》 EI CAS CSCD 北大核心 2012年第1期55-58,共4页
为提高数控机床直线进给系统的动态跟踪性能及抗干扰能力,结合进给系统重复运动的特点,利用前一次或前几次的历史控制信息提高进给系统的动态性能,提出了具有动态稀疏存储功能的改进Elman神经网络;引入迅速联想的表格查询方式对神经网... 为提高数控机床直线进给系统的动态跟踪性能及抗干扰能力,结合进给系统重复运动的特点,利用前一次或前几次的历史控制信息提高进给系统的动态性能,提出了具有动态稀疏存储功能的改进Elman神经网络;引入迅速联想的表格查询方式对神经网络的历史信息进行分类存储、选择利用以增强网络泛化能力,提高网络收敛速度;详细推导了改进Elman神经网络的数学模型及权值调整算法,并将其应用到直线进给伺服系统中,结果表明,基于稀疏存储Elman神经网络的速度控制器具有良好的跟踪精度和抗干扰能力。 展开更多
关键词 ELMAN神经网络 稀疏存储 直线伺服系统 泛化能力
下载PDF
一种基于容器的对投影矩阵稀疏存储与快速访问的方法
3
作者 王鑫 《山西电子技术》 2015年第6期60-61,68,共3页
针对迭代重建算法中投影系数的重复计算,以及投影矩阵存储占用空间大,检索效率低等问题,本文提出一种基于vector容器的投影矩阵稀疏存储与快速访问方法。该方法只计算一次投影系数,并利用容器的大小可变性将投影系数以二进制格式进行稀... 针对迭代重建算法中投影系数的重复计算,以及投影矩阵存储占用空间大,检索效率低等问题,本文提出一种基于vector容器的投影矩阵稀疏存储与快速访问方法。该方法只计算一次投影系数,并利用容器的大小可变性将投影系数以二进制格式进行稀疏存储。在迭代重建过程中,循环访问这些二进制文件,并使用容器快速检索获得每一条射线的投影系数。实验证明,本文提出的方法有效地减少了投影矩阵占用的内存,减少了迭代过程中计算投影系数的运算量,加快了重建速度。 展开更多
关键词 投影矩阵 稀疏存储 快速访问 容器
下载PDF
并行计算和稀疏存储在模糊积分上的应用 被引量:1
4
作者 陈润健 王金凤 《计算机应用研究》 CSCD 北大核心 2018年第1期166-171,共6页
近年来很多学者开展了模糊积分的相关研究,并将模糊积分应用于各种分类问题,而模糊测度的确定则是模糊积分计算的重点和难点。将并行计算和稀疏存储应用在模糊积分求解上,分别解决模糊积分计算中的时间复杂度和空间复杂度问题,并提出一... 近年来很多学者开展了模糊积分的相关研究,并将模糊积分应用于各种分类问题,而模糊测度的确定则是模糊积分计算的重点和难点。将并行计算和稀疏存储应用在模糊积分求解上,分别解决模糊积分计算中的时间复杂度和空间复杂度问题,并提出一种高效率模糊积分算法——基于并行和稀疏框架的模糊积分(parallel and sparse frame based fuzzy integral,PSFI)。实验表明,随着计算资源的增加,PSFI算法的加速比和效率下降较低。在变量存储上,PSFI算法在较多特征的数据集上对存储空间减少数千倍。最后,提出的PSFI算法相比之前提出的多重模糊积分(multiple nonlinear integral,MNI)算法,有较高的分类准确率。 展开更多
关键词 模糊测度 模糊积分 并行计算 稀疏存储 分类
下载PDF
三维对流扩散方程的稀疏存储及预条件迭代 被引量:2
5
作者 袁冬芳 曹富军 《计算机工程与应用》 CSCD 北大核心 2018年第4期56-59,83,共5页
基于四阶紧致格式对三维对流扩散方程进行离散,并给出所得到的离散线性方程组的块三角稀疏矩阵形式。以带双阈值的不完全因子化LU分解(ILUT(τ,s))作为预条件子,分别用FGMRES、BICGSTAB和TFQMR作为迭代加速器,对离散线性方程组进行求解... 基于四阶紧致格式对三维对流扩散方程进行离散,并给出所得到的离散线性方程组的块三角稀疏矩阵形式。以带双阈值的不完全因子化LU分解(ILUT(τ,s))作为预条件子,分别用FGMRES、BICGSTAB和TFQMR作为迭代加速器,对离散线性方程组进行求解验证了格式精度并比较了不同迭代法的CPU时间和迭代步。此外,通过比较传统迭代法和预条件迭代法的计算效率,表明预条件迭代法不仅能够保证格式的四阶精度,还能极大地提高收敛效率。 展开更多
关键词 三维对流扩散方程 稀疏矩阵存储 预条件技术 KRYLOV子空间方法
下载PDF
稀疏矩阵存储技术 被引量:14
6
作者 张永杰 孙秦 《长春理工大学学报(自然科学版)》 2006年第3期38-41,共4页
在科学与工程计算领域,有许多问题都最终归结为求解稀疏线性方程组;其稀疏矩阵中只有少量元素不为零,为了节省计算机的存储空间,加快存取运算速度,开展稀疏矩阵存储技术的研究是十分必要的。本文从基本的矩阵存储技术出发,介绍了一些常... 在科学与工程计算领域,有许多问题都最终归结为求解稀疏线性方程组;其稀疏矩阵中只有少量元素不为零,为了节省计算机的存储空间,加快存取运算速度,开展稀疏矩阵存储技术的研究是十分必要的。本文从基本的矩阵存储技术出发,介绍了一些常用的稀疏矩阵存储方法,比较了它们的优缺点,并给出了它们的适用条件。期望能够对稀疏线性方程组的高效求解提供一些有益帮助。 展开更多
关键词 稀疏线性方程组 稀疏矩阵 稀疏存储技术
下载PDF
改进的稀疏分布存储器模型及其学习能力分析 被引量:2
7
作者 彭宏京 陈松灿 《电子学报》 EI CAS CSCD 北大核心 2002年第5期774-776,共3页
Kanerva的稀疏分布存储器模型 (SDM) ,由于其读写规则采用外积法 ,因此限制了它的应用 .本文对该模型进行改进 ,改变了原来的读写规则 ,保留其稀疏分布式存储的特点 ,得到一个与小脑模型 (CMAC)相似的新模型 ,但它不存在分块效应、不需... Kanerva的稀疏分布存储器模型 (SDM) ,由于其读写规则采用外积法 ,因此限制了它的应用 .本文对该模型进行改进 ,改变了原来的读写规则 ,保留其稀疏分布式存储的特点 ,得到一个与小脑模型 (CMAC)相似的新模型 ,但它不存在分块效应、不需要HASHING技术 . 展开更多
关键词 稀疏分布存储器模型 学习能力分析 非线性映射 计算机
下载PDF
带状稀疏矩阵乘法及高效GPU实现
8
作者 刘丽 陈长波 《计算机应用》 CSCD 北大核心 2023年第12期3856-3867,共12页
稀疏-稠密矩阵乘法(SpMM)广泛应用于科学计算和深度学习等领域,提高它的效率具有重要意义。针对具有带状特征的一类稀疏矩阵,提出一种新的存储格式BRCV(Banded Row Column Value)以及基于此格式的SpMM算法和高效图形处理单元(GPU)实现... 稀疏-稠密矩阵乘法(SpMM)广泛应用于科学计算和深度学习等领域,提高它的效率具有重要意义。针对具有带状特征的一类稀疏矩阵,提出一种新的存储格式BRCV(Banded Row Column Value)以及基于此格式的SpMM算法和高效图形处理单元(GPU)实现。由于每个稀疏带可以包含多个稀疏块,所提格式可看成块稀疏矩阵格式的推广。相较于常用的CSR(Compressed Sparse Row)格式,BRCV格式通过避免稀疏带中列下标的冗余存储显著降低存储复杂度;同时,基于BRCV格式的SpMM的GPU实现通过同时复用稀疏和稠密矩阵的行更高效地利用GPU的共享内存,提升SpMM算法的计算效率。在两种不同GPU平台上针对随机生成的带状稀疏矩阵的实验结果显示,BRCV的性能不仅优于cuBLAS(CUDA Basic Linear Algebra Subroutines),也优于基于CSR和块稀疏两种不同格式的cuSPARSE。其中,相较于基于CSR格式的cuSPARSE,BRCV的最高加速比分别为6.20和4.77。此外,将新的实现应用于图神经网络(GNN)中的SpMM算子的加速。在实际应用数据集上的测试结果表明,BRCV的性能优于cuBLAS和基于CSR格式的cuSPARSE,且在大多数情况下优于基于块稀疏格式的cuSPARSE。其中,相较于基于CSR格式的cuSPARSE,BRCV的最高加速比为4.47。以上结果表明BRCV可以有效提升SpMM的效率。 展开更多
关键词 带状稀疏矩阵 稀疏存储格式 稀疏矩阵乘法 图形处理单元 共享内存
下载PDF
超大规模线性规划的稀疏存储和预处理中比例行的检测和处理方法
9
作者 武昱 黄思明 《中国管理科学》 CSSCI CSCD 北大核心 2017年第10期100-108,共9页
随着大数据时代的到来,线性规划问题的规模越来越大是一种必然。面对超大规模线性规划问题,如何存储数据,使得存储空间节省以避免资源的浪费,并且使得数据的查询、修改和增删方便快捷,是一个急需解决的问题。本文提出了基于十字链表的... 随着大数据时代的到来,线性规划问题的规模越来越大是一种必然。面对超大规模线性规划问题,如何存储数据,使得存储空间节省以避免资源的浪费,并且使得数据的查询、修改和增删方便快捷,是一个急需解决的问题。本文提出了基于十字链表的数据稀疏存储方式。并且,通过对Netlib数据库中的超大规模线性规划问题进行存储分析,对此种存储方式的优越性进行了验证。此外,由于大量冗余数据的存在,在应用算法求解超大规模线性规划问题之前,往往需要进行预处理,而比例行的检测和处理是预处理中必要的关键一步,因此本文提出了比例行的检测和处理方法。首先给出了不同于常理的比例行及其他相关概念的定义;然后结合本文提出的数据存储方式,提出了简单易操作的比例行检测方法;接着总结已有文献得出了比例行消除操作的两个基本原则,并在此基础上通过对比例行所含有的非零元素进行分类,通过理论分析推导出了保证约束矩阵稀疏度不降且单独列增加的比例行处理方法。最后,首先通过一个微型算例对比例行检测和处理的具体过程进行了演示和分析,然后通过Netlib数据库中的6个实际线性规划问题,对比例行检测和处理方法真正作用于超大规模线性规划问题时的效果进行了验证。 展开更多
关键词 线性规划 预处理 十字链表 稀疏存储 比例行
原文传递
沿次对角线带宽为m的稀疏矩阵压缩存储的通用寻址公式
10
作者 杨康 刘明杰 杨文茂 《计算机与数字工程》 2002年第1期41-45,共5页
本文属于数据结构的课题,它将文献[2]与[3]中给出的沿主对角线具有m条非零元素的稀疏矩阵压缩 存储寻址公式推广到沿次对角线分布的类似矩阵上,得到了新的寻址公式,并用例子验证了公式的正确性。
关键词 次对角线 n阶对角矩阵 通用寻址公式 稀疏矩阵压缩存储 数据结构
下载PDF
利用超松弛预处理共轭梯度法求解大型稀疏方程组 被引量:5
11
作者 陈春香 尹洪东 《科学技术与工程》 2010年第10期2389-2391,2394,共4页
利用有限差分法构造大型稀疏方程组对井地电位成像测量非均质电阻率的三维正演进行研究。对于线性方程组Ax=b,A是大型稀疏的带状矩阵,解大型稀疏方程组的直接共轭梯度法,一般要求巨大的计算机内存来存储系数矩阵A,而且计算速度极其慢。... 利用有限差分法构造大型稀疏方程组对井地电位成像测量非均质电阻率的三维正演进行研究。对于线性方程组Ax=b,A是大型稀疏的带状矩阵,解大型稀疏方程组的直接共轭梯度法,一般要求巨大的计算机内存来存储系数矩阵A,而且计算速度极其慢。因此引入按行索引的稀疏存储模式及超松弛预处理共轭梯度算法,充分利用系数矩阵A的稀疏性,使得需要的内存大大减小,充分提高运算速度。这种方法对井地电位成像测量非均质电阻率的三维正演具有一定的实用价值。 展开更多
关键词 共轭梯度法 超松弛预处理 行索引的稀疏存储模式
下载PDF
基于Gabor变换与自组织稀疏RAM的N-tuple神经网络的人脸识别方法 被引量:1
12
作者 周兆捷 吴乐南 孙大瑞 《电路与系统学报》 CSCD 2004年第1期115-118,共4页
本文提出了一种采用首先对人脸图像进行Gabor变换,然后由自组织稀疏RAM的N-tuple神经网络进行训练识别的方法,通过大量实验证明,该方法在较少训练样本下条件下,能够取得较高的识别率。
关键词 人脸识别 GABOR变换 自组织映射 N-tuple分类器 稀疏分布存储
下载PDF
一种基于优化存储格式的DLB_GaBP算法
13
作者 陈振武 黄婧 +1 位作者 兰添才 郑汉垣 《计算机技术与发展》 2020年第6期71-76,共6页
基于动态运行的多线程或多进程环境中的多核并行处理机,常存在数据存储格式及数据读取方法不合理,并行运行任务的不均衡性状态,直接影响到系统工作的整体效率,因此,优化数据存储格式、均衡优化任务调度算法是保证整个系统运行效率的关... 基于动态运行的多线程或多进程环境中的多核并行处理机,常存在数据存储格式及数据读取方法不合理,并行运行任务的不均衡性状态,直接影响到系统工作的整体效率,因此,优化数据存储格式、均衡优化任务调度算法是保证整个系统运行效率的关键。利用高斯置信传播算法(GaBP)在求解对称对角占优线性方程组中具有高并行度、低复杂度的特性,结合对数据存储格式进行优化的基础上,设计实现一种具有动态负载均衡特性的多核并行GaBP算法(DLB_GaBP算法)。利用该算法并通过对稀疏矩阵集(UFget)的求解实验,在千万量级别以上的大规模计算环境中,DLB_GaBP算法具有更好的计算效率和更高的加速比,这为充分发挥多核并行处理机的运算能力及大规模计算问题的快速求解提供了一种新算法思路。 展开更多
关键词 大规模并行运算 稀疏矩阵存储格式 动态负载均衡 GaBP算法 DLB_GaBP算法
下载PDF
基于稀疏RAM的逼近型神经网络与统计模式识别的人脸识别
14
作者 周兆捷 孙玉霞 吴乐南 《信号处理》 CSCD 2003年第6期517-521,共5页
本文提出了一种基于稀疏RAM的逼近型神经网络(SN-tuple)与统计模式识别相结合的人脸识别方法,采用首先直接将原始图像数据输入稀疏RAM的逼近型神经网络中进行粗分类,再由统计模式识别方法中的PCA、LDA来进行最终细分类的方法,通过大量... 本文提出了一种基于稀疏RAM的逼近型神经网络(SN-tuple)与统计模式识别相结合的人脸识别方法,采用首先直接将原始图像数据输入稀疏RAM的逼近型神经网络中进行粗分类,再由统计模式识别方法中的PCA、LDA来进行最终细分类的方法,通过大量的实验证明了该方法的有效性。 展开更多
关键词 稀疏RAM 逼近型神经网络 统计模式识别 人脸识别 稀疏分布存储 主元分析
下载PDF
基于双向位图的CSR大规模图存储优化 被引量:1
15
作者 甘新标 谭雯 刘杰 《计算机研究与发展》 EI CSCD 北大核心 2021年第3期458-466,共9页
大数据时代,Graph500是评测超级计算机处理数据密集型应用能力的重要工具,E级验证系统的图遍历处理能力主要受限于内存空间和访存带宽,尤其是内存空间利用率直接决定了图的测试规模和测试性能.针对天河E级验证系统小内存特征,提出了基... 大数据时代,Graph500是评测超级计算机处理数据密集型应用能力的重要工具,E级验证系统的图遍历处理能力主要受限于内存空间和访存带宽,尤其是内存空间利用率直接决定了图的测试规模和测试性能.针对天河E级验证系统小内存特征,提出了基于双向位图的大规模图数据压缩存储方法(bidirectional-bitmap based CSR,Bi-CSR),Bi-CSR在CSR矩阵压缩的基础上引入行方向位图和列方向位图协同完成稀疏矩阵压缩存储,行方向位图主要负责行方向位图的压缩存储与索引,列方向位图除了进一步压缩图存储空间,还负责为顶点遍历向量并行优化提供加速空间.Bi-CSR大幅度减少了稀疏矩阵存储空间.面向天河E级验证系统,当图输入规模为237时,Graph500的图存储空间节约效率接近70%,全系统稳定测试性能为2.131E+12TEPS,性能最大加速比超过100倍. 展开更多
关键词 Graph500 双向位图 稀疏矩阵压缩存储 图遍历 天河E级验证系统
下载PDF
结构模态多级分层并行计算方法
16
作者 喻高远 楼云锋 +1 位作者 李俊杰 金先龙 《振动与冲击》 EI CSCD 北大核心 2023年第16期19-25,共7页
基于稀疏存储技术和传统并行模态综合法提出了一种有限元结构模态分析多级分层并行计算方法。该方法在两级分区4次变换策略的基础上不仅实现了大量数据的分布式稀疏存储,提高了数据的内存访问效率,而且实现了系统整体缩减后的广义特征... 基于稀疏存储技术和传统并行模态综合法提出了一种有限元结构模态分析多级分层并行计算方法。该方法在两级分区4次变换策略的基础上不仅实现了大量数据的分布式稀疏存储,提高了数据的内存访问效率,而且实现了系统整体缩减后的广义特征方程规模的有效降低,大幅度减少了广义特征方程的求解时间。此外,它还利用计算任务和异构众核集群硬件体系结构映射实现了计算过程的多级并行,不仅有效改善了不同层级的负载均衡,而且通过通信分离有效提高了通信效率。因此,它能够充分利用异构众核分布式存储并行计算机的体系结构特点提升大规模有限元模态并行计算效率。数值算例表明,相比于传统的并行模态综合法,稀疏存储格式模态多级分层并行方法能够大幅度节省内存空间和提高计算效率。 展开更多
关键词 异构众核 多级分层并行 负载均衡 稀疏存储 大规模模态分析
下载PDF
大系统马尔可夫模型状态转移概率矩阵的快速形成方法 被引量:12
17
作者 刘艳丽 余贻鑫 《天津大学学报(自然科学与工程技术版)》 EI CAS CSCD 北大核心 2013年第9期791-798,共8页
提出马尔可夫模型状态转移概率矩阵的快速形成方法.定义元件状态转移率矩阵和系统状态数组,将系统状态转换为便于计算机存储与处理的数组,有效地描述了系统状态之间的转移;基于元件状态转移率矩阵和系统状态数组提出不受系统状态和元件... 提出马尔可夫模型状态转移概率矩阵的快速形成方法.定义元件状态转移率矩阵和系统状态数组,将系统状态转换为便于计算机存储与处理的数组,有效地描述了系统状态之间的转移;基于元件状态转移率矩阵和系统状态数组提出不受系统状态和元件状态数目限制快速准确计算状态转移率的方法,通过挖掘状态转移概率矩阵中非零元素的分布规律提出非零元素的快速定位方法,进而快速形成状态转移概率矩阵的稀疏存储;针对由两状态元件组成的系统,提出基于给定系统状态排序和服务状态集数组快速定位状态转移概率矩阵中非零元素的方法.将其应用于电力系统概率安全性评估,以新英格兰10机39节点系统为例,证实了方法的有效性和实用性. 展开更多
关键词 马尔可夫模型 状态转移概率矩阵 稀疏存储 大系统
下载PDF
多模式匹配算法的优化研究 被引量:8
18
作者 方贤进 李龙澍 《微计算机信息》 北大核心 2007年第03X期211-213,共3页
模式匹配技术有着广泛的应用且模式匹配算法已经被研究了很多年,同时对稀疏存储及其结构的操作也有大量的文献资料。本文首先描述了Aho-Corasick多模式匹配算法,该算法是基于自动机及状态向量的,然后提出了使用banded-row稀疏存储对Aho-... 模式匹配技术有着广泛的应用且模式匹配算法已经被研究了很多年,同时对稀疏存储及其结构的操作也有大量的文献资料。本文首先描述了Aho-Corasick多模式匹配算法,该算法是基于自动机及状态向量的,然后提出了使用banded-row稀疏存储对Aho-Corasick算法中的状态转换表进行存储优化的观点,给出了优化算法。最后给出了和原Aho-Corasick算法相比较的测试结果,该结果表明在大模式集的情况下,使用banded-row稀疏存储的Aho-Corasick算法减少了存储需求,进一步地提高了性能。 展开更多
关键词 多模式匹配 AHO-CORASICK算法 稀疏存储
下载PDF
基于GPU并行的大地电磁二维正演 被引量:1
19
作者 刘庆 徐凤姣 Osborne Kachaje 《中国锰业》 2018年第3期13-15,共3页
对于实测数据的高维MT反演而言,计算所耗的时间与计算机的内存容量仍然是限制其进一步发展的主要因素。有效地减少单次正演的运算时间以及控制正演程序所占用的内存容量,将有效地促进实测数据的高维MT反演。在有限单元法的基础上采用全... 对于实测数据的高维MT反演而言,计算所耗的时间与计算机的内存容量仍然是限制其进一步发展的主要因素。有效地减少单次正演的运算时间以及控制正演程序所占用的内存容量,将有效地促进实测数据的高维MT反演。在有限单元法的基础上采用全稀疏存储的策略,极大地减少了MT二维正演程序所占用地内存容量。与此同时,基于CPU(Open MP)和GPU(CUDA)异构并行处理的方式,有效地减少了MT二维正演的运算时间。 展开更多
关键词 MT2维正演 有限单元法 稀疏存储 并行计算
下载PDF
一种基于n元组分类器的人脸图象识别方法
20
作者 詹曙 李厚强 《计算机工程与应用》 CSCD 北大核心 2001年第5期65-66,共2页
人脸图象识别是模式识别和人工智能领域的一个热点,文章介绍了一个可以用于多灰度级人脸图象识别的连续n元组分类器方法,采用稀疏存储等技术,实验结果表明它比传统的特征脸方法和传统的n元组分类器方法简捷、快速、识别正确率高。
关键词 N元组分类器 人脸图象识别 稀疏存储 模式识别 人工智能
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部