期刊文献+
共找到869篇文章
< 1 2 44 >
每页显示 20 50 100
一种基于三角数分解的可配置2-D卷积器优化方法
1
作者 黄继业 肖强 +4 位作者 田大海 高明裕 王俊帆 董哲康 黄汐威 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第7期3054-3062,共9页
多尺寸2-D卷积通过特征提取在检测、分类等计算机视觉任务中发挥着重要作用。然而,目前缺少一种高效的可配置2-D卷积器设计方法,这限制了卷积神经网络(CNN)模型在边缘端的部署和应用。该文基于乘法管理以及奇平方数的三角数分解方法,提... 多尺寸2-D卷积通过特征提取在检测、分类等计算机视觉任务中发挥着重要作用。然而,目前缺少一种高效的可配置2-D卷积器设计方法,这限制了卷积神经网络(CNN)模型在边缘端的部署和应用。该文基于乘法管理以及奇平方数的三角数分解方法,提出一种高性能、高适应性的卷积核尺寸可配置的2-D卷积器。所提2-D卷积器包含一定数量的处理单元(PE)以及相应的控制单元,前者负责运算任务,后者负责管理乘法运算的组合,二者结合以实现不同尺寸的卷积。具体地,首先根据应用场景确定一个奇数列表,列表中为2-D卷积器所支持的尺寸,并利用三角数分解得到对应的三角数列表;其次,根据三角数列表和计算需求,确定PE的总数量;最后,基于以小凑大的方法,确定PE的互连方式,完成电路设计。该可配置2-D卷积器通过Verilog硬件描述语言(HDL)设计实现,由Vivado 2 022.2在XCZU7EG板卡上进行仿真和分析。实验结果表明,相比同类方法,该文所提可配置2-D卷积器,乘法资源利用率得到显著提升,由20%~50%提升至89%,并以514个逻辑单元实现1 500 MB/s的吞吐率,具有广泛的适用性。 展开更多
关键词 2-D卷积器 可配置架构 乘法管理 三角分解
下载PDF
长三角城市群经济韧性测度与分析——基于Shift-Share的经济韧性分解
2
作者 王欢芳 陈素月 《兰州财经大学学报》 2024年第2期48-61,共14页
以长三角城市群27个城市为研究对象,测度2008—2010年抵抗期和2010—2019年恢复期城市群经济韧性水平,并进一步运用Shift-Share分解方法探索长三角城市群经济韧性内在影响机制。研究显示:抵抗期和恢复期中长三角城市群经济韧性均值分别... 以长三角城市群27个城市为研究对象,测度2008—2010年抵抗期和2010—2019年恢复期城市群经济韧性水平,并进一步运用Shift-Share分解方法探索长三角城市群经济韧性内在影响机制。研究显示:抵抗期和恢复期中长三角城市群经济韧性均值分别为0.309和0.301,均强于全国层面经济韧性水平;Shift-Share分解后发现竞争力分量对各城市经济韧性水平提升起到决定性作用,抵抗期阶段主要由第二、三产业共同作用影响经济韧性水平;恢复期阶段则以第二产业竞争力为主导力量,同时以第三产业竞争力作为辅助力量。通过实证探究长三角城市群经济一体化发展的规律和特点,为增强中国经济韧性提出相关建议,助力中国经济高质量发展。 展开更多
关键词 三角城市群 经济韧性 Shift-Share分解 产业结构 竞争力
下载PDF
珠三角区域出口贸易隐含碳的测算与分解——基于投入产出模型和结构分解的实证分析
3
作者 周泽炯 张葆俊 +1 位作者 张浩浩 王崯浩 《山西大同大学学报(自然科学版)》 2024年第1期63-71,共9页
首先基于2016—2020年珠三角数据,运用投入产出法测算出口贸易隐含碳的排放量,然后通过SDA分解模型,从规模、结构和技术三个层面分析了主要影响因子。结果表明:2016年起珠三角净输入量呈现下降的趋势;从分部门出口贸易隐含碳结构分解可... 首先基于2016—2020年珠三角数据,运用投入产出法测算出口贸易隐含碳的排放量,然后通过SDA分解模型,从规模、结构和技术三个层面分析了主要影响因子。结果表明:2016年起珠三角净输入量呈现下降的趋势;从分部门出口贸易隐含碳结构分解可知,规模效应整体呈现出快速上升—达到高峰—逐渐减少的三个阶段;部门结构效应的大部分效益值为负,说明珠三角区域的产业结构较为合理,可以有效地抑制碳排放的增长。鉴于此,认为珠三角地区应当优化进出口产品结构,加大绿色低碳技术创新力度,鼓励区域间合作减排。 展开更多
关键词 投入产出模型 SDA结构分解模型 三角区域 出口贸易
下载PDF
基于LU分解的安全外包求解线性代数方程组方法
4
作者 冯达 周福才 +1 位作者 吴淇毓 李鲍 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第4期457-463,506,共8页
由于现有协议的安全性为基于某种安全假设的计算安全,依赖于敌手的计算能力,因此,本文针对恶意敌手模型,使用矩阵伪装技术对方程的系数矩阵进行隐藏,结合矩阵的LU分解(lower-upper decomposition)算法,提出一种新的信息论安全外包求解... 由于现有协议的安全性为基于某种安全假设的计算安全,依赖于敌手的计算能力,因此,本文针对恶意敌手模型,使用矩阵伪装技术对方程的系数矩阵进行隐藏,结合矩阵的LU分解(lower-upper decomposition)算法,提出一种新的信息论安全外包求解线性代数方程组(information-theoretically secure outsourcing of linear algebraic equations,ITS-OutsLAE)方法 .与之前的研究相比,在保持计算和通信复杂度与现有最优方案保持一致的同时,首次将方程组唯一解的安全性提升至信息论安全(完美保密).给出了形式化的安全性证明,并通过理论分析和实验证明了所提方法的实用性. 展开更多
关键词 线性代数方程组 信息论安全 安全外包 lu分解 恶意敌手模型
下载PDF
不含4-圈和三角化6-圈的环面图森林分解
5
作者 李玲静 陈敏 《浙江师范大学学报(自然科学版)》 CAS 2024年第4期391-397,共7页
假设G是一个有限简单图.令V(G)和E(G)分别表示图G的点集合和边集合.若能将G的点集合V(G)划分为2个不交的子集合V_(1)和V_(2),使得由V_(1)和V_(2)导出的子图满足G[V_(1)]是森林且G[V_(2)]是最大度至多为d的森林,则称G有一个(F,F_(d))-分... 假设G是一个有限简单图.令V(G)和E(G)分别表示图G的点集合和边集合.若能将G的点集合V(G)划分为2个不交的子集合V_(1)和V_(2),使得由V_(1)和V_(2)导出的子图满足G[V_(1)]是森林且G[V_(2)]是最大度至多为d的森林,则称G有一个(F,F_(d))-分解.运用反证法,通过对极小反例的结构分析,找到可约构形,再通过权转移讨论证明:不含4-圈和三角化6-圈的环面图有(F,F_(3))-分解. 展开更多
关键词 环面图 三角 森林分解 最大度 权转移
下载PDF
基于鲲鹏处理器的LU并行分解优化算法
6
作者 徐鹤 周涛 +2 位作者 李鹏 秦芳芳 季一木 《计算机科学》 CSCD 北大核心 2024年第9期51-58,共8页
ScaLAPACK(Scalable Linear Algebra PACKage)是并行计算软件包,适用于分布式存储的MIMD(Multiple Instruction,Multiple Data)并行计算机,被广泛应用于基于线性代数运算的并行应用程序开发。然而在进行LU分解过程中,ScaLAPACK库中的例... ScaLAPACK(Scalable Linear Algebra PACKage)是并行计算软件包,适用于分布式存储的MIMD(Multiple Instruction,Multiple Data)并行计算机,被广泛应用于基于线性代数运算的并行应用程序开发。然而在进行LU分解过程中,ScaLAPACK库中的例程并不是通信最优的,没有充分利用当前的并行架构。针对上述问题,提出一种基于鲲鹏处理器的LU并行分解优化算法(Parallel LU Factorization,PLF),实现了负载均衡,适配国产鲲鹏环境。PLF对不同进程的不同分区的数据进行差异化处理,并将每个进程所拥有的部分数据分配给根进程进行计算,之后再由根进程散播回各个子进程,这有利于充分利用CPU资源,实现负载均衡。在单节点Intel 9320R处理器以及鲲鹏(Kunpeng)920处理器环境中进行测试,其中,Intel平台下使用Intel MKL(Math Kernel Library),Kunpeng平台下使用PLF算法。对比两个平台关于不同规模的方程组求解的性能发现,Kunpeng平台的求解性能有显著优势。在NUMA数进程和单线程的情况下,优化后的计算效率在小规模平均达到4.35%,相比Intel的1.38%提升了215%;中规模平均达到4.24%,相比Intel平台的1.86%提升了118%;大规模平均达到4.24%,相比Intel的1.99%提升了113%。 展开更多
关键词 SCALAPACK lu分解 并行计算 MKL
下载PDF
基于迪氏指数分解与地理加权回归的长三角碳排放研究
7
作者 刘煜 满吉成 《甘肃科技》 2024年第6期45-50,共6页
温室气体的排放在一定程度上阻碍了中国经济的可持续发展,研究碳排放的空间特征与影响因素对于“双碳”目标的实现有重要意义。文章基于迪氏指数分解法与地理加权回归模型,研究长三角城市群的碳排放空间分布特征与影响因素,以期为长三... 温室气体的排放在一定程度上阻碍了中国经济的可持续发展,研究碳排放的空间特征与影响因素对于“双碳”目标的实现有重要意义。文章基于迪氏指数分解法与地理加权回归模型,研究长三角城市群的碳排放空间分布特征与影响因素,以期为长三角实现高质量发展提供参考。研究结果表明,长三角城市群的碳排放量呈现西北沿海地区高于东南沿海地区高于未沿海地区的空间特征,主要受人口规模、经济发展、能源消费结构、能源消费强度的影响,碳排放量的增速与城市的经济、工业、人口等密切相关,减少使用化石能源能有效降低碳排放。 展开更多
关键词 碳排放 空间特征 迪氏指数分解 地理加权回归 三角
下载PDF
长三角产业合作区碳排放时空特征及影响因素
8
作者 杜少娟 刘臣炜 +3 位作者 姚国慧 王楠 李海东 张龙江 《生态与农村环境学报》 北大核心 2025年第1期41-51,共11页
长三角产业合作区(简称“一地六县”产业合作区)是长三角三省一市唯一无缝衔接天然板块,系统分析地区碳排放时空异质性,探究其影响机理,对于构建区域间减碳协作机制、一体化推进“双碳”战略,实现长三角绿色低碳高质量发展具有重要意义... 长三角产业合作区(简称“一地六县”产业合作区)是长三角三省一市唯一无缝衔接天然板块,系统分析地区碳排放时空异质性,探究其影响机理,对于构建区域间减碳协作机制、一体化推进“双碳”战略,实现长三角绿色低碳高质量发展具有重要意义。本文基于2010—2020年地区碳排放时空序列数据,应用对数迪氏平均指数法(LMDI)和基于岭回归估计的STIRPAT模型,研究地区碳排放驱动因素。结果表明:(1)“一地六县”产业合作区碳排放总量和人均碳排放量整体呈现波动上升趋势,其中,宜兴市碳排放量最高,郎溪县最低,除长兴县碳排放量波动下降之外,其余县(市)保持低幅度波动增长。各地区碳排放强度逐年降低,郎溪县和广德市处于高位,安吉县和长兴县处于中位,宜兴市和溧阳市处于低位,产业经济转型发展越好的地区碳排放强度越低。(2)2010—2020年,能源消费强度、产业结构对地区碳排放呈现负向抑制效应,分别促使碳排放减少2 536.27和266.62万t,而经济产出、人口规模、能源结构呈现正向助推效应,分别造成碳排放升高3 525.86、48.26和669.19万t。(3)经济产出、能源消费强度和能源结构是影响各县(市)碳排放变化的主导因素,能源结构、经济产出和能源消费强度因素每增加1%,碳排放量随之分别改变7.72%、0.61%和-0.000 4%。在长三角区域一体化发展上升为国家战略的时代背景下,“一地六县”产业合作区可从加强区域协同减排、优化能源结构和经济低碳化发展等方面对碳排放进行控制,逐步推进区域一体化绿色低碳发展。 展开更多
关键词 三角产业合作区 碳排放 LMDI分解 STIRPAT模型
下载PDF
不完全LU分解预处理的BICGSTAB算法在大地电磁二维正演模拟中的应用 被引量:50
9
作者 柳建新 蒋鹏飞 +3 位作者 童孝忠 徐凌华 谢维 王浩 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第2期484-491,共8页
基于双二次插值的有限单元法求解大地电磁二维正演问题,以不均匀网格剖分为基础,推导出大地电磁响应的计算公式。针对有限单元法最后形成一个线性方程组,系数矩阵是大型稀疏的带状对称正定复系数矩阵,并且其条件数远大于1,为严重病态矩... 基于双二次插值的有限单元法求解大地电磁二维正演问题,以不均匀网格剖分为基础,推导出大地电磁响应的计算公式。针对有限单元法最后形成一个线性方程组,系数矩阵是大型稀疏的带状对称正定复系数矩阵,并且其条件数远大于1,为严重病态矩阵,求解其对应方程组会遇到很多困难等问题,采用不完全LU分解(即上三角与下三角分解)处理的稳定双共轭梯度算法(BICGSTAB算法)求解该线性方程组,通过对层状介质和二维模型电磁响应进行计算,获得二维大地电磁的视电阻率曲线和阻抗相位曲线。研究结果表明,BICGSTAB算法具有速度快、精度高和稳定性好等优点。 展开更多
关键词 大地电磁 有限单元法 二维正演 不完全lu分解 BICGSTAB算法
下载PDF
基于可重构计算系统的矩阵三角化分解硬件并行结构研究 被引量:6
10
作者 刘书勇 吴艳霞 +2 位作者 张博为 张国印 戴葵 《电子学报》 EI CAS CSCD 北大核心 2015年第8期1642-1650,共9页
可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩... 可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩阵三角化分解中共有的三角化计算过程,通过分析该过程的线性计算规律,提出一种适于硬件并行实现的子矩阵更新同一化算法及矩阵三角化计算FPGA(Field Programmable Gate Array)并行结构.针对LU矩阵三角化分解在并行结构模板上的高性能实现及优化方法开展了研究.理论分析表明,该算法针对矩阵三角化计算过程具有更高的数据并行性与流水并行性;实验结果表明,与通用处理器的软件实现相比,根据该算法实现的矩阵三角化分解FPGA并行结果在关键计算性能上可以取得10倍以上的加速比. 展开更多
关键词 矩阵三角分解 三角化过程 并行算法 lu分解 现场可编程门阵列
下载PDF
用于波场成像的谱法LU分解 被引量:9
11
作者 罗明秋 刘洪 李幼铭 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2003年第3期421-427,共7页
地震波场模拟和偏移成像等有限差分隐格式算法中的重要环节 ,是实现亥姆霍兹算子表示矩阵H的快速求逆运算 .在螺旋边界条件下 ,H具有Toeplitz结构的正定厄密矩阵 ,其快速求逆可由谱法LU分解实现 .本文分析了谱法LU分解对提高计算速度的... 地震波场模拟和偏移成像等有限差分隐格式算法中的重要环节 ,是实现亥姆霍兹算子表示矩阵H的快速求逆运算 .在螺旋边界条件下 ,H具有Toeplitz结构的正定厄密矩阵 ,其快速求逆可由谱法LU分解实现 .本文分析了谱法LU分解对提高计算速度的原理及特点 ,并着重讨论了在不同类型的介质模型中 ,采用谱法分解矩阵H时带来的数值误差、误差的分布及其对波场计算的影响 .研究结果表明 ,对均匀介质而言 ,矩阵H各列具有相同的非零元素分布 ,谱法LU分解的误差在吸收边界条件下 ,不影响波场模拟和成像计算 ;但对于非均匀介质模型 ,矩阵H各列具有不同的非零元素分布 ,谱法LU分解的误差随介质不均匀性程度的增大而增大 ,势必影响非均匀介质中波场计算 .在波场模拟和成像等有限差分隐格式算法中 ,采用谱法LU分解完成矩阵求逆时 ,必须考虑到并尽量减少该方法的误差对波场计算的影响 . 展开更多
关键词 波场成像 lu分解 谱因式分解 模拟
下载PDF
一种LU分解与迭代法的结合策略及算法实现 被引量:6
12
作者 李滨 郑赟 +2 位作者 叶以正 肖立伊 黄国勇 《计算机工程与设计》 CSCD 2002年第3期16-21,共6页
在矩阵求解算法中,直接法或迭代法都不能有效地求解大规模稀疏或病态矩阵,因此提出一种LU分解与迭代法结合的策略。采用LU分解对矩阵进行预处理,以提高迭代法的收敛性,并采用一种判断策略使矩阵的LU分解结果可最大限度地重复利用。此... 在矩阵求解算法中,直接法或迭代法都不能有效地求解大规模稀疏或病态矩阵,因此提出一种LU分解与迭代法结合的策略。采用LU分解对矩阵进行预处理,以提高迭代法的收敛性,并采用一种判断策略使矩阵的LU分解结果可最大限度地重复利用。此结合策略应用于两种共轭梯度(CG)法,得到CLUCG和CLUTCG两种算法。它们已应用于模拟和混合信号电路模拟器ZeniVDE中。大量实验结果表明此结合策略是很有效的,得到的两种算法具有较快的速度和较好的收敛性。 展开更多
关键词 矩阵求解 电路模拟 迭代法 结合算法 lu分解
下载PDF
基于矩阵LU分解的数字水印算法 被引量:11
13
作者 牛少彰 钮心忻 杨义先 《电子与信息学报》 EI CSCD 北大核心 2004年第10期1620-1625,共6页
该文提出了一种新的基于矩阵LU分解的数字水印算法.该方法首先将数字图像的非负矩阵表示转化为G-对角占优矩阵,再进行LU分解,通过量化函数进行数字水印的嵌入,恢复水印时不需要原始图像.将矩阵的LU分解数字水印算法与DCT的中频系数比较... 该文提出了一种新的基于矩阵LU分解的数字水印算法.该方法首先将数字图像的非负矩阵表示转化为G-对角占优矩阵,再进行LU分解,通过量化函数进行数字水印的嵌入,恢复水印时不需要原始图像.将矩阵的LU分解数字水印算法与DCT的中频系数比较法进行了对比实验.实验结果表明这种方法运算速度快并且具有很好的鲁棒性。 展开更多
关键词 信息隐藏 数字水印 lu分解
下载PDF
一种基于Doolittle LU分解的线性方程组并行求解方法 被引量:7
14
作者 徐晓飞 曹祥玉 +1 位作者 姚旭 陈盼 《电子与信息学报》 EI CSCD 北大核心 2010年第8期2019-2022,共4页
矩阵方程的快速求解是矩量法计算电大问题的关键,LU分解是求解线性方程组的有效方法。该文详细地分析了Doolittle LU分解过程,基于分解过程的特点,在MPI(Message-Passing interface)并行环境下,提出了按直角式循环对进程进行任务分配的... 矩阵方程的快速求解是矩量法计算电大问题的关键,LU分解是求解线性方程组的有效方法。该文详细地分析了Doolittle LU分解过程,基于分解过程的特点,在MPI(Message-Passing interface)并行环境下,提出了按直角式循环对进程进行任务分配的并行求解方法。实验证明该方法可以有效地减少进程间数据通信量,从而加快计算速度。 展开更多
关键词 Doolittle lu分解 线性方程组 并行计算
下载PDF
基于LU分解的稀疏目标定位算法 被引量:8
15
作者 赵春晖 许云龙 黄辉 《电子与信息学报》 EI CSCD 北大核心 2013年第9期2234-2239,共6页
针对基于orth的稀疏目标定位算法中orth预处理会影响原信号的稀疏性的问题,该文提出一种基于LU分解的稀疏目标定位算法。该算法通过网格化感知区域把目标定位问题转化为压缩感知问题,并利用LU分解法对观测字典进行分解得到新的观测字典... 针对基于orth的稀疏目标定位算法中orth预处理会影响原信号的稀疏性的问题,该文提出一种基于LU分解的稀疏目标定位算法。该算法通过网格化感知区域把目标定位问题转化为压缩感知问题,并利用LU分解法对观测字典进行分解得到新的观测字典。该观测字典有效地满足了约束等距性条件,同时对观测值的预处理过程不影响原信号的稀疏性,从而有效地保证了算法的重建性能,提升了算法的定位精度。实验结果表明,基于LU分解的稀疏目标定位算法的性能远优于基于orth的稀疏目标定位算法,目标的定位精度得到了较大地提升。 展开更多
关键词 无线传感器网络 目标定位 压缩感知 lu分解
下载PDF
基于LU分解的共轭梯度法单步成像算法 被引量:6
16
作者 王超 钱相臣 +1 位作者 徐明 王化祥 《仪器仪表学报》 EI CAS CSCD 北大核心 2007年第11期1972-1976,共5页
单步和迭代电容层析成像(ECT)图像重建算法分别具有成像质量差和成像速度慢的缺点,为了快速得到高质量的重建图像,本文提出了一种新型的基于LU分解的单步共轭梯度成像法。该方法首先将ECT物理模型进行规范化和Tikhonov正则化处理,进而... 单步和迭代电容层析成像(ECT)图像重建算法分别具有成像质量差和成像速度慢的缺点,为了快速得到高质量的重建图像,本文提出了一种新型的基于LU分解的单步共轭梯度成像法。该方法首先将ECT物理模型进行规范化和Tikhonov正则化处理,进而将LU分解的思想引入ECT方程的求解中,从而实现了单步图像重建。理论分析表明,该算法具有良好的单步收敛性。通过典型流型的仿真实验,证明了该算法可以获得优于反投影算法的重建图像。 展开更多
关键词 电容层析成像 lu分解 共轭梯度法 单步成像
下载PDF
LU分解和Laplace算法在GPU上的实现 被引量:9
17
作者 陈颖 林锦贤 吕暾 《计算机应用》 CSCD 北大核心 2011年第3期851-855,共5页
随着图形处理器(GPU)性能的大幅度提升以及可编程性的发展,已经有许多算法成功地移植到GPU上。LU分解和Laplace算法是科学计算的核心,但计算量往往很大,由此提出了一种在GPU上加速计算的方法。使用Nvidia公司的统一计算设备架构(CUDA)... 随着图形处理器(GPU)性能的大幅度提升以及可编程性的发展,已经有许多算法成功地移植到GPU上。LU分解和Laplace算法是科学计算的核心,但计算量往往很大,由此提出了一种在GPU上加速计算的方法。使用Nvidia公司的统一计算设备架构(CUDA)编程模型实现这两个算法,通过对CPU与GPU进行任务划分,同时利用GPU上的共享存储器提高数据访问速度,对GPU程序进行分支消除,并且对矩阵分段计算以达到加速计算的目的。实验结果表明,随着矩阵规模的增大,基于GPU的算法相对于基于CPU的算法具有良好的加速效果。 展开更多
关键词 图形处理器 lu分解 Laplace算法 统一计算设备架构 共享存储器
下载PDF
LU分解在众核结构仿真器上的指令级调度研究 被引量:5
18
作者 余磊 刘志勇 +1 位作者 宋风龙 叶笑春 《系统仿真学报》 CAS CSCD 北大核心 2011年第12期2603-2610,共8页
随着集成电路工艺的发展,众核处理器体系结构逐渐成为计算机体系结构设计者的研究热点。众核体系结构通过任务级的并行来提升整个处理器的性能。然而,指令级的并行性仍然是众核设计者需要认真考虑的问题。对浮点运算效率和加速比进行了... 随着集成电路工艺的发展,众核处理器体系结构逐渐成为计算机体系结构设计者的研究热点。众核体系结构通过任务级的并行来提升整个处理器的性能。然而,指令级的并行性仍然是众核设计者需要认真考虑的问题。对浮点运算效率和加速比进行了形式化描述,验证了进行指令级调度的必要性。对处理器核内流水线进行详细分析,指出了指令级调度的一般性问题。提出了在众核结构上使用指令级调度和软件流水的方法。针对Splash2程序集里的LU分解算法,使用众核结构的硬件支持,在Scratched Pad Memory(SPM)上给出了调度指令的方案。在众核仿真器Godson-T上仿真了经过指令级调度后的算法,当使用64个线程处理512×512的矩阵时,程序性能达到调度前性能的4倍。 展开更多
关键词 计算机体系结构 众核 加速比 指令级并行 lu分解
下载PDF
用不完全LU分解预处理的不精确潮流计算方法 被引量:32
19
作者 蔡大用 陈玉荣 《电力系统自动化》 EI CSCD 北大核心 2002年第8期11-14,共4页
详细讨论了不精确牛顿法求解潮流方程的问题 ,提出带部分填充量的不完全 LU分解方法是不精确牛顿法快速求解潮流的一种有效预处理方法。用结合这种预处理方法的不精确牛顿法对IEEE1 1 8节点的电力系统潮流进行了计算 ,结果表明这种算法... 详细讨论了不精确牛顿法求解潮流方程的问题 ,提出带部分填充量的不完全 LU分解方法是不精确牛顿法快速求解潮流的一种有效预处理方法。用结合这种预处理方法的不精确牛顿法对IEEE1 1 8节点的电力系统潮流进行了计算 ,结果表明这种算法比无填充量的不完全 展开更多
关键词 潮流计算 不精确牛顿法 不完全lu分解 GMRES方法 计算方法 电力系统
下载PDF
矩阵LU分解的容错并行算法设计与实现 被引量:3
20
作者 杜云飞 王攀峰 +2 位作者 富弘毅 周海芳 杨学军 《微电子学与计算机》 CSCD 北大核心 2008年第10期1-4,共4页
给出了容错并行算法的定义,提出了一种新的基于并行复算的容错并行算法.针对许多计算密集型任务中的矩阵LU分解设计了相应的基于并行复算的容错并行算法,并对设计的矩阵LU分解的容错并行算法的性能进行了评估并与checkpointing方法进行... 给出了容错并行算法的定义,提出了一种新的基于并行复算的容错并行算法.针对许多计算密集型任务中的矩阵LU分解设计了相应的基于并行复算的容错并行算法,并对设计的矩阵LU分解的容错并行算法的性能进行了评估并与checkpointing方法进行了对比.结果表明与checkpointing方法相比,矩阵LU分解的容错并行算法有性能上的优势. 展开更多
关键词 矩阵lu分解 并行算法 容错
下载PDF
上一页 1 2 44 下一页 到第
使用帮助 返回顶部