期刊文献+
共找到13篇文章
< 1 >
每页显示 20 50 100
求解大型矩阵特征值问题的并行块Davidson方法 被引量:2
1
作者 王顺绪 戴华 《南京航空航天大学学报》 EI CAS CSCD 北大核心 2007年第6期814-818,共5页
针对拥有共享内存的并行计算环境和微机网络并行计算环境,给出了求解大型稀疏对称矩阵部分极端特征对的并行块Davidson方法。该方法将矩阵A按行块分配到各处理器上,各处理器利用矩阵A的行块和投影子空间的正交基所组成矩阵V的行块进行运... 针对拥有共享内存的并行计算环境和微机网络并行计算环境,给出了求解大型稀疏对称矩阵部分极端特征对的并行块Davidson方法。该方法将矩阵A按行块分配到各处理器上,各处理器利用矩阵A的行块和投影子空间的正交基所组成矩阵V的行块进行运算,减少了处理机之间的通讯次数,实现了算法的并行计算。在微机网络并行计算环境和拥有共享内存并行计算环境IBMP650上的数值试验表明,该算法非常有效。 展开更多
关键词 对称矩阵 特征值问题 Davidson方法 并行块Davidson方法
下载PDF
并行块SAOR迭代算法及其收敛性
2
作者 李耀堂 刘庆兵 《昆明师范高等专科学校学报》 2001年第4期12-17,共6页
推广了解线性方程组的SAOR迭代算法 ,给出了并行块SAOR迭代算法 (简记为MBSAOR迭代法 )模型 ,并在系数矩阵为块H -矩阵的条件下 。
关键词 线性方程组 SAOR迭代算法 并行块 系数矩阵 H-矩阵 收敛性 MBSAOR迭代法
下载PDF
求解二阶常微分方程的并行块方法
3
作者 束学云 田红炯 《上海师范大学学报(自然科学版)》 2009年第6期580-587,共8页
主要研究二阶常微分方程初值问题y″(x)=f(x,y)的数值方法及其数值稳定性.构造了一类适用于并行计算的并行块方法,分析了该类方法的收敛性,得到其最低可达收敛阶.基于线性试验方程y″(x)=-λ2y,提出了并行块方法的P-稳定性定义,获得了... 主要研究二阶常微分方程初值问题y″(x)=f(x,y)的数值方法及其数值稳定性.构造了一类适用于并行计算的并行块方法,分析了该类方法的收敛性,得到其最低可达收敛阶.基于线性试验方程y″(x)=-λ2y,提出了并行块方法的P-稳定性定义,获得了二维、三维和四维并行块方法为P-稳定的充分条件.数值例子说明理论结果是正确的. 展开更多
关键词 二阶常微分方程 并行块方法 收敛阶 P-稳定性
下载PDF
求解常微分方程初值问题的并行块预估-校正方法
4
作者 沈赤 《计算机工程与设计》 CSCD 北大核心 1998年第1期48-51,共4页
针对多处理机系统构造了一类具有较高并行度的并行块预估-校正方法。在k=2,s=3的情况下,给出了一个具有四阶精度的并行计算公式,并讨论了该方法的稳定性。
关键词 并行块算法 常微分方程 初值问题
下载PDF
对称矩阵三对角化的有效并行块算法设计 被引量:3
5
作者 赵永华 迟学斌 +2 位作者 程强 陈江 赵涛 《数值计算与计算机应用》 CSCD 2006年第2期123-132,共10页
在矩阵数值计算中,块算法通常比非块算法更有效,但这也增加了并行算法设计和实现的难度.在广义稠密对称矩阵特征问题并行求解器中,并行块算法的构造可应用到正定对称矩阵的Choleski分解、对称矩阵的三对角化和回代转化(back-transiati... 在矩阵数值计算中,块算法通常比非块算法更有效,但这也增加了并行算法设计和实现的难度.在广义稠密对称矩阵特征问题并行求解器中,并行块算法的构造可应用到正定对称矩阵的Choleski分解、对称矩阵的三对角化和回代转化(back-transiation)操作中.本文将并行块算法的讨论集中在具有代表性的对称矩阵三对角化上,给出在非块存储方式下对称矩阵三对角化的并行块算法设计方法.分析块算法大小同矩阵规模和处理器数量的关系.在深腾6800上的试验表明,我们的算法具有很好的性能,并得到了比ScaLAPACK更高的性能. 展开更多
关键词 对称矩阵 并行块算法 三对角矩阵 特征值 加速比
原文传递
复杂流场的多块并行数值模拟 被引量:2
6
作者 杨树池 乔志德 《航空学报》 EI CAS CSCD 北大核心 2000年第2期191-192,共2页
关键词 飞行器 CFD EU3DMBK 三维无粘流场 并行
下载PDF
宏块并行可复用的H.264帧内解码器的VLSI结构设计 被引量:1
7
作者 兰旭光 李兴玉 +1 位作者 温灏 王志刚 《微电子学与计算机》 CSCD 北大核心 2014年第4期75-78,82,共5页
设计通用的宏块并行的H.264帧内解码次序,避免了解码时的数据冲突,进而设计了存储器及计算单元可复用的帧内预测宏块并行解码单元,在解码速度提高的同时,尽量避免了资源的开销.通过对设计的并行解码器速度的测试及DC综合的结果,验证了... 设计通用的宏块并行的H.264帧内解码次序,避免了解码时的数据冲突,进而设计了存储器及计算单元可复用的帧内预测宏块并行解码单元,在解码速度提高的同时,尽量避免了资源的开销.通过对设计的并行解码器速度的测试及DC综合的结果,验证了设计的可复用的宏块并行帧内解码器的VLSI结构有效性,每个宏块解码平均速度到达了113cycles. 展开更多
关键词 并行 帧内解码器 大规模集成电路 H 264
下载PDF
多块网格网络并行计算中的负载分配研究 被引量:3
8
作者 李育斌 杨树池 乔志德 《空气动力学学报》 CSCD 北大核心 2001年第3期271-276,共6页
针对CFD中多块网格计算的特点 ,并使用MPI网络并行系统 ,对某战斗机绕流进行了基于三维Euler方程的并行计算。主要研究了多块网格并行计算中负载的分配方法 ,发展了负载自动分配和网格自动重分区程序。计算结果表明 :并行计算结果和实... 针对CFD中多块网格计算的特点 ,并使用MPI网络并行系统 ,对某战斗机绕流进行了基于三维Euler方程的并行计算。主要研究了多块网格并行计算中负载的分配方法 ,发展了负载自动分配和网格自动重分区程序。计算结果表明 :并行计算结果和实验结果完全吻合 ,8个节点机的并行效率达到了 89%。 展开更多
关键词 EULER方程 计算流体力学 MPI 负载均衡 CFD 战斗机绕流 网格网络并行计算
下载PDF
一种并行出块的区块链共识算法 被引量:2
9
作者 邵黑龙 于瓅 《阜阳师范大学学报(自然科学版)》 2022年第2期85-90,共6页
针对实用拜占庭容错(Practical Byzantine Fault Tolerance,PBFT)共识算法只能串行的共识区块,从而导致共识效率低的问题,研究提出了并行出块的多节点实用拜占庭容错(Multi-node Practical Byzantine Fault Tolerance MPBFT)共识算法。... 针对实用拜占庭容错(Practical Byzantine Fault Tolerance,PBFT)共识算法只能串行的共识区块,从而导致共识效率低的问题,研究提出了并行出块的多节点实用拜占庭容错(Multi-node Practical Byzantine Fault Tolerance MPBFT)共识算法。首先,通过多节点并行生成事务块提高共识吞吐量。其次,主节点将所有通过提议阶段的事务块的哈希值打包成索引块进行确认,减少了确认阶段节点间的通信次数,并且索引块的共识保证了账本的全局顺序。最后,优化了视图转换机制。算法分析及实验结果表明,MPBFT算法在共识效率上优于PBFT算法。 展开更多
关键词 共识算法 PBFT 并行
下载PDF
对称矩阵三对角化的混合并行算法设计 被引量:3
10
作者 赵永华 迟学斌 陈江 《计算机工程》 EI CAS CSCD 北大核心 2005年第22期39-41,53,共4页
基于Householder转换,给出了稠密对称矩阵三对角化的MPI+OpenMP混合并行算法。内容集中在SMP集群系统环境下算法的负载平衡、通信开销和性能评价。OpenMP共享内存并行采用了粗粒度方法,解决了MPI算法中的负载平衡问题,降低了通信开销。... 基于Householder转换,给出了稠密对称矩阵三对角化的MPI+OpenMP混合并行算法。内容集中在SMP集群系统环境下算法的负载平衡、通信开销和性能评价。OpenMP共享内存并行采用了粗粒度方法,解决了MPI算法中的负载平衡问题,降低了通信开销。在深腾6800上的试验结果表明,MPI+OpenMP版本比纯MPI版本具有更好的性能和可扩展性。 展开更多
关键词 对称矩阵 并行块算法 三对角矩阵 加速比 MPI+OPENMP
下载PDF
基于混合空洞卷积和注意力多尺度网络的残饵密度估计
11
作者 张丽珍 李延天 +3 位作者 李志坚 孟雄栋 张永琪 吴迪 《农业工程学报》 EI CAS CSCD 北大核心 2024年第14期137-145,共9页
及时、准确地估算饵料盘中残留饲料量是提高养殖效益的重要措施。针对虾类养殖场景下残饵检测模型复杂度高、计数精度低的问题,提出了一种基于混合空洞卷积和注意力多尺度网络(hybrid dilated convolution and attention multi-scale ne... 及时、准确地估算饵料盘中残留饲料量是提高养殖效益的重要措施。针对虾类养殖场景下残饵检测模型复杂度高、计数精度低的问题,提出了一种基于混合空洞卷积和注意力多尺度网络(hybrid dilated convolution and attention multi-scale network,HAMNet)的残饵密度估计方法。首先,借鉴MCNN(multi-column convolutional neural network)多列架构的思想设计并行卷积块(parallel convolution block,PCB),使网络在单列架构中提取多种尺度的残饵特征,简化了网络结构并减轻了计算量;同时为了弥补网络结构简化造成残饵特征表示能力略有不足的问题,引入混合空洞卷积块(hybrid dilated convolution block,HDCB)避免信息丢失并增大感受野,增强模型深入挖掘多尺度残饵信息的能力。其次,在网络中嵌入通道注意力机制(channel attention mechanism,CAM),利用通道之间的相互依赖性重新校准有用特征信息的权重,凸显目标与背景的差异性。最后,针对下采样导致密度图质量差的问题,应用可学习的转置卷积恢复特征图细节信息,进而提升模型计数性能。利用饵料盘条件下采集的残饵图像进行了验证,试验结果表明,与基准模型MCNN相比,HAMNet模型的平均绝对误差、均方根误差和计算量分别降低了44.4%、40.8%和13.7%,参数量仅为0.52 MB。与经典密度估计模型CMTL(cascaded multi-task learning)、SANet(scale aggregation network)、CSRNet(congested scene recognition network)相比,该模型在各项性能指标上保持了最佳平衡,明显处于优势。该研究可为人工智能在水产养殖中快速量化残饵提供参考。 展开更多
关键词 水产养殖 模型 残饵 密度估计 并行卷积 混合空洞卷积 通道注意力机制 转置卷积
下载PDF
30Gbit/s Parallel Optical Receiver Module
12
作者 陈弘达 贾九春 +1 位作者 裴为华 唐君 《Journal of Semiconductors》 EI CAS CSCD 北大核心 2006年第4期696-699,共4页
A 30Gbit/s receptor module is developed with a CMOS integrated receiver chip(IC) and a GaAs-based 1 × 12 photo detector array of PIN-type. Parallel technology is adopted in this module to realize a high-speed r... A 30Gbit/s receptor module is developed with a CMOS integrated receiver chip(IC) and a GaAs-based 1 × 12 photo detector array of PIN-type. Parallel technology is adopted in this module to realize a high-speed receiver module with medium speed devices. A high-speed printed circuit board(PCB) is designed and produced. The IC chip and the PD array are packaged on the PCB by chip-on-board technology. Flip chip alignment is used for the PD array accurately assembled on the module so that a plug-type optical port is built. Test results show that the module can receive parallel signals at 30Gbit/s. The sensitivity of the module is - 13.6dBm for 10^-13 BER. 展开更多
关键词 receiver module PARALLEL PD array
下载PDF
Towards adaptable and tunable cloud-based map-matching strategy for GPS trajectories 被引量:2
13
作者 Aftab Ahmed CHANDIO Nikos TZIRITAS +2 位作者 Fan ZHANG Ling YIN Cheng-Zhong XU 《Frontiers of Information Technology & Electronic Engineering》 SCIE EI CSCD 2016年第12期1305-1319,共15页
Smart cities have given a significant impetus to manage traffic and use transport networks in an intelligent way. For the above reason, intelligent transportation systems (ITSs) and location-based services (LBSs) ... Smart cities have given a significant impetus to manage traffic and use transport networks in an intelligent way. For the above reason, intelligent transportation systems (ITSs) and location-based services (LBSs) have become an interesting research area over the last years. Due to the rapid increase of data volume within the transportation domain, cloud environment is of paramount importance for storing, accessing, handling, and processing such huge amounts of data. A large part of data within the transportation domain is produced in the form of Global Positioning System (GPS) data. Such a kind of data is usually infrequent and noisy and achieving the quality of real-time transport applications based on GPS is a difficult task. The map-matching process, which is responsible for the accurate alignment of observed GPS positions onto a road network, plays a pivotal role in many ITS applications. Regarding accuracy, the performance of a map-matching strategy is based on the shortest path between two consecutive observed GPS positions. On the other extreme, processing shortest path queries (SPQs) incurs high computational cost. Current map-matching techniques are approached with a fixed number of parameters, i.e., the number of candidate points (NCP) and error circle radius (ECR), which may lead to uncertainty when identifying road segments and either low-accurate results or a large number of SPQs. Moreover, due to the sampling error, GPS data with a high-sampling period (i.e., less than 10 s) typically contains extraneous datum, which also incurs an extra number of SPQs. Due to the high computation cost incurred by SPQs, current map-matching strategies are not suitable for real-time processing. In this paper, we propose real-time map-matching (called RT-MM), which is a fully adaptive map-matching strategy based on cloud to address the key challenge of SPQs in a map-matching process for real-time GPS trajectories. The evaluation of our approach against state-of-the-art approaches is performed through simulations based on both synthetic and real-word datasets. 展开更多
关键词 Map-matching GPS trajectories Tuning-based Cloud computing Bulk synchronous parallel
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部