期刊文献+
共找到3,466篇文章
< 1 2 174 >
每页显示 20 50 100
地形分析中坡度坡向算法并行化方法研究 被引量:10
1
作者 江岭 刘学军 +1 位作者 汤国安 宋效东 《计算机工程与科学》 CSCD 北大核心 2013年第4期18-23,共6页
数字地形分析(DTA)是在DEM上进行地形属性计算和特征提取的数字信息处理技术,广泛应用于各行各业。在分析地形分析中坡度坡向串行算法特征的基础上,对坡度坡向算法的并行化进行了深入研究。从数据并行的角度,对算法的数据拆分、结果融合... 数字地形分析(DTA)是在DEM上进行地形属性计算和特征提取的数字信息处理技术,广泛应用于各行各业。在分析地形分析中坡度坡向串行算法特征的基础上,对坡度坡向算法的并行化进行了深入研究。从数据并行的角度,对算法的数据拆分、结果融合及I/O策略进行了分析,构建了坡度坡向算法并行化方法。实验结果表明,本文提出的并行化方法可以有效对坡度坡向串行算法进行并行化改造,大幅度提高了算法的执行效率,具有较好的并行性能。方法的提出和实现亦可为类似矩阵型数据算法的并行化提供参考。 展开更多
关键词 数字地形分析 数字高程模型 坡度坡向 算法并行
下载PDF
基于MapReduce的Apriori算法并行化 被引量:13
2
作者 林长方 吴扬扬 +1 位作者 黄仲开 曾少俊 《江南大学学报(自然科学版)》 CAS 2014年第4期411-415,共5页
Apriori是挖掘关联规则最经典的算法之一,针对该算法存在的瓶颈问题研究了基于MapReduce编程框架的简单Apriori并行算法;并在简单Apriori并行算法的基础上提出一种采用固定多阶段结合挖掘策略的改进算法——多阶段并行算法。实验结果表... Apriori是挖掘关联规则最经典的算法之一,针对该算法存在的瓶颈问题研究了基于MapReduce编程框架的简单Apriori并行算法;并在简单Apriori并行算法的基础上提出一种采用固定多阶段结合挖掘策略的改进算法——多阶段并行算法。实验结果表明,改进算法能缩短挖掘时间,提高执行的效率。 展开更多
关键词 云计算 多阶段并行算法 APRIORI算法
下载PDF
面向流数据的决策树分类算法并行化 被引量:16
3
作者 季一木 张永潘 +2 位作者 郎贤波 张殿超 王汝传 《计算机研究与发展》 EI CSCD 北大核心 2017年第9期1945-1957,共13页
随着云计算、物联网等技术的兴起,流数据作为一种新型的大数据形态广泛存在于电信、互联网、金融等领域.与传统静态数据相比,大数据环境下的流数据具有快速、连续和随时间变化等特点.同时数据流的隐含分布变化会带来概念漂移问题.为了... 随着云计算、物联网等技术的兴起,流数据作为一种新型的大数据形态广泛存在于电信、互联网、金融等领域.与传统静态数据相比,大数据环境下的流数据具有快速、连续和随时间变化等特点.同时数据流的隐含分布变化会带来概念漂移问题.为了适应大数据环境下流数据分类算法的要求,必须对传统的静态离线数据分类算法进行改进,提出基于分布式计算平台Storm的P-HT并行化算法.算法在满足Storm流处理平台要求基础上,通过滑动窗口机制、替代子树机制和并行化处理,提高了算法的灵活性和通用性,并且能良好地适应数据流的概念漂移.最后通过实验验证该算法的有效性和高效性,结果表明在与传统C4.5算法相比精度没有降低的情况下,改进的P-HT算法具有更大的吞吐量和更快的处理速度. 展开更多
关键词 流数据 分类算法 Storm平台 滑动窗口 C4.5算法 并行算法
下载PDF
CPU+GPU异构平台的一致性图像配准算法并行实现 被引量:1
4
作者 易见兵 陈国良 杨烜 《小型微型计算机系统》 CSCD 北大核心 2014年第1期114-120,共7页
针对标志点一致性图像配准算法收敛时间较长问题,提出在CPU+GPU异构平台上的并行实现方法。该方法在GPU上完成了一致性图像配准算法中的弹性变换求解及逆函数求解的并行实现,在CPU上实现变量初始化以及迭代更新等过程,充分利用异构平台... 针对标志点一致性图像配准算法收敛时间较长问题,提出在CPU+GPU异构平台上的并行实现方法。该方法在GPU上完成了一致性图像配准算法中的弹性变换求解及逆函数求解的并行实现,在CPU上实现变量初始化以及迭代更新等过程,充分利用异构平台优势,提高该算法的运行效率。实验结果表明该并行实现方法可以获得较高的加速比. 展开更多
关键词 GPU 加速比 图像配准 并行算法
下载PDF
分批处理的K-means算法并行实现 被引量:2
5
作者 兰远东 刘宇芳 徐涛 《计算机工程》 CAS CSCD 2012年第13期145-147,151,共4页
为解决K-means算法计算量大、收敛缓慢、运算耗时长等问题,给出一种新的K-means算法的并行实现方法。在通用计算图形处理器架构上,使用统一计算设备架构(CUDA)加速K-means算法。采用分批原则,更合理地运用CUDA提供的各种存储器,避免访... 为解决K-means算法计算量大、收敛缓慢、运算耗时长等问题,给出一种新的K-means算法的并行实现方法。在通用计算图形处理器架构上,使用统一计算设备架构(CUDA)加速K-means算法。采用分批原则,更合理地运用CUDA提供的各种存储器,避免访问冲突,同时减少对数据集的访问次数,以提高算法效率。在大规模数据集中的实验结果表明,该算法具有较快的聚类速度。 展开更多
关键词 数据挖掘 K-MEANS算法 统一计算设备架构 并行算法 聚类分析 图形处理器
下载PDF
基于通用计算平台SM4-CTR算法并行实现与优化 被引量:3
6
作者 李晓东 胡一鸣 +2 位作者 池亚平 钱榕 张健毅 《密码学报》 CSCD 2022年第4期663-676,共14页
随着大数据、云计算、5G通信技术的迅速发展,数据传输安全问题日益凸显,密码算法的设计和高效实现变得尤为重要,能高速运行的国产密码算法已成为保护国家安全的关键.与此同时,原本只用于图像计算的硬件GPU,在编程模型CUDA发布后就成为... 随着大数据、云计算、5G通信技术的迅速发展,数据传输安全问题日益凸显,密码算法的设计和高效实现变得尤为重要,能高速运行的国产密码算法已成为保护国家安全的关键.与此同时,原本只用于图像计算的硬件GPU,在编程模型CUDA发布后就成为通用的、普及化的算力资源.本文基于通用的计算机平台,提出了利用其本地GPU进行CTR工作模式下SM4算法高速加解密的并行实现和优化方案.实验表明,本文提出的SM4-CTR并行加解密方案能够有效提高SM4算法的运行效率,在通用的计算机平台上,能够达到40倍加速比,加解密速率达到了14.192 Gbps.实验中还分析了线程块划分对GPU并行加速效果的影响,最优线程块大小为128到512,且必须为32的整倍数.最后,基于本文实验的结果与其他团队的优化SM4方案进行对比,包括传统工作模式下利用CPU、GPU优化的方案和利用软件快速实现的方案,对比结果显示即便之前团队的方案运行的平台硬件条件好于本文实验环境,文中提出的方案运行速率依然能做到大幅领先.因此,本文方案在安全性、运算速率提高的同时适用平台也更加广泛,在实际生活中针对大数据和个人数据的安全保护中必将发挥巨大的作用. 展开更多
关键词 SM4算法 CTR模式 CUDA GPU加速 并行算法 通用计算机平台
下载PDF
基于Cortex嵌入式多处理器系统的图像中值滤波算法并行化的研究 被引量:1
7
作者 廖文献 黄兴利 《计算机系统应用》 2017年第2期168-173,共6页
嵌入式系统在图像处理、空间计算等领域越来越广泛,如何在功耗、成本和计算能力三个主要方面取得平衡,利用多核和多处理器系统以并行计算方式提高嵌入式系统计算能力是一种有效的解决方案.讨论了基于Cortex嵌入式多处理器系统的基本结构... 嵌入式系统在图像处理、空间计算等领域越来越广泛,如何在功耗、成本和计算能力三个主要方面取得平衡,利用多核和多处理器系统以并行计算方式提高嵌入式系统计算能力是一种有效的解决方案.讨论了基于Cortex嵌入式多处理器系统的基本结构,并在该系统上进行图像中值滤波算法的并行化研究.实验结果分析表明,在该嵌入式多处理器平台上配合并行算法能够成倍提高图像中值滤波的运行性能. 展开更多
关键词 Cortex架构 多处理器系统 中值滤波 并行算法
下载PDF
基于多核并行遗传算法并行生成测试用例 被引量:1
8
作者 陈清媛 钟诚 李智 《微电子学与计算机》 CSCD 北大核心 2013年第11期149-153,共5页
通过将种群划分为多个子种群,对每个子种群执行遗传操作,p个核心并行执行遗传算法搜索测试路径,以加速测试用例的生成;通过在处理核心之间迁移子种群的个体,使得交叉变异后得到的种群个体变得丰富,算法能更好地全局寻优,可以寻找到较多... 通过将种群划分为多个子种群,对每个子种群执行遗传操作,p个核心并行执行遗传算法搜索测试路径,以加速测试用例的生成;通过在处理核心之间迁移子种群的个体,使得交叉变异后得到的种群个体变得丰富,算法能更好地全局寻优,可以寻找到较多能够覆盖全部路径的测试用例.实验结果表明,与基于串行遗传算法生成测试用例相比,多核并行遗传算法并行生成测试用例能够生成较多覆盖全都路径的测试用例且运行时间少. 展开更多
关键词 测试用例生成 并行遗传算法 多核系统 线程级并行
下载PDF
DFT算法并行性分析与实现研究
9
作者 胡辉 刘建辉 《航天控制》 CSCD 北大核心 2007年第6期62-65,69,共5页
针对离散Fourier变换(DFT)在实时信号处理中具有广泛应用、而其运算速度又受到DSP器件性能限制的情况,进行了DFT的并行性研究及并行性能分析;并在基于并行多处理机平台-TMS320C80的编程结构基础上,实现了两种并行DFT算法。基于TMS320C8... 针对离散Fourier变换(DFT)在实时信号处理中具有广泛应用、而其运算速度又受到DSP器件性能限制的情况,进行了DFT的并行性研究及并行性能分析;并在基于并行多处理机平台-TMS320C80的编程结构基础上,实现了两种并行DFT算法。基于TMS320C80进行的试验表明:所开发的并行DFT算法的运行结果与理论分析吻合,该并行算法的速度和精度都得到了保证。 展开更多
关键词 DFT 并行算法 紧耦合多处理机 TMS320C80
下载PDF
动态环拓扑多机系统上DBP学习算法并行计算模型的构造与实现
10
作者 管惠维 《软件学报》 EI CSCD 北大核心 1996年第2期111-118,共8页
人工神经网络模型的软件模拟,其并行算法的设计、实现及性能评价对于神经网络计算机和各种专用神经网络VLSI芯片的研制具有十分重要的意义.本文首先构造了一个分布式存储器、信息传递方式的多机系统作为软件模拟人工神经网络的平... 人工神经网络模型的软件模拟,其并行算法的设计、实现及性能评价对于神经网络计算机和各种专用神经网络VLSI芯片的研制具有十分重要的意义.本文首先构造了一个分布式存储器、信息传递方式的多机系统作为软件模拟人工神经网络的平台,并用一个环拓扑结构的多Transputer网络予以实现.接着提出并实现了一个适用于动态环拓扑形式的DBP并行计算模型,它主要包括神经元的划分和映射策略;DBP中活性值、误差反向传播及权值修改的多机并行算法.然后讨论该DBP算法的时间复杂度和加速比. 展开更多
关键词 神经网络 学习算法 并行算法 环拓扑 多机系统
下载PDF
融合遗传和蚁群算法并行求解最短公共超串
11
作者 伍世刚 钟诚 《计算机应用》 CSCD 北大核心 2014年第7期1857-1861,1866,共6页
依据各级缓存容量,将CPU主存中种群个体和蚂蚁个体数据划分存储到一级、二级和三级缓存中,以减少并行计算过程中数据在各级存储之间的传输开销,在CPU与GPU之间采取异步传送和不完全传送数据、GPU多个内核函数异步执行多个流的方法,设置G... 依据各级缓存容量,将CPU主存中种群个体和蚂蚁个体数据划分存储到一级、二级和三级缓存中,以减少并行计算过程中数据在各级存储之间的传输开销,在CPU与GPU之间采取异步传送和不完全传送数据、GPU多个内核函数异步执行多个流的方法,设置GPU block线程数量为16的倍数、GPU共享存储器划分大小为32倍的bank,使用GPU常量存储器存储交叉概率、变异概率等需频繁访问的只读参数,将输入串矩阵和重叠部分长度矩阵只读大数据结构绑定到GPU纹理存储器,设计实现了一种多核CPU和GPU协同求解最短公共超串问题的计算、存储和通信高效的并行算法。求解多种规模的最短公共超串问题的实验结果表明,多核CPU与GPU协同并行算法比串行算法快70倍以上。 展开更多
关键词 最短公共超串 并行算法 GPU计算 遗传算法 蚁群算法
下载PDF
基于CUDA的SMAC算法并行化
12
作者 常立博 杜慧敏 韩俊刚 《西安邮电大学学报》 2016年第5期33-38,共6页
改进SMAC(Simplified Marker and Cell)算法,增强其对流体模拟的实时处理能力。采用点差分格式对求解压力场和速度更新的偏微分方程进行离散化;引入消除数据相关性的存储算法以减少数据传输,并借助分层存储机制提高访存比,采用并行归约... 改进SMAC(Simplified Marker and Cell)算法,增强其对流体模拟的实时处理能力。采用点差分格式对求解压力场和速度更新的偏微分方程进行离散化;引入消除数据相关性的存储算法以减少数据传输,并借助分层存储机制提高访存比,采用并行归约增加线程并行度;在统一计算设备架构平台下,对离散化的SMAC算法进行改进、优化及并行化实现。纯粹计算及多次迭代模拟实验结果显示,改进算法提速明显,可实现对一般场景的实时模拟。 展开更多
关键词 计算流体力学 统一计算设备架构 并行算法
下载PDF
基于JACKET的超声弹性成像算法并行实现
13
作者 陈琳 杨先凤 彭博 《计算机光盘软件与应用》 2014年第3期103-104,107,共3页
针对超声弹性成像系统在医学诊断中的广泛应用,为了提高超声弹性成像算法的计算速度,提出采用GPU加速基于互相关算法的弹性成像技术。首先分析采用这种技术的可能性,然后通过GPU开发工具中的JACKET来实现互相关算法的并行计算,实现超声... 针对超声弹性成像系统在医学诊断中的广泛应用,为了提高超声弹性成像算法的计算速度,提出采用GPU加速基于互相关算法的弹性成像技术。首先分析采用这种技术的可能性,然后通过GPU开发工具中的JACKET来实现互相关算法的并行计算,实现超声弹性成像技术。最后通过实验数据证明该方法在处理单帧弹性图条件下,能大幅提升图形计算的能力。与传统的互相关方法比较,具有25倍的加速比。 展开更多
关键词 弹性成像 并行算法 图形处理单元 互相关 计算速度
下载PDF
基于OpenMP的ADPCM算法并行化及效率分析
14
作者 张云锋 《科技情报开发与经济》 2012年第21期117-119,共3页
并行计算作为计算机行业未来发展方向的趋势已显而易见,而并行程序设计是研究的一个重要分支。介绍了ADPCM算法的基本概念,阐述了ADPCM算法并行化的设计与实现,分析了ADPCM并行算法的效率。
关键词 ADPCM 并行算法 OPENMP
下载PDF
排序算法并行化
15
作者 唐会伏 《咸宁师专学报》 2001年第3期69-70,共2页
阐述了BSP上的并行排序算法 ,进行了该算法的性能分析 ,并通过与PRAM -CRCW上快排序算法的比较 。
关键词 排序算法 BSP模型 PRAM-CRCW模型 并行算法 算法加速比
下载PDF
基于Spark和NRSCA策略的并行深度森林算法
16
作者 毛伊敏 刘绍芬 《计算机应用研究》 CSCD 北大核心 2024年第1期126-133,共8页
针对并行深度森林在大数据环境下存在冗余及无关特征过多、两端特征利用率过低、模型收敛速度慢以及级联森林并行效率低等问题,提出了基于Spark和NRSCA策略的并行深度森林算法——PDF-SNRSCA。首先,该算法提出了基于邻域粗糙集和Fisher ... 针对并行深度森林在大数据环境下存在冗余及无关特征过多、两端特征利用率过低、模型收敛速度慢以及级联森林并行效率低等问题,提出了基于Spark和NRSCA策略的并行深度森林算法——PDF-SNRSCA。首先,该算法提出了基于邻域粗糙集和Fisher score的特征选择策略(FS-NRS),通过衡量特征的相关性和冗余度,对特征进行过滤,有效减少了冗余及无关特征的数量;其次,提出了一种随机选择和等距提取的扫描策略(S-RSEE),保证了所有特征能够同概率被利用,解决了多粒度扫描两端特征利用率低的问题;最后,结合Spark框架,实现级联森林并行化训练,提出了基于重要性指数的特征筛选机制(FFM-II),筛选出非关键性特征,平衡增强类向量与原始类向量维度,从而加快模型收敛速度,同时设计了基于SCA的任务调度机制(TSM-SCA),将任务重新分配,保证集群负载均衡,解决了级联森林并行效率低的问题。实验表明,PDF-SNRSCA算法能有效提高深度森林的分类效果,且对深度森林并行化训练的效率也有大幅提升。 展开更多
关键词 并行深度森林算法 Spark框架 邻域粗糙集 正弦余弦算法 多粒度扫描
下载PDF
结合遗传算子的并行萤火虫算法及在车间调度中的应用
17
作者 周艳平 刘永娟 《计算机与数字工程》 2024年第5期1388-1393,共6页
论文提出了一种结合遗传算子的并行萤火虫算法,该算法借鉴了萤火虫闪烁移动的思想,对两个种群进行同步并行迭代求解,以提升算法的求解速度和质量;在其中一个种群中引入多尺度协同变异算子,利用不同大小方差的自适应高斯变异机制使整个... 论文提出了一种结合遗传算子的并行萤火虫算法,该算法借鉴了萤火虫闪烁移动的思想,对两个种群进行同步并行迭代求解,以提升算法的求解速度和质量;在其中一个种群中引入多尺度协同变异算子,利用不同大小方差的自适应高斯变异机制使整个种群以尽量分散的变异尺度来对解空间进行更详尽的探索,从而使整个种群进行有效变异。函数优化结果表明了该算法的有效性,该算法用于求解以最小化最大完工时间为优化目标的流水车间调度问题,实验结果表明,较传统的单一算法而言,结合遗传算子的并行萤火虫算法在求解车间调度问题方面具有更好的性能。 展开更多
关键词 萤火虫算法 多尺度协同变异算子 并行算法 流水车间调度
下载PDF
基于模拟并行蚁群算法的无线传感器网络异常节点自适应定位方法
18
作者 李庐 《哈尔滨师范大学自然科学学报》 CAS 2024年第1期55-60,共6页
由于无线传感器网络自身节点数量庞大,导致在异常节点自适应定位过程中,定位到的异常节点个数较少的问题.针对上述问题,提出基于模拟并行蚁群算法的无线传感器网络异常节点自适应定位方法.从网络中提取出异常节点的原始数据,并对异常节... 由于无线传感器网络自身节点数量庞大,导致在异常节点自适应定位过程中,定位到的异常节点个数较少的问题.针对上述问题,提出基于模拟并行蚁群算法的无线传感器网络异常节点自适应定位方法.从网络中提取出异常节点的原始数据,并对异常节点数据属性进行详细的解析,根据解析后的数据属性,利用蚁群算法的优化搜索特性,结合并行计算的思想,建立并行蚁群算法模型,模拟蚂蚁在寻找食物过程中的协作和寻优行为,运行并行蚁群算法,获取异常节点的估计坐标值,实现节点的自适应定位.实验结果表明,该方法在面对复杂网络环境和多种异常类型时能够定位到多个异常节点,增强了定位方法的鲁棒性和自适应性. 展开更多
关键词 模拟并行蚁群算法 无线传感器 网络异常节点 节点自适应定位方法
下载PDF
大规模协同虚拟环境下并行层次兴趣匹配算法
19
作者 郦丽华 《齐齐哈尔大学学报(自然科学版)》 2024年第2期51-55,83,共6页
大规模协同虚拟环境运行过程中易产生大量冗余通信数据,影响虚拟现实技术性能的发挥。为了提升虚拟环境运行效率,提出并行层次兴趣匹配算法。创建协同虚拟环境概念模型,分解处理订阅区域信息,引入树结构理论搭建兴趣管理树,将订阅区域... 大规模协同虚拟环境运行过程中易产生大量冗余通信数据,影响虚拟现实技术性能的发挥。为了提升虚拟环境运行效率,提出并行层次兴趣匹配算法。创建协同虚拟环境概念模型,分解处理订阅区域信息,引入树结构理论搭建兴趣管理树,将订阅区域映射到兴趣管理树节点上,形成层次化结构,结合LSQR并行算法,实现更新区域与订阅区域的快速匹配。实验结果表明,提出算法获得的兴趣匹配消耗时间最小值为0.36 s,兴趣匹配成功指数最大值为0.94,充分证实了提出算法兴趣匹配性能较好。 展开更多
关键词 协同虚拟环境 兴趣匹配 多层次并行 大规模 并行算法 仿真场景
下载PDF
基于BOPPPS模型的问题迭代教学方法在并行算法设计与分析课程中的应用
20
作者 李颖颖 侯一凡 +2 位作者 赵博 孙回回 徐金龙 《计算机教育》 2024年第6期42-46,51,共6页
针对计算机类研究生学位课并行算法设计与分析的课程目标,提出基于BOPPPS模型的问题到算法、算法到方法、方法又迭代解决新问题的问题迭代教学方法,通过一个具体问题的实践阐述迭代教学方法在课程中的运用技巧。
关键词 问题迭代教学方法 并行算法设计与分析课程 计算思维 方法总结 问题拓展 BOPPPS
下载PDF
上一页 1 2 174 下一页 到第
使用帮助 返回顶部