期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于CUDA的并行K-means聚类图像分割算法优化 被引量:29
1
作者 霍迎秋 秦仁波 +2 位作者 邢彩燕 陈曦 方勇 《农业机械学报》 EI CAS CSCD 北大核心 2014年第11期47-53,74,共8页
为提高K-means聚类算法的运算速度,基于CUDA架构提出一种分块、并行的K-means算法,并采用'合并访问'、'多级规约求和'、'负载均衡'和'指令优化'等策略优化并行算法。实验结果表明,并行K-means算法的分... 为提高K-means聚类算法的运算速度,基于CUDA架构提出一种分块、并行的K-means算法,并采用'合并访问'、'多级规约求和'、'负载均衡'和'指令优化'等策略优化并行算法。实验结果表明,并行K-means算法的分割效果与串行K-means算法相同,但运行速度得到了极大的提高,加速比最高达到560,很好地解决了农业工程实际中由于分割算法带来的瓶颈问题,能够极大地提高农业劳动生产率。 展开更多
关键词 图像分割 聚类分割算法 统一计算架构 图形处理器并行优化
下载PDF
基于并行动态学习型免疫算法的永磁同步电机状态监测 被引量:7
2
作者 刘朝华 李小花 +1 位作者 张红强 周少武 《自动化学报》 EI CSCD 北大核心 2015年第7期1283-1294,共12页
为提高永磁同步电机(Permanent magnet synchronous machine,PMSM)系统参数辨识与状态监测效率,利用图形处理器(Graphics processing unit,GPU)并行计算与人工免疫技术相结合的研究方法,建立面向永磁同步电机系统基于GPU并行动态学习型... 为提高永磁同步电机(Permanent magnet synchronous machine,PMSM)系统参数辨识与状态监测效率,利用图形处理器(Graphics processing unit,GPU)并行计算与人工免疫技术相结合的研究方法,建立面向永磁同步电机系统基于GPU并行动态学习型免疫进化的参数估计与状态监测模型.为提高算法的动态跟踪性能,在抗体演化进程中,通过知识学习策略来引导算法进化过程,首先将抗体群划分为B细胞群、浆细胞群以及记忆细胞群,对处于不同进化群体中的抗体分别设计免疫综合学习策略、免疫反向学习策略和高斯学习策略,以增强抗体间的信息交互;接着,应用图形处理器并行计算技术进一步加速算法求解过程;最后,将所提算法应用于永磁同步电机系统参数辨识与状态监测中,实验表明,所提方法能同时准确地对电机的定子电阻、dq轴电感和永磁磁链等系统关键参数进行估计.依据参数变化实现对系统运行状态进行在线监测与预警.计算结果表明,GPU并行技术能大幅度提高计算效率. 展开更多
关键词 永磁同步电机 参数辨识 状态监测 人工免疫系统 动态学习 图形处理器并行计算
下载PDF
基于GPU的近场动力学模拟的并行化方法 被引量:3
3
作者 刘肃肃 胡祎乐 余音 《上海交通大学学报》 EI CAS CSCD 北大核心 2016年第9期1362-1367,1375,共7页
针对近场动力学(PD)模型计算量庞大、计算效率低的问题,研究了基于OPU的PD建模过程的并行化方法.通过将前处理及求解过程中各物质点的计算映射到GPU的单个线程,实现模型的多线程高效并行计算.计算程序在Microsoft Visual Studio2... 针对近场动力学(PD)模型计算量庞大、计算效率低的问题,研究了基于OPU的PD建模过程的并行化方法.通过将前处理及求解过程中各物质点的计算映射到GPU的单个线程,实现模型的多线程高效并行计算.计算程序在Microsoft Visual Studio2010集合CUDA4.0工具包的开发环境下执行,采用CUDAC进行编写.对复合材料层压板的2种PD模型(键型PD模型和态型PD模型)的计算表明,采用GPU并行运算的模型模拟结果与试验结果吻合良好,并且相比于CPU串行计算,GPU并行计算获得了2.6~10.3倍的加速比,降低了PD模型的计算代价. 展开更多
关键词 近场动力学 图形处理器并行计算 复合材料
下载PDF
基于预处理共轭梯度迭代法的电力系统状态估计算法 被引量:7
4
作者 李建斌 王鹏程 +2 位作者 傅侃 方睿 董树锋 《电力系统自动化》 EI CSCD 北大核心 2021年第14期90-96,共7页
随着中国电网省地一体化和输配一体化的不断发展,电力系统计算的维度越来越高。状态估计作为电力系统态势感知中的基础环节,需要保证其实时性,而加权最小二乘法是电力系统运用最广泛的状态估计方法。为此,针对加权最小二乘法在牛顿迭代... 随着中国电网省地一体化和输配一体化的不断发展,电力系统计算的维度越来越高。状态估计作为电力系统态势感知中的基础环节,需要保证其实时性,而加权最小二乘法是电力系统运用最广泛的状态估计方法。为此,针对加权最小二乘法在牛顿迭代过程中矩阵乘法和线性方程组求解耗时较长的特点,根据Krylov子空间方法中共轭梯度法的思想,设计了一种基于预处理共轭梯度迭代法的电力系统状态估计算法。该方法采用不完全LU分解法对原始线性方程组进行预处理,并采用图形处理器(GPU)并行加速技术对矩阵乘法、线性方程预处理和共轭梯度法迭代进行加速。算例分析表明了文中方法加速效果明显,内存和显存占用较低,经过不完全LU分解法预处理的线性方程组迭代次数少,能够满足大规模电力系统状态估计的实时性要求。 展开更多
关键词 状态估计 共轭梯度法 不完全LU分解 图形处理器并行加速
下载PDF
利用并行GPU对分层分布式狄利克雷分布算法加速 被引量:2
5
作者 温腊 芮建武 +1 位作者 何婷婷 郭亮 《计算机应用》 CSCD 北大核心 2013年第12期3313-3316,3330,共5页
分层分布式狄利克雷分布(HD-LDA)算法是一个对潜在狄利克雷分布(LDA)进行改进的基于概率增长模型的文本分类算法,与只能在单机上运行的LDA算法相比,可以运行在分布式框架下,进行分布式并行处理。Mahout在Hadoop框架下实现了HD-LDA算法,... 分层分布式狄利克雷分布(HD-LDA)算法是一个对潜在狄利克雷分布(LDA)进行改进的基于概率增长模型的文本分类算法,与只能在单机上运行的LDA算法相比,可以运行在分布式框架下,进行分布式并行处理。Mahout在Hadoop框架下实现了HD-LDA算法,但是因为单节点算法的计算量大,仍然存在对大数据分类运行时间太长的问题。而大规模文本集合分散到多个节点上迭代推导,单个节点上文档集合的推导仍是顺序进行的,所以处理大规模文本集合时仍然需要很长时间才能完成全部文本的分类。为此,提出将Hadoop与图形处理器(GPU)相结合,将单节点文本集合的推导过程转移到GPU上运行,实现单节点多个文档并行推导,利用多台并行的GPU对HD-LDA算法进行加速。应用结果表明,使用该方法能使分布式框架下的HD-LDA算法对大规模文本集合处理达到7倍的加速比。 展开更多
关键词 分层分布式狄利克雷分布 潜在狄利克雷分布 文本分类 分布式框架 并行图形处理器
下载PDF
基于GPU的点云模型快速重建方法
6
作者 吕建新 马礼 +2 位作者 傅颖勋 李阳 马东超 《计算机工程与设计》 北大核心 2023年第11期3440-3446,共7页
利用GPU并行特点,将点云数据分块并行处理,实施多线程并行重建。从有序点云的数据关系入手,设计点云处理平滑在内的数据处理方法。利用GPU对分块数据快速三角化曲面重建,使用拉普拉斯算法对重建后的曲面进行平滑处理。通过对5组不同的... 利用GPU并行特点,将点云数据分块并行处理,实施多线程并行重建。从有序点云的数据关系入手,设计点云处理平滑在内的数据处理方法。利用GPU对分块数据快速三角化曲面重建,使用拉普拉斯算法对重建后的曲面进行平滑处理。通过对5组不同的海量数据进行重构模型实验,与传统的单纯使用CPU重构方式相比,GPU方式将模型重构速率提升了数十倍至上百倍,模型重建速度得到了大幅度的提升,可有效适用于高精度器件装检预判,提高装配质量。 展开更多
关键词 有序点云 点云分块 三角化 多线程 图形处理器并行运算 表面重建 模型平滑
下载PDF
一种适应无人机平台的快速立体匹配方法 被引量:4
7
作者 于英 杨靖宇 +1 位作者 张永生 薛武 《计量学报》 CSCD 北大核心 2014年第2期143-146,共4页
设计了一种高质量和快速的立体匹配方法,首先在粗分辨率的影像上获取立体影像的重叠区域和初始视差值,而后采用互信息作为匹配测度并采用一种通过一维路径聚合的全局优化方法得到精确的视差值。匹配方法采用图形处理器进行了加速,得... 设计了一种高质量和快速的立体匹配方法,首先在粗分辨率的影像上获取立体影像的重叠区域和初始视差值,而后采用互信息作为匹配测度并采用一种通过一维路径聚合的全局优化方法得到精确的视差值。匹配方法采用图形处理器进行了加速,得到了很好的加速比。实验结果表明了该匹配方法的正确性和高效率性。 展开更多
关键词 计量学 无人机 立体匹配 互信息 半全局 图形处理器并行
下载PDF
大规模输配一体化系统牛顿法潮流计算性能分析及改进方法 被引量:16
8
作者 唐坤杰 董树锋 +1 位作者 朱炳铨 宋永华 《电力系统自动化》 EI CSCD 北大核心 2019年第6期92-101,共10页
为满足输配电网一体化潮流计算精度和计算速度需求,提出了一种改进的牛顿法潮流计算方法。针对输配电网一体化牛顿法雅可比矩阵病态严重、收敛性能较差等问题,采用自适应Levenberg-Marquardt算法初始精度提升速度快的特征选取初值、不... 为满足输配电网一体化潮流计算精度和计算速度需求,提出了一种改进的牛顿法潮流计算方法。针对输配电网一体化牛顿法雅可比矩阵病态严重、收敛性能较差等问题,采用自适应Levenberg-Marquardt算法初始精度提升速度快的特征选取初值、不完全三角分解法预处理雅可比矩阵,有效地保证了数值稳定性,提高了牛顿法的收敛性能。针对输配电网一体化后规模庞大、计算效率低等问题,利用图形处理器并行加速技术对算法中的一些计算量密集的步骤,包括雅可比矩阵的生成、矩阵—向量运算等进行加速处理。算例测试表明,该算法能够显著提高大规模输配电网一体化潮流计算的速度和精度,对于多配电网区域、环网、分布式电源、病态系统等多种情形具有较强的普适性。 展开更多
关键词 输配电网一体化 牛顿法 潮流计算 收敛性能 图形处理器并行加速
下载PDF
基于Cholesky分解的高光谱实时异常探测的GPU优化 被引量:2
9
作者 李萍 关桂霞 +2 位作者 吴太夏 彭波 黄晓 《传感器与微系统》 CSCD 2019年第3期7-10,共4页
高光谱遥感图像具有超多波段、光谱分辨率高、信息量丰富等优点,但同时也给异常探测的实时处理带来了重大考验。基于Cholesky分解的高光谱实时异常探测算法很好地解决了实时性问题,而图形处理器(GPU)的并行优化设计则更高效。实验结果表... 高光谱遥感图像具有超多波段、光谱分辨率高、信息量丰富等优点,但同时也给异常探测的实时处理带来了重大考验。基于Cholesky分解的高光谱实时异常探测算法很好地解决了实时性问题,而图形处理器(GPU)的并行优化设计则更高效。实验结果表明:提出的优化设计在保证探测精度的同时,进一步提升了计算效率,算法加速比最高达到3. 14倍,说明基于GPU的并行优化算法能够较好地满足高光谱遥感图像实时处理的应用需求。 展开更多
关键词 高光谱遥感图像 实时异常探测 CHOLESKY分解 图形处理器并行优化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部