-
题名一种基于莫顿码及镜像编码的平衡八叉树模型
- 1
-
-
作者
袁瑶
徐骏
顾剑锋
-
机构
上海交通大学材料改性与数值模拟研究所
上海交通大学材料基因组联合研究中心
-
出处
《计算力学学报》
CAS
CSCD
北大核心
2024年第3期467-473,共7页
-
基金
国家重点研发计划(2018YFA0702900)资助项目.
-
文摘
在接触分析和动画模拟等网格规模庞大、需要实时更新的应用场景下,普遍采用莫顿码实现包围盒层次树结构的快速重构。但现有的层次树由于结构平衡性差,普遍存在搜索效率不稳定的问题,为此本文在莫顿码法的基础上提出了一种兼顾构建与搜索效率的平衡八叉树模型BOT树(Balanced Octree)。设计了镜像编码来保证树的上层节点均有8个分支,且同层树节点所含三角面数之差不超过1。实际算例表明,BOT树与现有模型OIOT树在CUDA并行框架下对比,构建加速比最高可达1.29×,且网格规模越大,BOT树构建效率的优势越明显。同时,与OIOT树相比BOT树的筛除率更高,在凸体接触和边缘接触算例中加速比分别达到1.13×和1.06×。
-
关键词
层次包围盒树
平衡八叉树
cuda并行框架
莫顿码
-
Keywords
BVH
balanced octree
cuda
Morton code
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于CUDA的邻近粒子搜索算法研究
被引量:3
- 2
-
-
作者
刘丹
陈捷捷
-
机构
武汉第二船舶设计研究所
中国舰船研究设计中心
-
出处
《计算机工程与应用》
CSCD
2012年第18期53-56,共4页
-
文摘
在粒子方法中,运用邻近粒子搜索算法可以快速获取每个粒子的邻近粒子信息。由于粒子方法模拟一个体系的行为所采用的粒子数据是十分庞大的,对计算机的运算速度提出了挑战。研究了GPU的计算能力和CUDA开发环境,利用GPU的并行多线程处理技术,提出了一种并行邻近粒子搜索算法。实验结果表明,基于CUDA的并行邻近粒子搜索算法,加快了邻近粒子搜索过程,显著地减少了计算时间,成功实现了硬件加速,可获取290以上的加速比,对大规模粒子系统呈现出高效的处理能力。
-
关键词
统一计算设备框架(cuda)
图形处理单元(GPU)
粒子方法
邻近粒子搜索
-
Keywords
Compute Unified Device Architecture (cuda)
Graphic Processing Unit (GPU)
particle method
neighbor particle search
-
分类号
TP319.9
[自动化与计算机技术—计算机软件与理论]
-
-
题名gAC:基于GPU的高性能AC算法
被引量:2
- 3
-
-
作者
陈虎
彭江锋
施少怀
-
机构
华南理工大学软件学院
华南理工大学计算机科学与工程学院
-
出处
《计算机工程与应用》
CSCD
2012年第12期43-48,共6页
-
基金
广东省科技计划项目(No.2006B80407001)
华南理工大学中央高校基本业务费项目(No.2009ZM0007)
-
文摘
字符串匹配是计算科学中研究最广泛的问题之一,已成为信息检索和生物计算等领域的核心操作。然而受限于CPU的计算能力和存储器访问带宽,传统的串行字符串匹配算法难以进一步提升性能。GPU在计算能力和存储器访问带宽上有很大提升,已经在很多应用上取得了卓越成效。gAC作为一种基于GPU的并行AC算法,针对GPU的SIMT(Single-Instruction Multiple-Thread)以及合并存储器访问的技术特点,采取了减少条件分支、合并访问全局存储器等优化方法,使得在C1060GPU上的字符串扫描速度达到51Gb/s,比基于CPU的串行算法提升了28倍。
-
关键词
图形处理器(GPU)
计算统一设备框架(cuda)
多字符串匹配
并行计算
AC算法
-
Keywords
Graphic Processing Uni(tGPU)
Compute Unified Device Architecture(cuda)
parallel multi-string matching
parallel computation
AC algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
TP319
[自动化与计算机技术—计算机软件与理论]
-
-
题名二维动画人物的特征提取与三维重建
被引量:2
- 4
-
-
作者
单祖辉
-
机构
滇西科技师范学院
-
出处
《沈阳大学学报(自然科学版)》
CAS
2018年第2期136-141,共6页
-
文摘
为了解决快速提取二维动画人物特征,完成立体动画人物形象构建的问题,提出了二维动画人物的特征提取与三维重建方法.通过分析二维动画人物特征提取,具体分析了二维动画人物Harris算子的确定、二维动画人物对极几何关系的确定、基于Harris算子和对极几何角度的特征提纯;分析了基于二维动画人物特征的三维重建方法,主要包括基于二维动画人物特征的三维重建流程、三维重建方法的哈希排序和利用CUDA框架实现三维重建方法.实验可知,所提方法的二维动画人物提取速度最大值为0.401mm/s,而传统二维动画人物提取速度最大值为0.589mm/s.动画人物形象三维构建准确性的对比中,在特殊检测方法中,本文方法对称性更好,准确性也更高.应用对比实验的方法证明,应用新型重建方法后,二维动画人物特征提取速度明显加快,动画人物形象三维构建准确性也大大提升.
-
关键词
二维动画人物
特征提取
HARRIS算子
对极几何关系
哈希排序
cuda框架
三维重建
-
Keywords
2D animated characters
hash sort
cuda framework
3D feature extraction
Harris operator
dipole geometry reconstruction
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于GPU并行射线跟踪的电波预测算法研究
被引量:1
- 5
-
-
作者
谭南
陈辉
-
机构
桂林电子科技大学信息与通信学院
-
出处
《微计算机信息》
2011年第11期104-106,共3页
-
基金
基金:基金申请人:谭南
项目名称:预测城市小区电磁波传播软件平台开发
基金颁发部门:广西壮族自治区教育厅(2010105950809M14)
-
文摘
针对利用射线跟踪算法进行小区电波预测的计算量非常大,运行时间较长,在实际工程中难以应用等的问题,本文在研究已有并行射线跟踪算法,即主从模式和对等模式并行射线跟踪的基础上,采用图形处理器(GPU)作为计算平台,结合GPU高并行处理能力,运用CUDA的编程框架,并在NVIDIA公司出厂的GEFORCE 9800GT上,实现了对城市小区的简单模型环境的电波预测。实验结果表明,基于GPU并行射线跟踪算法适用于城市小区的电波预测研究,该算法能大大节省通信时间,缩短计算时间,更方便更实用。
-
关键词
电波传播预测
射线跟踪
并行算法
GPU
cuda编程框架
-
Keywords
radio propagation prediction
ray-tracing
parallel computing
GPU
cuda programming framework
-
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
-