-
题名CPU-GPU协同计算加速ASIFT算法
被引量:6
- 1
-
-
作者
何婷婷
芮建武
温腊
-
机构
中国科学院软件研究所
中国科学院大学
-
出处
《计算机科学》
CSCD
北大核心
2014年第5期14-19,共6页
-
基金
云计算操作系统及关键基础组件的研究与开发:面向云计算的大数据集并行处理平台研究与开发(KGCX2-YW-174)
国家科技支撑计划项目:新型网络终端操作系统社区版本研究与开发
+2 种基金
应用程序库汇总meegobox(2011BAH14B02)
2012年度"核高基"重大专项:开源操作系统内核分析和安全性评估(2012ZX01039-002)
新闻出版重大科技工程项目-中华字库工程-第23包:应用平台研发(GAPP-ZDKJ-ZK/23)资助
-
文摘
ASIFT(Affine-SIFT)是一种具有仿射不变性、尺度不变性的特征提取算法,其被用于图像匹配中,具有较好的匹配效果,但因计算复杂度高而难以运用到实时处理中。在分析ASIFT算法运行耗时分布的基础上,先对SIFT算法进行了GPU优化,通过使用共享内存、合并访存,提高了数据访问效率。之后对ASIFT计算中的其它部分进行GPU优化,形成GASIFT。整个GASIFT计算过程中使用显存池来减少对显存的申请和释放。最后分别在CPU/GPU协同工作的两种方式上进行了尝试。实验表明,CPU负责逻辑计算、GPU负责并行计算的模式最适合于GASIFT计算,在该模式下GASIFT有很好的加速效果,尤其针对大、中图片。对于2048*1536的大图片,GASIFT与标准ASIFT相比加速比可达16倍,与OpenMP优化过的ASIFT相比加速比可达7倍,极大地提高了ASIFT在实时计算中应用的可能性。
-
关键词
特征提取
ASIFT
SIFT
CPU
GPU协同工作
-
Keywords
Image feature extraction
ASIFT
SIFT
CPU/GPU synergetic parallel
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名利用并行GPU对分层分布式狄利克雷分布算法加速
被引量:2
- 2
-
-
作者
温腊
芮建武
何婷婷
郭亮
-
机构
中国科学院软件研究所基础软件国家工程研究中心
中国科学院大学
-
出处
《计算机应用》
CSCD
北大核心
2013年第12期3313-3316,3330,共5页
-
基金
国家科技支撑计划项目(2011BAH14B02)
核高基重大专项(2012ZX01039-004)
+1 种基金
中国科学院知识创新工程重要方向项目(KGCX2-YW-174)
新闻出版重大科技工程项目(GAPP-ZDKJ-ZK/23)
-
文摘
分层分布式狄利克雷分布(HD-LDA)算法是一个对潜在狄利克雷分布(LDA)进行改进的基于概率增长模型的文本分类算法,与只能在单机上运行的LDA算法相比,可以运行在分布式框架下,进行分布式并行处理。Mahout在Hadoop框架下实现了HD-LDA算法,但是因为单节点算法的计算量大,仍然存在对大数据分类运行时间太长的问题。而大规模文本集合分散到多个节点上迭代推导,单个节点上文档集合的推导仍是顺序进行的,所以处理大规模文本集合时仍然需要很长时间才能完成全部文本的分类。为此,提出将Hadoop与图形处理器(GPU)相结合,将单节点文本集合的推导过程转移到GPU上运行,实现单节点多个文档并行推导,利用多台并行的GPU对HD-LDA算法进行加速。应用结果表明,使用该方法能使分布式框架下的HD-LDA算法对大规模文本集合处理达到7倍的加速比。
-
关键词
分层分布式狄利克雷分布
潜在狄利克雷分布
文本分类
分布式框架
并行图形处理器
-
Keywords
Hierarchical Distributed Latent Dirichlet Allocation (HD-LDA)
Latent Dirichlet Allocation (LDA)
textclassification
distributed environment
parallel Graphic Processing Unit (GPU)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-