期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于AVX与OpenMP的LIBSVM并行优化研究 被引量:2
1
作者 田林琳 刘业峰 关世杰 《计算机与数字工程》 2019年第10期2503-2508,共6页
为解决支持向量机(SVM)分类算法性能不能满足实时性要求的问题,提出了一种使用Intel高级矢量扩展指令集(AVX)对SVM分类算法进行并行加速的计算方法。首先以LIBSVM的串行版本作为算法优化的基准,分析了LIBSVM训练阶段产生的模型文件读入... 为解决支持向量机(SVM)分类算法性能不能满足实时性要求的问题,提出了一种使用Intel高级矢量扩展指令集(AVX)对SVM分类算法进行并行加速的计算方法。首先以LIBSVM的串行版本作为算法优化的基准,分析了LIBSVM训练阶段产生的模型文件读入内存后的布局特点,给出了满足AVX指令集操作的内存布局优化方案,接着在满足分类结果精度的前提下以单精度代替双精度浮点,提高了算法的并行度,最后使用OpenMP技术在多核平台下对并行算法进行了多线程优化,提高了CPU计算资源的利用率。实验结果表明,并行优化版本相对其串行版本加速约15倍左右,满足了系统的性能要求。 展开更多
关键词 高级矢量扩展指令集 支持向量机 并行度 内存布局 LIBSVM
下载PDF
第一性原理计算软件包ABACUS中格点积分的优化 被引量:1
2
作者 沈瑜 李会民 刘晓辉 《科研信息化技术与应用》 2015年第5期12-21,共10页
ABACUS是中国科学技术大学中国科学院量子信息重点实验室自主研发的新型基于密度泛函和数值原子轨道基组的第一性原理计算软件包,在该软件中需要使用格点积分来计算局域势和电子密度,这两部分的计算是程序运行中主要耗时的部分。我们采... ABACUS是中国科学技术大学中国科学院量子信息重点实验室自主研发的新型基于密度泛函和数值原子轨道基组的第一性原理计算软件包,在该软件中需要使用格点积分来计算局域势和电子密度,这两部分的计算是程序运行中主要耗时的部分。我们采用了内存池和高性能数学库对这两部分进行了优化,最终使得程序对内存带宽和CPU高级矢量扩展的利用率有了大幅提高,实际计算速度得到了有效的提高。经过实测,在200个Ti原子的算例中,这两部分的速度分别提高到原来的4.2倍和6.4倍,整体速度提高到原来的2.8倍。 展开更多
关键词 优化 第一性原理 格点积分 内存带宽 高级矢量扩展
原文传递
基于光闪烁的烟气流速测量技术
3
作者 杨阳 张志荣 倪志波 《光电子.激光》 EI CAS CSCD 北大核心 2014年第4期711-717,共7页
介绍了一种利用颗粒物浓度场随机起伏引起的光闪烁测量工业烟气排放速度的光学测量技术及其数据处理方法。对湍流作用下,基于分离式双光路测量系统结构的光闪烁互相关进行了分析,得到了相关函数的理论表达式。采用单向循环链表的数据存... 介绍了一种利用颗粒物浓度场随机起伏引起的光闪烁测量工业烟气排放速度的光学测量技术及其数据处理方法。对湍流作用下,基于分离式双光路测量系统结构的光闪烁互相关进行了分析,得到了相关函数的理论表达式。采用单向循环链表的数据存储结构实现信号数据在时间域的滑动,同时满足了测量实时性和平均性的要求。使用快递傅里叶变换(FFT)计算光闪烁互相关,提出了一种应用高级矢量扩展(AVX)指令加速FFT的方法,在基于Intel i7处理器的计算平台上将FFT的计算速度提高了1倍。最后给出了光闪烁法用于工业现场烟气流速测量的结果,与使用皮托管测量的结果基本一致,证明了本文光学测量技术及其数据处理方法的有效性。 展开更多
关键词 光闪烁 流速 互相关 高级矢量扩展(AVX)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部