期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于AVX与OpenMP的LIBSVM并行优化研究
被引量:
2
1
作者
田林琳
刘业峰
关世杰
《计算机与数字工程》
2019年第10期2503-2508,共6页
为解决支持向量机(SVM)分类算法性能不能满足实时性要求的问题,提出了一种使用Intel高级矢量扩展指令集(AVX)对SVM分类算法进行并行加速的计算方法。首先以LIBSVM的串行版本作为算法优化的基准,分析了LIBSVM训练阶段产生的模型文件读入...
为解决支持向量机(SVM)分类算法性能不能满足实时性要求的问题,提出了一种使用Intel高级矢量扩展指令集(AVX)对SVM分类算法进行并行加速的计算方法。首先以LIBSVM的串行版本作为算法优化的基准,分析了LIBSVM训练阶段产生的模型文件读入内存后的布局特点,给出了满足AVX指令集操作的内存布局优化方案,接着在满足分类结果精度的前提下以单精度代替双精度浮点,提高了算法的并行度,最后使用OpenMP技术在多核平台下对并行算法进行了多线程优化,提高了CPU计算资源的利用率。实验结果表明,并行优化版本相对其串行版本加速约15倍左右,满足了系统的性能要求。
展开更多
关键词
高级矢量扩展
指令集
支持向量机
并行度
内存布局
LIBSVM
下载PDF
职称材料
第一性原理计算软件包ABACUS中格点积分的优化
被引量:
1
2
作者
沈瑜
李会民
刘晓辉
《科研信息化技术与应用》
2015年第5期12-21,共10页
ABACUS是中国科学技术大学中国科学院量子信息重点实验室自主研发的新型基于密度泛函和数值原子轨道基组的第一性原理计算软件包,在该软件中需要使用格点积分来计算局域势和电子密度,这两部分的计算是程序运行中主要耗时的部分。我们采...
ABACUS是中国科学技术大学中国科学院量子信息重点实验室自主研发的新型基于密度泛函和数值原子轨道基组的第一性原理计算软件包,在该软件中需要使用格点积分来计算局域势和电子密度,这两部分的计算是程序运行中主要耗时的部分。我们采用了内存池和高性能数学库对这两部分进行了优化,最终使得程序对内存带宽和CPU高级矢量扩展的利用率有了大幅提高,实际计算速度得到了有效的提高。经过实测,在200个Ti原子的算例中,这两部分的速度分别提高到原来的4.2倍和6.4倍,整体速度提高到原来的2.8倍。
展开更多
关键词
优化
第一性原理
格点积分
内存带宽
高级矢量扩展
原文传递
基于光闪烁的烟气流速测量技术
3
作者
杨阳
张志荣
倪志波
《光电子.激光》
EI
CAS
CSCD
北大核心
2014年第4期711-717,共7页
介绍了一种利用颗粒物浓度场随机起伏引起的光闪烁测量工业烟气排放速度的光学测量技术及其数据处理方法。对湍流作用下,基于分离式双光路测量系统结构的光闪烁互相关进行了分析,得到了相关函数的理论表达式。采用单向循环链表的数据存...
介绍了一种利用颗粒物浓度场随机起伏引起的光闪烁测量工业烟气排放速度的光学测量技术及其数据处理方法。对湍流作用下,基于分离式双光路测量系统结构的光闪烁互相关进行了分析,得到了相关函数的理论表达式。采用单向循环链表的数据存储结构实现信号数据在时间域的滑动,同时满足了测量实时性和平均性的要求。使用快递傅里叶变换(FFT)计算光闪烁互相关,提出了一种应用高级矢量扩展(AVX)指令加速FFT的方法,在基于Intel i7处理器的计算平台上将FFT的计算速度提高了1倍。最后给出了光闪烁法用于工业现场烟气流速测量的结果,与使用皮托管测量的结果基本一致,证明了本文光学测量技术及其数据处理方法的有效性。
展开更多
关键词
光闪烁
流速
互相关
高级矢量扩展
(AVX)
原文传递
题名
基于AVX与OpenMP的LIBSVM并行优化研究
被引量:
2
1
作者
田林琳
刘业峰
关世杰
机构
沈阳工学院信息与控制学院
出处
《计算机与数字工程》
2019年第10期2503-2508,共6页
基金
国家自然科学基金项目(编号:61603262)
辽宁省教育厅科学研究一般项目(编号:L2015380)资助
文摘
为解决支持向量机(SVM)分类算法性能不能满足实时性要求的问题,提出了一种使用Intel高级矢量扩展指令集(AVX)对SVM分类算法进行并行加速的计算方法。首先以LIBSVM的串行版本作为算法优化的基准,分析了LIBSVM训练阶段产生的模型文件读入内存后的布局特点,给出了满足AVX指令集操作的内存布局优化方案,接着在满足分类结果精度的前提下以单精度代替双精度浮点,提高了算法的并行度,最后使用OpenMP技术在多核平台下对并行算法进行了多线程优化,提高了CPU计算资源的利用率。实验结果表明,并行优化版本相对其串行版本加速约15倍左右,满足了系统的性能要求。
关键词
高级矢量扩展
指令集
支持向量机
并行度
内存布局
LIBSVM
Keywords
AVX
SVM
parallelism
memory layout
LIBSVM
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
第一性原理计算软件包ABACUS中格点积分的优化
被引量:
1
2
作者
沈瑜
李会民
刘晓辉
机构
中国科学技术大学网络信息中心超级计算中心
中国科学技术大学量子信息重点实验室
出处
《科研信息化技术与应用》
2015年第5期12-21,共10页
文摘
ABACUS是中国科学技术大学中国科学院量子信息重点实验室自主研发的新型基于密度泛函和数值原子轨道基组的第一性原理计算软件包,在该软件中需要使用格点积分来计算局域势和电子密度,这两部分的计算是程序运行中主要耗时的部分。我们采用了内存池和高性能数学库对这两部分进行了优化,最终使得程序对内存带宽和CPU高级矢量扩展的利用率有了大幅提高,实际计算速度得到了有效的提高。经过实测,在200个Ti原子的算例中,这两部分的速度分别提高到原来的4.2倍和6.4倍,整体速度提高到原来的2.8倍。
关键词
优化
第一性原理
格点积分
内存带宽
高级矢量扩展
Keywords
optimization
first-principle
grid-integration
memory bandwidth
advanced vector extension
分类号
O172.2 [理学—基础数学]
原文传递
题名
基于光闪烁的烟气流速测量技术
3
作者
杨阳
张志荣
倪志波
机构
中船重工第七一六研究所
中国科学院安徽光学精密机械研究所
出处
《光电子.激光》
EI
CAS
CSCD
北大核心
2014年第4期711-717,共7页
基金
国家"863"计划(2007AA06Z420)
国家自然科学基金(11204320)资助项目
文摘
介绍了一种利用颗粒物浓度场随机起伏引起的光闪烁测量工业烟气排放速度的光学测量技术及其数据处理方法。对湍流作用下,基于分离式双光路测量系统结构的光闪烁互相关进行了分析,得到了相关函数的理论表达式。采用单向循环链表的数据存储结构实现信号数据在时间域的滑动,同时满足了测量实时性和平均性的要求。使用快递傅里叶变换(FFT)计算光闪烁互相关,提出了一种应用高级矢量扩展(AVX)指令加速FFT的方法,在基于Intel i7处理器的计算平台上将FFT的计算速度提高了1倍。最后给出了光闪烁法用于工业现场烟气流速测量的结果,与使用皮托管测量的结果基本一致,证明了本文光学测量技术及其数据处理方法的有效性。
关键词
光闪烁
流速
互相关
高级矢量扩展
(AVX)
Keywords
optical scintillation
flow velocity
cross-correlation
advanced vector Extensions (AVX)
分类号
X851 [环境科学与工程—环境工程]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于AVX与OpenMP的LIBSVM并行优化研究
田林琳
刘业峰
关世杰
《计算机与数字工程》
2019
2
下载PDF
职称材料
2
第一性原理计算软件包ABACUS中格点积分的优化
沈瑜
李会民
刘晓辉
《科研信息化技术与应用》
2015
1
原文传递
3
基于光闪烁的烟气流速测量技术
杨阳
张志荣
倪志波
《光电子.激光》
EI
CAS
CSCD
北大核心
2014
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部