期刊文献+

并行MapReduce PLS算法及其在光谱分析中的应用 被引量:5

Parallel PLS Aigorithm Using MapReduce and Its Aplication in Spectral Modeling
下载PDF
导出
摘要 偏最小二乘(PLS)算法是常用的光谱建模算法,然而对于海量光谱处理情形,在单台计算机上建模及优化时间开销很大。基于MapReduce编程模式,提出了并行MapReduce PLS回归算法,包括并行数据标准化和并行主成分提取两个过程。在多台普通计算机上搭建Hadoop云计算集群平台,以近红外光谱处理为例,开展了算法验证实验。实验结果表明,基于MapReduce编程模式的并行PLS算法对海量近红外光谱数据集进行回归建模时,能有效提高建模速度,随计算机台数的增多可得到接近线性的加速比,并具有良好的扩展性。 Partial least squares(PLS) has been widely used in spectral analysis and modeling,and it is computation-intensive and time-demanding when dealing with massive data.To solve this problem effectively,a novel parallel PLS using MapReduce is proposed,which consists of two procedures,the parallelization of data standardizing and the parallelization of principal component computing.Using NIR spectral modeling as an example,experiments were conducted on a Hadoop cluster,which is a collection of ordinary computers.The experimental results demonstrate that the parallel PLS algorithm proposed can handle massive spectra,can significantly cut down the modeling time,and gains a basically linear speedup,and can be easily scaled up.
出处 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2012年第9期2399-2404,共6页 Spectroscopy and Spectral Analysis
基金 国家自然科学基金项目(30860381) 广西自然科学基金项目(2012GXNSFAA053230) 广西高等学校优秀人才资助计划项目(桂教人[2011]40号) 广西可信软件重点实验室开放基金项目(kx201121) 广西研究生教育创新计划项目(2010105950812M22 2011105950811M24)资助
关键词 并行偏最小二乘 近红外光谱 MAPREDUCE 并行计算 HADOOP 云计算 Parallel partial least squares; Near infrared spctrum; MapReduce; Parallel computing; Hadoop; Cloud computing;
  • 相关文献

参考文献13

  • 1Zhang Z M, Liang Y Z, Xu Q S. Chemometrics and Intelligent Laboratory Systems,2009, 96(1): 94.
  • 2SHEN Yong-xiang, YANG Hui-hua, HE Qian, et al(申永祥, 杨辉华,何 倩,等). 微计算机信息, 2010,26(9): 208.
  • 3Dean J, Ghemawat S. Google, Inc., 2004.
  • 4Paradies M. Datenbank Spektrum, 2011, 11:47.
  • 5Yang Lai, Shi Zhong-zhi. International Federation for Information Processing, 2010, 213.
  • 6Pham D P, Yuan S M, Jou E. LNSC6104, 2010. 662.
  • 7Chu C T, Kim S K, Lin Y A, et al. NIPS, 2006. 281.
  • 8http://mahout.apache.org/2011.
  • 9JIANG Xiao-ping, LI Cheng-hua, XIANG Wen, et al(江小平,李成华,向 文,等). 华中科技大学学报·自然科学版, 2011,(S1): 120.
  • 10TAO Yong-cai, XUE Zheng-yuan, SHI Lei(陶永才, 薛正元,石 磊). 计算机应用,2011, 31(9): 2412.

同被引文献41

引证文献5

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部