期刊文献+

基于MapReduce和网格密度的文本聚类分析研究 被引量:1

下载PDF
导出
摘要 为解决大数据文本聚类分析的瓶颈,分析了云计算和文本聚类分析的关键技术,利用云计算及分布式计算框架MapReduce的技术优势,构建了基于MapReduce和网格密度的文本聚类分析算法,为大数据文本聚类分析的应用提供了新的思路和技术基础。
作者 孙海军
出处 《信息系统工程》 2014年第10期25-26,共2页
  • 相关文献

参考文献6

二级参考文献98

  • 1曾万聃,周绪波,戴勃,游新冬,常桂然.基于多代理的网格任务调度研究[J].计算机科学,2005,32(6):17-20. 被引量:1
  • 2张国敏,陈鸣,王娜.基于多代理的网格动态资源自维护机制[J].通信学报,2006,27(11):134-138. 被引量:4
  • 3周树德,孙增圻.分布估计算法综述[J].自动化学报,2007,33(2):113-124. 被引量:209
  • 4米勒.云计算[M].史美林,姜进磊,孙瑞志,等译.北京:机械工业出版社,2009:125-128.
  • 5Deelman E,Chervenak A.Data management challenges of data-intensive scientific workflows//Proceedings of the IEEE International Symposium on Cluster Computing and the Grid(CCGRID).Lyon,France,2008:687-692.
  • 6Deelman E,Blythe J,Gil Y,Kesselman C,Mehta G,Patil S,Su M H,Vahi K,Livny M.Pegasus:Mapping scientific workflows onto the grid//Proceedings of the European Across Grids Conference(AxGrids).Nicosia,Cyprus,2004:11-20.
  • 7Ludascher B,Altintas I,Berkley C,Higgins D,Jaeger E,Jones M,Lee E A.Scientific workflow management and the Kepler system.Concurrency and Computation:Practice and Experience,2005,18(10):1039-1065.
  • 8Oinn T,Addis M,Ferris J,Marvin D,Senger M,Greenwood M,Carver T,Glover K,Pocock M R,Wipat A,Li P.Taverna:A tool for the composition and enactment of bioinformatics workflows.Bioinformatics,2004,20(17):3045-3054.
  • 9Ghemawat S,Gobioff H,Leung S T.The google file system.ACM SIGOPS Operating Systems Review,2003,37(5):29-43.
  • 10Wang L,Tao J,Kunze M,Castellanos A C,Kramer D,Karl W.Scientific cloud computing:Early definition and experience//Proceedings of the 10th IEEE International Conference on High Performance Computing and Communications(HPCC).Dalian,China,2008:825-830.

共引文献773

同被引文献4

引证文献1

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部