期刊文献+

基于MapReduce的文本语句向量算法实现

下载PDF
导出
摘要 文本语句向量算法是针对文本语句元素提炼成为向量进行计算的一种文本比对算法,但是在处理海量数据和高维度矩阵时由于内存和I/O等资源的局限,该算法受到极大的影响。针对文本语句向量的相关特点,提出了基于Map Reduce模型的实现文本语句向量算法的方法,Map函数完成对向量的划分和文本的解析,Reduce函数完成文本语句属性的比对和结果的新构建。实验结果表明:在大数据的环境下使用Map Reduce并行算法模型的文本语句向量计算效率性和可拓展性有进一步的提升。
作者 周宁 向阳
出处 《电子技术与软件工程》 2015年第17期180-183,共4页 ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING
基金 上海市科技创新计划(15DZ1501703)
  • 相关文献

参考文献8

  • 1Jiawei Han,Micheline Kamber(著),范明,孟小峰(译).数据挖掘概念与技术[M].北京:机械工业出版社,2007.3.2.
  • 2Apache Hadoop. [2012-05-02]. http: // hadoop, apache, org/.
  • 3刘鹏,黄宜华,陈卫卫.实战Hadoop[M].北京:电子工业出版社,2011:60-64.
  • 4魏凯斌,冉延平,余牛.语义相似度的计算方法研究与分析[J].计算机技术与发展,2010,20(7):102-105. 被引量:15
  • 5郝枫.基于FP-Growth算法的文本关联分析[D].太原理工大学,2010,21(6).
  • 6Giere,W,Dettmer,H.Free Text Classification and Retrieval Based on a Thesaurus,JohannWolfgang-Goethe Unversity Medical School,2004:543-544.
  • 7马彬,洪宇,杨雪蓉,姚建民,朱巧明.基于语义依存线索的事件关系识别方法研究[J].北京大学学报(自然科学版),2013,49(1):109-116. 被引量:14
  • 8Hadoop WT.The definitive guide[M].O'Reilly Media,Inc,2009.

二级参考文献28

共引文献102

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部