摘要
Nutch作为一个在2002年兴起于Apache开源项目的开源搜索引擎,经过十多年的发展,无论在抓取速度、抓取效率还是部署方便性上,都更加成熟,被越来越多的人认可。HBase作为Apache开源项目下的著名分布式的、面向列的开源数据库,有着强大的可扩展性和极高的按行健查找效率。二者与大数据这一概念相伴而生,二者的结合也必将在大数据时代有所作为。
出处
《计算机光盘软件与应用》
2014年第12期59-59,61,共2页
Computer CD Software and Application