期刊文献+

一种基于HBase的高效半结构化数据查询策略 被引量:1

下载PDF
导出
摘要 本文用以Dremel系统为基础解决在HBase系统下如何查询大量的半结构化数据。基本原理是进行先进行数据预处理将半结构化数据进行拆分,将记录拆分成列使用表存储,拆分之后保持原有之间的半结构化数据的树之间的上下层关系,然后再查询的时候只查询条件相关的列,然后做集合计算,即可得到数据需要查询的结果,从而节省了很多时间。
出处 《福建电脑》 2014年第11期107-110,160,共5页 Journal of Fujian Computer
  • 相关文献

参考文献11

  • 1开源中国社区[EB/OL].htrp://www.oschina.net/p/hbase/,2011.
  • 2Hbase Development Team.Hbase:bigtable-like structured stor- age fhr hadoop hdfs. http://wiki.apache.org/hadoop/Hbase . 2009.
  • 3Sanjay Ghemawat, Howard Gobioff, and Shun-Tak Leung, "The Google File Systmn", 2003.
  • 4F. Chang, J. Dean, S. Ghemawat, W. Hsieh, D. Wallach, M. Burrows, T.Chandra, A. Fikes, and R. Gmber.Bigtable: A Dis- tributed Storage System for Structured Data. Proceedings of 7th Symposium on Operating System Design and Implementation(OSDI), page 205218, 2006.
  • 5Jeffrey Dean and Sanjay Ghemawat. Map-Reduce-Merge: Simpli?ed Relational Data Processing on Large Clusters [J ]. 2006: 1029-1040.
  • 6Fan Changdeffrey Dean,Sanjay Chemawat,et al. Bigtable: a distributed storage system for structured data[ C ].Proceedings of 7th USENIX Symposium on Operating Systems Design and Imple- mentation (OSDI'06),Seattle,WA,USA:USENIX Association,2006: 205-218.
  • 7D. Borthakur et al. Apache Hadoop goes realtime Facebook. In SIGMOD, pages 1071-1080, 2011.
  • 8Serge A biteboul. Querying semi-structured data. InFo to Afrati, Phokion Kolaitiesed. Lecture Notes in Computer Science 1186, Database Theory 2ICDT 97 New York, Springer-Verlag,1997,1218.
  • 9李庆华,刘昊.用待确定的上下文无关文法分析半结构化数据[J].华中理工大学学报,1999,27(5):60-62. 被引量:5
  • 10Sergey Melnik et al. "Dremel: Interactive Analysis of Web-Scale Datasets". Proc. of VLDB. 2010, pp. 330-339.

共引文献4

同被引文献9

引证文献1

二级引证文献3

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部