基于Hadoop和HBase的分布式索引模型的研究被引量：5

Research of distributed indexing model based on Hadoop and HBase

下载PDF

导出

摘要随着互联网上信息量飞速增长,海量数据的索引出现了难题,现行的索引方案已经难以提供高效、可靠的服务,为此,设计并实现了一种针对海量数据进行索引的平台模型。该平台模型首先利用Solr分布式索引器生成索引文件,然后利用Hadoop分布式集群,以HDFS分布式文件系统、Map Reduce分布式并行计算模型、Zookeeper同步协同系统以及Hbase分布式数据库技术来处理、协调管理索引和存储海量数据,最后通过实验测试,该平台模型可以克服现行的海量数据索引时存在的效率低的问题,同时具有良好的扩展性和可靠性。 With the rapid growth of the amount of information on the Internet,massive data index appeared,the current index scheme has been difficult to provide efficient and reliable service,therefore,designing and implementing an index for massive data platform model. The platform model using Solr distributed index is generated index file,and then uses the Hadoop cluster,HDFS distributed file system,Map Reduce distributed computing model, Zookeeper synchronous collaborative system and Hbase distributed database technology to handle the coordination management,indexing and storage of mass data,finally,through the experimental test,the platform model can overcome the existing efficiency of mass data index of low current problems,and has good expansibility and reliability.

作者施磊磊施化吉束长波宋玉平

机构地区江苏大学计算机科学与通信工程学院

出处《信息技术》 2015年第6期109-111,114,共4页 Information Technology

关键词 HADOOP集群 SOLR HBASE Hadoop cluster Solr Hbase

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1Tom White.Hadoop权威指南[M].周敏,等译.北京:清华大学出版社,2011.
2Borthakur D.HDFS Architechture Guide[Z/OL].http:∥hadoop.apache.orgldocs/r1.0.4ihdfs_design.html,February 2013.
3Borthakur D.The hadoop distributed file system:Architecture and design[Z/OL].http:∥hadoop.apache.org/common/docs.2007.
4郑启龙,房明,汪胜,王向前,吴晓伟,王昊.基于MapReduce模型的并行科学计算[J].微电子学与计算机,2009,26(8):13-17. 被引量：39
5Apache Zookeeper maintained by Apache[EB/OL].http:∥zookeeper.apache.org/,2013.
6Apache HBase maintained by Apache[EB/OL].http:∥hbase.apache.org/,2013.
7Indexed HBase maintained by Y.Kulbak[EB/OL].https:∥github.com/ykulbak/ihbase,2011.

二级参考文献1

1郑启龙,王昊,吴晓伟,房明.HPMR：多核集群上的高性能计算支撑平台[J].微电子学与计算机,2008,25(9):21-23. 被引量：11

共引文献38

1杨喆,陈锋.使用MapReduce编程模型进行大规模FCD并行处理[J].电子技术（上海）,2010(9):17-19. 被引量：3
2施亮,钱雪忠.基于Hadoop的并行FP-Growth算法的研究与实现[J].微电子学与计算机,2015,32(4):150-154. 被引量：15
3刘超,金海,蒋文斌,李浩.基于MapReduce的数据密集型应用性能优化研究[J].武汉理工大学学报,2010,32(20):36-40. 被引量：3
4李成华,张新访,金海,向文.MapReduce:新型的分布式并行计算编程模型[J].计算机工程与科学,2011,33(3):129-135. 被引量：112
5张圣.一种基于云计算的关联规则Apriori算法[J].通信技术,2011,44(6):141-143. 被引量：25
6李远方,邓世昆,闻玉彪,韩月阳.Hadoop-MapReduce下的PageRank矩阵分块算法[J].计算机技术与发展,2011,21(8):6-9. 被引量：13
7李远方,贾时银,邓世昆,韩月阳.基于树结构的MapReduce模型[J].计算机技术与发展,2011,21(8):149-152. 被引量：9
8李明,胥光辉,戢瑶.MapReduce编程模型在网络I/O密集型程序中的应用研究[J].计算机应用研究,2011,28(9):3372-3374. 被引量：4
9李绍松,尹栋,慕德俊,戴冠中.基于FPGA可扩展的Mapreduce架构设计与实现[J].计算机技术与发展,2012,22(2):103-106. 被引量：1
10陈宫,牛秦洲.基于MapReduce的PageRank算法的研究[J].微电子学与计算机,2012,29(5):81-85. 被引量：5

同被引文献36

1吴溥峰,张玉清.数据库安全综述[J].计算机工程,2006,32(12):85-88. 被引量：96
2晏明春,李酒.一种新型在线数据库审计系统[J].计算机工程与设计,2007,28(5):1012-1015. 被引量：4
3邓攀,刘功申.一种高效的倒排索引存储结构[J].计算机工程与应用,2008,44(31):149-152. 被引量：22
4聂元铭,吴晓明.基于数据库安全审计的研究[J].信息网络安全,2009(6):4-6. 被引量：9
5王禹,赵跃龙.对等网络中全文检索系统的设计与实现[J].计算机工程与应用,2010,46(10):70-72. 被引量：2
6王珊,王会举,覃雄派,周烜.架构大数据:挑战、现状与展望[J].计算机学报,2011,34(10):1741-1752. 被引量：616
7傅巍玮,李仁发,刘钰峰,黄松立.基于Solr的分布式实时搜索模型研究与实现[J].电信科学,2011,27(11):51-56. 被引量：12
8肖大薇.计算机数据库入侵检测技术分析研究[J].信息系统工程,2012(4):54-55. 被引量：7
9李戴维,李宁.基于Solr的分布式全文检索系统的研究与实现[J].计算机与现代化,2012(11):171-176. 被引量：24
10孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169. 被引量：2399

引证文献5

1方建生,王福民.应用Hadoop提升数据库审计系统检索性能的研究[J].计算机系统应用,2016,25(12):30-34. 被引量：1
2蔡武越.网上评卷海量图像数据云存储技术应用探析[J].中国考试,2017(6):48-54. 被引量：1
3杨芬.云计算框架的海量数据查询技术研究[J].吕梁学院学报,2017,7(2):47-49.
4曾莉.面向服务中心的地理信息系统总体架构[J].电子设计工程,2017,25(23):163-168. 被引量：2
5贾贺,艾中良,贾高峰,刘忠麟,陈伯雄.基于Solr的司法大数据检索模型研究与实现[J].计算机工程与应用,2017,53(20):249-253. 被引量：18

二级引证文献22

1曾德生,骆金维,刘倍雄.云计算环境下海量测量数据检索技术研究[J].电子设计工程,2018,26(22):72-76. 被引量：4
2陈欢,黄勃,刘文竹,高永彬,姜晓燕.基于Python的网络新闻爬虫与检索[J].软件导刊,2019,18(5):168-171. 被引量：10
3屈娟娟.大数据网络用户浏览隐式反馈信息检索仿真[J].计算机仿真,2019,36(9):430-433. 被引量：8
4朱亮,周勇,陈佳,吴晔阳,张靖.基于GIS技术的变电站智能运检管理系统[J].电子科技,2020,33(2):71-74. 被引量：13
5涂钒.美国司法数据应用的过去、现实及争议——兼论对我国司法大数据应用的启示[J].科技与法律,2020,0(1):57-67. 被引量：5
6倪斌.司法大数据的现状、挑战及应用改进探讨[J].中阿科技论坛（中英文）,2020(1):140-143.
7吴瑞华.研究生招生考试网上评卷精细化管理研究[J].高教学刊,2020,0(16):164-166. 被引量：3
8涂钒.美国司法数据的应用及争议——兼论对我国司法大数据应用的启示[J].理论月刊,2020(2):92-104.
9侯锐,李杰.多层感知学习下多维大数据智能分类检索仿真[J].计算机仿真,2020,37(5):345-348. 被引量：3
10刘亚静.基于MapReduce的档案信息数据库快速检索系统设计[J].电子设计工程,2020,28(13):45-49. 被引量：5

1逄华,王龙,王剑辉.一种基于移动Agent的分布式并行计算模型[J].计算机技术与发展,2011,21(2):70-72. 被引量：3
2张红,王晓明,曹洁,马彦宏,郭义戎,王慜.Hadoop云平台MapReduce模型优化研究[J].计算机工程与应用,2016,52(22):22-25. 被引量：10
3刘丹丹,陈俊,梁锋,范小朋.云计算异构环境下Hadoop性能分析[J].集成技术,2012,1(4):46-51. 被引量：8
4武森,冯小东,杨杰,张晓楠.基于MapReduce的大规模文本聚类并行化[J].北京科技大学学报,2014,36(10):1411-1419. 被引量：9
5余胜生,文元桥,周敬利.隧道算法的分布式并行计算模型[J].数值计算与计算机应用,2006,27(4):299-306. 被引量：2
6周海英,穆志纯.基于局部视觉感知及语义联想的图像理解模型[J].计算机科学,2013,40(7):258-261.
7黄承宁.大数据和云计算架构应用技术研究[J].福建电脑,2017,33(2):16-17. 被引量：6
8程士林,马驰,张玉军.气象信息系统中海量数据访问的优化方法[J].硅谷,2010,3(14):58-58. 被引量：1
9高天池,李月莲.三峡升船机整体动态仿真软件的分布式并行计算[J].上海交通大学学报,2005,39(6):979-982. 被引量：2
10杨润芝,肖卫青,胡开喜,杨昕,王颖,马强.云计算平台上实现30年气候资料整编的方法[J].计算技术与自动化,2013,32(3):137-140. 被引量：3

信息技术

2015年第6期

浏览历史

内容加载中请稍等...

基于Hadoop和HBase的分布式索引模型的研究被引量：5

参考文献7

二级参考文献1

共引文献38

同被引文献36

引证文献5

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于Hadoop和HBase的分布式索引模型的研究 被引量：5

参考文献7

二级参考文献1

共引文献38

同被引文献36

引证文献5

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于Hadoop和HBase的分布式索引模型的研究被引量：5