基于云计算的大数据信息检索技术研究被引量：9

Technology Research of Large Data Information Retrieval Based on Cloud Computing

下载PDF

导出

摘要随着云计算的快速发展,信息呈现爆炸式增长。廉价的云存储和计算能力,加速了大数据的产生,也使得解决大数据的信息收集和信息检索成为必然。大数据超过50%是非结构化数据,所以它们绝大部分以文件的形式存储。大数据被分成许多块存储在块服务器中,同时也产生存储在主服务器上的相应元数据。该文就如何收集大数据的web-url及关键词,又如何检索其中的信息,作了探讨。 With the rapid development of cloud computing,information increases rapidly.Cheap cloud storage and computing accelerates the data＇s generation.It also makes that the solution to large data information collection and information retrieval has become inevitable.Over 50 percent of large data is non-structured,so the majority of them are stored as files.Big data is divided into many blocks stored in a block server.And at the same time it also generates the corresponding metadata stored on the master server.This article discussed on how to collect web-url and its keyword of big data and how to retrieve its information.

作者吴雪琴舒晓苓 WU Xue-qin, SHU Xiao-ling （Computer Department of Sichuan TOP IT Vocational Institute, Chengdu 611743, China）

机构地区四川托普信息技术职业学院计算机系

出处《电脑知识与技术》 2014年第4期2388-2390,共3页 Computer Knowledge and Technology

关键词云计算大数据信息收集检索机制 cloud computing big data information collection retrieval mechanism

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1Google File System(GFS).http://wenku.baidu.com/view/8a839535ee06eff9aefS074d.html.2012.
2谷歌搜索引擎工作原理简介.http://wenku.baidu.com/view/ff86db2ced630b1c59eetl56a.html.

同被引文献45

1Hadoop.Apache Hadoop[EB/OL]. [2011-12-27]. http://hadoop.apache.org.
2BORTHAKUR D. The hadoop distributed file system: Architecture and design[Z]. Hadoop Project Website, 2007: 1-10.
3DEAN J, GHEMAWAT S. MapReduce: simplified data processing on large clusters[J]. In Proceedings of Operating Systems Design and Implementation (OSDI), San Francisco,USA,2004, 51(1):107-113.
4POTTHAST M, GOLLUB T, HAGEN M, et al. Overview of the 4th International Competition on Plagiarism Detection[C]//CLEF 2012 Conference and Labs of the Evaluation Forum. Rome, Italy, 2012: 1-9.
5XU Jinxi, CALLAN J. Effective retrieval with distributed collections[C]//Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. New York, USA, 1998: 112-120.
6ICHIKAWA Y, UEHARA M. Distributed search engine for an IaaS based cloud[C]// 2011 International Conference on Broadband and Wireless Computing, Communication and Applications (BWCCA). Washington D C, USA, 2011: 34-39.
7PARO A. ElasticSearch cookbook[M]. Bermingham: Packt Publishing Ltd, 2013: 5-25.
8Lemur. ClueWeb[EB/OL]. [2009-2-24]. http://lemurproject.org.
9宗凯韵.基于大数据的用户信息检索行为分析[J].华东理工大学,2015,4(13):33-36.
10Arinto Murdopo, distributed Decision Tree Learning for Mining Big Data Streams [ J ]. master of Science Thesis, European Master in Distributed Computing, 2013,07:21 - 22.

引证文献9

1孙海军.基于云计算的大数据处理技术[J].信息安全与技术,2014,5(11):61-63. 被引量：8
2龚旭.基于云计算的大数据处理技术探讨[J].电子技术与软件工程,2015(10):198-198. 被引量：9
3路晶.基于云计算的大数据处理[J].信息与电脑,2015,27(7):99-100.
4王素红,宁慧,王明星,徐丽.基于Hadoop的抄袭检测的源检索方法研究[J].应用科技,2015,42(6):67-71.
5钱冬梅,范春树.通信网络大数据挖掘智能加速算法研究[J].激光杂志,2016,37(3):132-135. 被引量：4
6吴谋硕.基于云计算的Web信息收集与检索过程分析[J].信息与电脑,2016,28(15):34-35. 被引量：1
7王国威.警务通信网络大数据挖掘智能加速算法探讨[J].数字技术与应用,2018,36(8):109-109.
8沈夏添,吕丽华.基于云计算的信息检索定位研究[J].电脑知识与技术,2018,14(3Z):210-211. 被引量：4
9韩莹.基于云计算的大数据处理技术研究[J].信息与电脑,2017,29(4):141-143. 被引量：2

二级引证文献26

1谢凌钦,石萍,蔡文杰.可穿戴式智能设备关键技术及发展趋势[J].生物医学工程与临床,2015,19(6):635-640. 被引量：36
2伍洪斌.基于云计算的移动通信4G网络优化[J].移动通信,2015,39(24):10-16. 被引量：10
3谢川.基于混沌关联维特征提取的大数据聚类算法[J].计算机科学,2016,43(6):229-232. 被引量：6
4鲁明珠,赵治月.基于数据挖掘的光电跟踪伺服控制系统[J].激光杂志,2016,37(9):99-102. 被引量：1
5武永成.基于云计算的大数据处理与分析综述[J].软件导刊,2016,15(12):161-163. 被引量：3
6潘乐.基于云计算的大数据处理技术研究[J].物联网技术,2017,7(6):67-68. 被引量：11
7罗耀军,胡玲,任硕果.Android云存储客户端应用开发能力培养的教学设计[J].广西教育,2017,0(15):189-190.
8邵云峰,彭涛.工业智能化背景下导弹测试技术的发展思考[J].现代防御技术,2017,45(4):157-161. 被引量：5
9段思伟.大数据背景下图书馆信息服务研究进展[J].农业图书情报学刊,2017,29(9):87-90. 被引量：8
10李薇.基于云计算的大数据处理技术探讨[J].数字技术与应用,2017,35(8):218-219. 被引量：5

1王真,刘海燕.搜索引擎的比较及在网络信息检索中的作用[J].黑龙江科技信息,2011(18):106-106. 被引量：1
2何咏梅,毛云舸.搜索引擎的发展现状与趋势研究[J].吉林省经济管理干部学院学报,2007,21(4):65-68. 被引量：6
3周平.Lucene全文检索引擎技术及应用[J].重庆工学院学报,2007,21(7):86-88. 被引量：10
4陈传波,曹鱼.Web技术在数据库信息系统中的应用[J].湖北航天科技,1998(5):31-35.
5薛志强,刘鹏,文艾,周游,许闯.分布式文件系统管理策略研究[J].电脑知识与技术,2011,7(1):11-12. 被引量：5
6李洋.配置辅助域名服务器[J].网管员世界,2010(24):78-78.
7徐晖.数据挖掘技术在web中的应用分析[J].信息与电脑（理论版）,2013,0(10):145-146. 被引量：1
8郑德权,于凤,于浩,赵铁军.提高Web信息检索精度的多步策略[J].哈尔滨商业大学学报（自然科学版）,2003,19(3):303-305. 被引量：2
9NetBackup主服务器的完全恢复[J].网管员世界,2010(18):110-111.
10崔春,龚捷.Web信息抽取研究综述[J].电脑知识与技术,2011,7(4):2279-2280. 被引量：2

电脑知识与技术

2014年第4期

浏览历史

内容加载中请稍等...

基于云计算的大数据信息检索技术研究被引量：9

参考文献2

同被引文献45

引证文献9

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于云计算的大数据信息检索技术研究 被引量：9

参考文献2

同被引文献45

引证文献9

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于云计算的大数据信息检索技术研究被引量：9