基于Solr的数据检索技术研究被引量：7

Data Retrieval Technique Research Based on Solr

下载PDF

导出

摘要针对海量过车数据检索困难的问题,设计了一款基于Solr的大规模分布式数据检索系统.前端IPC采集的数据经过结构化处理之后发送到后端,数据先缓存在消息队列中,再通过Spark Streaming实时计算框架对缓存的数据进行消费,将数据搬运到数据库HBase中,最后由Solr爬取HBase中的数据,根据用户的配置建立索引文件.查询时,用户通过点击Web界面下发查询条件,系统将查询条件解析为Solr能够识别的查询语句,从索引文件中取出相应的信息,最后从HBase中取出完整的数据,返回到界面显示.测试结果表明,系统工作稳定,可存储海量多种类型数据,索引建立速度为1 000条/s,当数据库中存储一千亿条过车记录时,对此类TB级别数据进行各种条件查询的响应时间均在10s之内. A distributed data retrieval system is designed based on Solr.The front-end IPC collects monitor data,which sends them to the back-end after its structure processed.The data is cached in the message queue.Then it is carried to HBase by Spark Streaming the real-time calculation framework.Finally,Solr crawls data in HBase and create index file according to the user's requirement of configuration.Users issue the query through clicking the Web interface in querying.Then the system analyzes inquiry condition into inquiry sentences that can be identified by Solr.Next,Solr extract the corresponding information from the index file.Finally,the system extracts the complete data from HBase and return to display in the interface.Measurement results show that the system is stable and can store many types of data.Over1000/s of indexing speed is achieved.The response times of a variety of conditions are less than10seconds,when the database is stored over100billion car records.

作者程知群章超韩高帅 CHENG Zhiqun;ZHANG Chao;HAN GaoShuai(School of Electronic Information,Hangzhou Dianzi University,Hangzhou Zhejiang 310018, China)

机构地区杭州电子科技大学电子信息学院

出处《杭州电子科技大学学报（自然科学版）》 2017年第1期11-15,共5页 Journal of Hangzhou Dianzi University：Natural Sciences

关键词大数据智能交通 SOLR 索引 big data intelligent transportation Solr index

分类号 TP319 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1牛涛.建立基于Solr平台的质量信息检索系统[J].电子科学技术,2016,3(5):590-593. 被引量：3
2蔡宇晶,孙玫肖,朱建军.Solr在乐龄易购网站中的应用[J].铁路计算机应用,2016,25(10):53-56. 被引量：1
3刘小明,何忠贺.城市智能交通系统技术发展现状及趋势[J].自动化博览,2015,32(1):58-60. 被引量：41

二级参考文献9

1刘建国,黄厚宽.使用分类和聚类提高搜索引擎的可用性[J].铁路计算机应用,2006,15(3):44-46. 被引量：1
2徐赫.2014中国城市智能交通市场研究报告[R].第三届中国智能交通市场年会,2014.
3Apache Sotr[EB/OL].http://lucene.apache.org/solr/,2016-03-09.
4HtmlParser[EB/OL].http://sourceforge.net/projects/ htmlparser/,2016-03 -28.
5李永春,丁华福.Lucene的全文检索的研究与应用[J].计算机技术与发展,2010,20(2):12-15. 被引量：55
6李戴维,李宁.基于Solr的分布式全文检索系统的研究与实现[J].计算机与现代化,2012(11):171-176. 被引量：24
7林祥兴.厦门:智能交通助力畅通工程[J].道路交通管理,2013(9):38-39. 被引量：2
8陆化普,李瑞敏.城市智能交通系统的发展现状与趋势[J].工程研究（跨学科视野中的工程）,2014,6(1):6-19. 被引量：142
9赵娜,袁家斌,徐晗.智能交通系统综述[J].计算机科学,2014,41(11):7-11. 被引量：133

共引文献42

1涂然,顾一帆,蒋玮辉,徐亚楠.基于HFT函数的智能交通系统[J].广东经济,2017,0(1X):209-209.
2屈毅.浅析我国智能交通系统发展现状及前景展望[J].科技视界,2015(14):100-100. 被引量：8
3李正熙.中国城市智能交通系统产业化发展趋势[J].自动化博览,2015,32(7):60-62. 被引量：19
4翟婧彤,王振坡,王丽艳.“互联网+”时代的城市交通变革与发展[J].城市,2015(9):70-74. 被引量：18
5杨静,张晓,王立群.大数据技术在智能交通中的应用研究[J].科技风,2015(19):110-110. 被引量：1
6霍明林,张琦.大数据背景下的智能交通系统应用与平台构建[J].山东工业技术,2016(3):118-119. 被引量：7
7万文杰,许助,熊超,费鹏.基于GPRS技术的无人机在交通流量监测中的应用[J].仪器仪表用户,2016,23(1):65-67. 被引量：3
8赵静,孙静.冬奥背景下张家口智能交通管理建设策略[J].福建质量管理,2016(2):66-67. 被引量：1
9丁宁.车载界面中导航设计的发展趋势研究[J].设计,2016,29(13):128-129. 被引量：2
10汤晓龙.湛江城市智能交通系统发展的策略思考[J].北方经贸,2016(8):61-63.

同被引文献79

1殷小丽.新时代网络新闻舆论的时代特征与引导策略[J].传媒论坛,2019,2(9):74-75. 被引量：1
2邹纲,刘洋,刘群,孟遥,于浩,西野文人,亢世勇.面向Internet的中文新词语检测[J].中文信息学报,2004,18(6):1-9. 被引量：59
3王禹,赵跃龙.对等网络中全文检索系统的设计与实现[J].计算机工程与应用,2010,46(10):70-72. 被引量：2
4潘明远,方金云,章立生.基于用户反馈的POI搜索引擎优化研究[J].计算机工程与应用,2010,46(32):112-115. 被引量：6
5鲜国建,赵瑞雪.基于Solr的中文农业期刊文摘检索系统的构建研究[J].现代图书情报技术,2011(6):51-58. 被引量：12
6霍庆,刘培植.使用Solr为大数据库搭建搜索引擎[J].软件,2011,32(6):11-14. 被引量：16
7刘佳,钟永恒.国际标准文献检索平台的比较及启示[J].图书馆学研究（应用版）,2011(10):60-64. 被引量：6
8傅巍玮,李仁发,刘钰峰,黄松立.基于Solr的分布式实时搜索模型研究与实现[J].电信科学,2011,27(11):51-56. 被引量：12
9马凤娟,吴鹏飞.基于Solr的异构资源集成检索框架设计与实现[J].现代情报,2012,32(8):133-135. 被引量：3
10李戴维,李宁.基于Solr的分布式全文检索系统的研究与实现[J].计算机与现代化,2012(11):171-176. 被引量：24

引证文献7

1苏亚涛.基于Solr的低成本企业数据采集分析与设计[J].呼伦贝尔学院学报,2018,26(4):99-103. 被引量：1
2贾贺,艾中良,贾高峰,刘忠麟,陈伯雄.基于Solr的司法大数据检索模型研究与实现[J].计算机工程与应用,2017,53(20):249-253. 被引量：18
3曾德生,骆金维,刘倍雄.云计算环境下海量测量数据检索技术研究[J].电子设计工程,2018,26(22):72-76. 被引量：4
4杨强,张钧鸣.基于微服务架构的大数据应用开发创新实践[J].电力大数据,2019,22(3):71-76. 被引量：19
5李宁,石善球,聂时贵.基于用户搜索习惯的“天地图·江苏” POI检索优化机制的设计与实现[J].测绘与空间地理信息,2019,42(7):165-166. 被引量：1
6于晓明,史胜楠,甘克勤.基于Solr的标准信息检索技术及其优化[J].科学技术与工程,2020,20(4):1504-1508. 被引量：13
7李作康,王妍妍,高菁.基于事件的地区局势分析方法[J].指挥信息系统与技术,2021,12(1):55-59.

二级引证文献55

1曾德生,骆金维,刘倍雄.云计算环境下海量测量数据检索技术研究[J].电子设计工程,2018,26(22):72-76. 被引量：4
2陈欢,黄勃,刘文竹,高永彬,姜晓燕.基于Python的网络新闻爬虫与检索[J].软件导刊,2019,18(5):168-171. 被引量：10
3曹宏宇,胡恒.基于微服务架构的智能终端软件架构探讨[J].科技创新与应用,2019,0(20):17-19. 被引量：7
4凌武能,莫东,张德亮,黄红伟,毛文照,游成彬.基于分布式计算的月度机组组合高效算法设计[J].电力大数据,2019,22(8):14-20. 被引量：4
5陈蕾.基于云计算模式的机器辅助翻译系统优化设计[J].现代电子技术,2019,42(17):147-151. 被引量：2
6孙磊,刘华辰,赵月奋.云计算下均衡传输链路数据包快速检索方法[J].内蒙古民族大学学报（自然科学版）,2019,34(5):402-406.
7李曙军,张宏杰,王海棠,王秋爽.基于场景理论的STAC课程数据库自动检索系统[J].吉林大学学报（信息科学版）,2019,37(4):457-462. 被引量：1
8刘友旗.企业级自动化数据采集平台的设计与实现[J].信息技术与信息化,2019,0(9):32-34.
9屈娟娟.大数据网络用户浏览隐式反馈信息检索仿真[J].计算机仿真,2019,36(9):430-433. 被引量：8
10涂钒.美国司法数据应用的过去、现实及争议——兼论对我国司法大数据应用的启示[J].科技与法律,2020,0(1):57-67. 被引量：5

1许杰,冷冰,李明桂,丁文超.大数据处理技术在安全审计系统中的应用[J].通信技术,2016,49(3):346-351. 被引量：9
2秦军.使用PowerBuilder实现多种条件查询[J].软件开发与应用,1997(1):43-46.
3饭饭.让锁屏界面显示更多信息[J].电脑迷,2014,0(11):86-86.
4英锋,冯玉芬.MIS中数据加密技术研究[J].网络安全技术与应用,2007(11):89-90.
5汤丽平,仪维宪,罗耀华.运用PB实现多RDBMS操作[J].电脑学习,2000(1):19-20.
6杜世春,张开芳.在PB中实现组合复杂的查询条件[J].电脑编程技巧与维护,2008(9):25-28.
7Web界面下使用网络硬盘[J].新浪潮．学网络,2001(2):21-40.
8丁振凡,邹芝兰.ASP动态网页中基于日期的条件查询设计技术[J].计算机时代,2001(3):19-20.
9杨令省,施继红,张志龙.一种易扩展通用Web查询系统的设计模式[J].计算机时代,2009(3). 被引量：1
10褚永刚,吕慧勤,杨义先,胡正名.大规模分布式入侵检测系统的体系结构模型[J].计算机应用研究,2004,21(12):105-106. 被引量：7

杭州电子科技大学学报（自然科学版）

2017年第1期

浏览历史

内容加载中请稍等...

基于Solr的数据检索技术研究被引量：7

参考文献3

二级参考文献9

共引文献42

同被引文献79

引证文献7

二级引证文献55

相关作者

相关机构

相关主题

浏览历史

基于Solr的数据检索技术研究 被引量：7

参考文献3

二级参考文献9

共引文献42

同被引文献79

引证文献7

二级引证文献55

相关作者

相关机构

相关主题

浏览历史

基于Solr的数据检索技术研究被引量：7