一种对时空信息的kNN查询处理方法被引量：10

kNN Query Processing Approach for Content with Location and Time Tags

下载PDF

导出

摘要互联网上每天都会产生大量的带地理位置标签和时间标签的信息,比如微博、新闻、团购等等,如何在众多的信息中找到在时间和空间地理位置上都满足用户查询需求的信息十分重要.针对这一需求,提出了一种对地理位置和时间信息的k近邻查询(ST-k NN查询)处理方法.首先,利用时空相似度对数据对象的地理位置变量和时间变量进行映射变换,将数据对象映射到新的三维空间中,用三维空间中两点之间的距离相似度来近似代替两个对象之间实际的时空相似度;然后,针对这个三维空间设计了一种ST-Rtree(spatial temporal rtree)索引,该索引综合了空间因素和时间因素,保证在查询时每个对象至多遍历1次;最后,在该索引的基础上提出了一种精确的k近邻查询算法,并通过一次计算确定查询结果范围,从而找到前k个结果,保证了查询的高效性.基于大量数据集的实验,证明了该查询处理方法的高效性. Large amounts of content with location and time tags are generated every day on webs such as microblog, news, and group-buying. Thus, it is important to find top-k results that satisfy users＇ temporal and spatial requirements from the contents. In this paper, a novel kNN query （called ST-kNN query） processing approach is proposed for content with location and time tags. First, location variables and time variables of data objects are transformed via temporal ＆ spatial similarity in order to map data objects to a new three-dimensional space. Next, the spatial similarity between two objects in the three-dimensional space is used to approximate the actual temporal ＆ spatial similarity. Then, a new index called ST-Rtree is designed in this three-dimensional space. The index combines location variables ＆ time variables, and ensures every object is traversed no more than once. At last, an exact kNN query algorithm is proposed. The region is determined by computing only once to find top-k results, which guarantees high-efficiency in the query processing. Experiments on large datasets demonstrate that the presented query processing approach is very efficient.

作者李晨申德荣朱命冬寇月聂铁铮于戈

机构地区东北大学计算机科学与工程学院

出处《软件学报》 EI CSCD 北大核心 2016年第9期2278-2289,共12页 Journal of Software

基金国家自然科学基金(61472070) 国家重点基础研究发展计划(973)(2012CB316201)~~

关键词地理位置时间时空相似度索引 K最近邻查询 location time temporal ＆ spatial similarity index k nearest neighbor query

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献2

1周傲英,杨彬,金澈清,马强.基于位置的服务:架构与进展[J].计算机学报,2011,34(7):1155-1171. 被引量：170
2祝蜀平,赵瑾瑾.时空数据库索引方法研究[J].计算机技术与发展,2008,18(7):56-59. 被引量：3

二级参考文献111

1潘晓,肖珍,孟小峰.位置隐私研究综述[J].计算机科学与探索,2007,1(3):268-281. 被引量：65
2Yang B, Lu H, Jensen C S. Scalable continuous range monitoring of moving objects in symbolic indoor space//Proeeedings of the 18th ACM Conference on Information and Knowledge Management. Hong Kong, China, 2009:671-680.
3Wolfson O, Sistla P A, Chamberlain S, Yesha Y. Updating and querying databases that track mobile units. Distributed and Parallel Databases, 1999, 7(3): 257-387.
4Pfoser D, Jensen C S. Capturing the uncertainty of movingobjects representations//Proceedings of the 6th International Symposium on Advances in Spatial Databases. Hong Kong, China, 1999:111-132.
5Cheng R: Kalashnikov D V, Prabhakar S. Querying imprecise data in moving object environments. IEEE Transactions on Knowledge and Data Engineering, 2004, 16(9): 1112- 1127.
6Zhang M, Chen S, Jensen C S, Ooi B C, Zhang Z. Effectively indexing uncertain moving objects for predictive queries// Proceedings of the VLDB Endowment. Lyon, 2009, 2 (1): 1198-1209.
7Cheng R, Chen L, Chen J, Xie X. Evaluating probability threshold k-nearest-neighbor queries over uncertain data// Proceedings of the 12th International Con/erence on Extending Database Technology. Saint Petersburg, 2009 :672-683.
8Tao Y, Cheng R, Xiao X, Ngai W K, Kao B, Prabhakar S. Indexing multi-dimensional uncertain data with arbitrary probability density funetions//Proceedings of the 31st International Conference on Very Large Data Bases. Trondheim, 2005 : 922-933.
9Kalashnikov D V, Ma Y, Mehrotra S, Hariharan R. Index for fast retrieval of uncertain spatial point data//Proceedings of the 14th ACM International Symposium on Geographic Information Systems. Arlington, 2006:195-202.
10Chen J, Cheng R. Efficient evaluation of imprecise location- dependent queries//Proceedings of the 23rd International Conference on Data Engineering. Istanbul, 2007:586-595.

共引文献171

1周长利,陈永红,田晖,蔡绍滨.保护位置隐私和查询内容隐私的路网K近邻查询方法[J].软件学报,2020,31(2):471-492. 被引量：12
2杨涛,孔令波,胡建斌,陈钟.车辆自组网隐私保护研究综述[J].计算机研究与发展,2012,49(S2):178-185. 被引量：8
3毛典辉,蔡强,李海生,曹健.一种自适应情景的位置隐私保护方法[J].中南大学学报（自然科学版）,2013,44(S2):279-283. 被引量：2
4毛典辉,曹健,蔡强,李海生.情境感知的位置隐私保护方法研究进展[J].通信学报,2013,34(S1):230-234. 被引量：1
5赵耘华,白光伟,沈航.基于消息复用的位置服务隐私保护算法[J].微电子学与计算机,2015,32(2):148-152. 被引量：2
6罗军舟,吴文甲,杨明.移动互联网:终端、网络与服务[J].计算机学报,2011,34(11):2029-2051. 被引量：273
7帅向华,聂高众,姜立新,宁宝坤,李永强.国家地震灾情调查系统探讨[J].震灾防御技术,2011,6(4):396-405. 被引量：18
8娄路.面向移动LBS的智能手机室内定位技术探讨[J].电信科学,2012,28(6):98-103. 被引量：7
9于海宁,张宏莉,方滨兴,余翔湛.物联网中物理实体搜索服务的研究[J].电信科学,2012,28(10):111-119. 被引量：6
10甘早斌,袁永光,赵贻竹,鲁宏伟.基于DR-tree的室内移动对象索引研究[J].计算机科学,2012,39(10):177-181. 被引量：6

同被引文献59

1艾廷华,帅赟,李精忠.基于形状相似性识别的空间查询[J].测绘学报,2009,38(4):356-362. 被引量：45
2张明波,陆锋,申排伟,程昌秀.R树家族的演变和发展[J].计算机学报,2005,28(3):289-300. 被引量：94
3刘灿,张德贤.KNN查询处理算法性能研究[J].苏州科技学院学报（自然科学版）,2006,23(3):73-77. 被引量：1
4卢鋆,吴忠望,王宇,卢昱.基于kNN算法的异常行为检测方法研究[J].计算机工程,2007,33(7):133-134. 被引量：12
5张建业,潘泉,张鹏,梁建海.基于斜率表示的时间序列相似性度量方法[J].模式识别与人工智能,2007,20(2):271-274. 被引量：36
6刘亚楠,吴飞,庄越挺.基于多模态子空间相关性传递的视频语义挖掘[J].计算机研究与发展,2009,46(1):1-8. 被引量：12
7卢俊,张保明,黄薇,李二森.基于GPU的遥感影像数据融合IHS变换算法[J].计算机工程,2009,35(7):261-263. 被引量：18
8YAN Haowen.Fundamental Theories of Spatial Similarity Relations in Multi-scale Map Spaces[J].Chinese Geographical Science,2010,20(1):18-22. 被引量：18
9韩敏,唐常杰,段磊,李川,巩杰.基于TF-IDF相似度的标签聚类方法[J].计算机科学与探索,2010,4(3):240-246. 被引量：22
10乐德广,常晋义,刘祥南,郭东辉.基于GPU的MD5高速解密算法的实现[J].计算机工程,2010,36(11):154-155. 被引量：14

引证文献10

1朱命冬,徐立新,申德荣,寇月,聂铁铮.面向不确定文本数据的余弦相似性查询方法[J].计算机科学与探索,2018,12(1):49-64. 被引量：12
2孙一格,马昂,吴雷,潘晓,郭景峰.智慧旅游中基于语义轨迹的高效最近邻查询方法研究[J].计算机应用与软件,2018,35(6):36-41. 被引量：1
3汤佳,龚奕利,李文海.一种基于GPU的KNN动态扩展查询策略[J].计算机工程,2018,44(6):1-7.
4李建勋,佟瑞,张永进,唐子豪.基于趋势面与SSIM的时空数据相似度算法[J].计算机工程,2018,44(9):52-58. 被引量：12
5雷建云,彭媛,孙翀,帖军.一种社交网络环境下并行短文本查询算法[J].中南民族大学学报（自然科学版）,2018,37(3):123-128. 被引量：2
6武海龙,武海艳.云计算光纤网络中大数据异常负载检测模型[J].激光杂志,2019,40(6):207-211. 被引量：6
7严盛隆,于娟,周后盘.IIVMM:针对低频GPS轨迹的改进交互式投票匹配算法[J].计算机科学,2019,46(9):325-332. 被引量：3
8潘晓,马昂,郭景峰,吴雷,刘风阳.基于时间序列的轨迹数据相似性度量方法研究及应用综述[J].燕山大学学报,2019,43(6):531-545. 被引量：18
9杨睿,苏丹,刘超,高松,闫磊.基于网络编码技术的医疗保险数据更新方法[J].信息技术,2020,44(4):107-110. 被引量：4
10闫浩文,杨维芳,禄小敏,诸天舒,马犇,殷硕硕.简单曲线无量纲形状相似度计算方法[J].地球信息科学学报,2023,25(12):2418-2426.

二级引证文献58

1殷吉崇,武芳,李安平,杜佳威,刘呈熠.顾及速度与航向信息的轨迹匹配方法[J].武汉大学学报（信息科学版）,2021,46(11):1774-1781. 被引量：1
2杨雄,郭佳豪,方鑫,张旭辉.基于改进动态时间规整算法的终端波形比对方法[J].电子测量技术,2023,46(6):178-184.
3宋辉,代杰杰,张卫东,毕凯,罗林根,盛戈皞,江秀臣.基于变分贝叶斯自编码器的局部放电数据匹配方法[J].中国电机工程学报,2018,38(19):5869-5877. 被引量：13
4吴俊杰.基于大数据的交通处理平台的分析与应用[J].佳木斯大学学报（自然科学版）,2019,37(1):46-49.
5刘婷.基于空间关联的中国PM_(2.5)污染数据统计研究[J].环境科学与管理,2019,44(2):137-140.
6陈张帆,庞帆,张婷,田昀.电力设备信息智能理解与匹配的方法研究及应用[J].电脑知识与技术,2019,15(5X):250-251. 被引量：3
7黄贤明.基于知识图谱的包装产业大数据智能问答系统研究[J].现代电子技术,2019,42(14):148-151. 被引量：1
8高远,李青.基于容器理论的模式识别算法[J].自动化技术与应用,2019,38(6):117-121. 被引量：1
9林倩瑜.基于模糊卷积神经网络的大数据分类挖掘技术[J].重庆理工大学学报（自然科学）,2019,33(10):121-126. 被引量：15
10李炜.大数据云存储下海量数据传输完整度控制技术[J].吉林大学学报（信息科学版）,2019,37(6):682-686. 被引量：6

1周鸣争,汪军,严楠,刘涛.无线传感器网络中一种基于行为可信的访问控制机制[J].计算机科学,2012,39(B06):72-76. 被引量：4
2阜艳,陈杰.距离相似度在支持向量数据描述中的应用[J].广东农工商职业技术学院学报,2010,26(3):70-72.
3吴昊,耿焕同,吴祥.一种基于聚类分析的BBS主题发现算法研究[J].安徽师范大学学报（自然科学版）,2009,32(1):9-13. 被引量：7
4叶青,周鸣争.无线传感器网络中基于行为可信安全认证机制[J].现代计算机,2010,16(4):10-15.
5韩敬贤,齐美彬,蒋建国.基于外观模型和时空模型的多摄像机目标跟踪[J].合肥工业大学学报（自然科学版）,2016,39(12):1639-1643.
6罗维佳,乔少杰,韩楠,元昌安,闭应洲,舒红平.面向LBSN的k-medoids聚类算法[J].中国科学技术大学学报,2017,47(1):70-79. 被引量：1
7张志斌.电力GIS公共平台的研究与实现[J].网络安全技术与应用,2015(11):130-131.
8李红林,杨莉,伍红玲,陈小骏,申静.基于多种特征的车牌定位方法[J].云南大学学报（自然科学版）,2006,28(S2):94-96.
9朱程,周鸣争,许金生.BTSR:一种基于行为可信的安全数据融合与路由算法[J].计算机应用,2008,28(11):2820-2823. 被引量：6
10刘松晖,吴俊,徐巍华,陈生.一种基于模型的输出反馈网络化控制系统[J].工业控制计算机,2006,19(8):1-2. 被引量：1

软件学报

2016年第9期

浏览历史

内容加载中请稍等...

一种对时空信息的kNN查询处理方法被引量：10

参考文献2

二级参考文献111

共引文献171

同被引文献59

引证文献10

二级引证文献58

相关作者

相关机构

相关主题

浏览历史

一种对时空信息的kNN查询处理方法 被引量：10

参考文献2

二级参考文献111

共引文献171

同被引文献59

引证文献10

二级引证文献58

相关作者

相关机构

相关主题

浏览历史

一种对时空信息的kNN查询处理方法被引量：10