-
题名HBase下的高效时空分类索引
被引量:3
- 1
-
-
作者
袁茂林
秦小麟
刘亮
王胜
-
机构
南京航空航天大学计算机技术与科学学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2017年第6期1231-1236,共6页
-
基金
国家自然科学基金项目(61373015)资助
-
文摘
海量流数据具有体量大、更新速度快、多维度、多属性等特点,其存储和查询是近年来学术界和工业界的研究热点之一.HBase系统为海量流数据的存储管理提供了一套具有高可扩展性的技术方法和系统平台.然而HBase仅支持主键索引,导致非主键数据查询效率较低,尤其是对于多维的数据.针对交通流数据场景提出一种具有高插入和查询效率的索引结构TA-index.TA-index考虑数据访问时的时间和空间局部性,从而更准确地获得数据的特征,通过对时间和空间的不同分类索引,减少索引的数据量,提供实时的数据分析能力.实验表明该算法效率比现有算法更优,而且具有高可扩展性,可以同时支持高吞吐量和高效多维查询.
-
关键词
流数据
HBASE
分类
索引
-
Keywords
stream data
HBase
classification
index
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名空间多关键词Skyline查询算法
被引量:3
- 2
-
-
作者
李星罗
秦小麟
王宁
周杨淏
鲍斌国
-
机构
南京航空航天大学计算机技术与科学学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2019年第10期2175-2181,共7页
-
基金
国家自然科学基金项目(61373015,61728204)资助
-
文摘
近年来,随着用户对于查询偏好性需求的增加,基于关键词的Skyline查询逐渐成为研究热点.针对实际应用中用户从当前空间位置及对象文本属性多角度审视某一数据集的需求,充分研究空间多关键词Skyline查询问题.在分析现有查询算法的不足基础上,建立了基于加权距离的空间文本支配模型,并提出了一种空间文本索引结构STR-Tree.该索引将空间区域信息与区域内的对象文本信息相结合,对查询无关区域进行快速且有效的剪枝.在此基础上,给出了一种空间多关键词Skyline查询算法SKS,通过采用最小值过滤等剪枝策略,进一步提升查询效率.最后,分别采用模拟数据集和真实数据集进行实验,结果表明SKS算法可以高效地处理空间多关键词Skyline查询.
-
关键词
SKYLINE查询
空间关键词
空间文本索引
空间数据库
-
Keywords
Skyline query
spatial keywords
spatio-textual index
spatial database
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名反向时间依赖路网上移动对象的启发式k近邻查询算法
被引量:1
- 3
-
-
作者
宋力翔
秦小麟
-
机构
南京航空航天大学计算机技术与科学学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第7期1532-1538,共7页
-
基金
国家自然科学基金项目(61728204)资助。
-
文摘
针对实际应用中用户在真实路网上进行移动服务(如出租车,救护车,外卖等)的查询需求,提出反向时间依赖路网上移动对象的k近邻查询问题.在分析现有查询算法的不足后,建立了反向时间依赖路网和基于标记点的最短路径树.并在此基础上,给出了一种针对反向时间依赖路网上移动对象的k近邻查询算法TDSPT-k NN.通过采用基于最短路径树的启发式函数等剪枝策略,进一步提升查询效率.最后,通过仿真实验对TDSPT-k NN算法和已有算法在多种情况下的对比分析,结果表明相比现有算法,TDSPT-k NN算法查询效率平均提升65.9%,可以高效地处理反向时间依赖路网上移动对象的k近邻查询问题.
-
关键词
K近邻查询
移动对象
时间依赖路网
启发式算法
最短路径树
-
Keywords
k nearest neighbor query
mobile object
time-dependent road network
heuristic algorithm
shortest path tree
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种面向动态偏好的交互式多目标查询
- 4
-
-
作者
郭成盖
秦小麟
丁有伟
王潇逸
项哲慧
-
机构
南京航空航天大学计算机技术与科学学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2017年第12期2777-2784,共8页
-
基金
国家自然科学基金项目(61373015)资助
-
文摘
同一问题的迭代查询之间存在关联,且不同查询间用户偏好动态变化.但现有查询算法只是将不同查询独立处理或默认查询间偏好固定不变,本文提出一种可有效利用查询间关联关系且支持动态偏好的查询处理算法IMQD;定义一种结果集质量度量方法,取值在[0,1]区间内且取值越大越优.IMQD算法旨在使结果集质量更高,将查询处理过程分为三个步骤:首先确定初始候选集;然后通过用户交互获取调整后的偏好阈值,对当前候选集进行调整,使结果集质量取值更大;用户根据当前结果集质量判定是否终止查询.在模拟和真实数据集上验证IMQD算法可提升结果集质量且拥有良好交互性能.一旦用户偏好发生变化,算法可在毫秒级内完成对结果集的自适应调整.
-
关键词
多目标查询
动态偏好
偏好阈值
用户交互
自适应调整
-
Keywords
multi-objective query
dynamic preference
preference bound
user interaction
adaptive adjustment
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名一种基于群组的反向k排名查询算法
- 5
-
-
作者
周杨淏
秦小麟
谢小军
郭成盖
-
机构
南京航空航天大学计算机技术与科学学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2018年第10期2271-2278,共8页
-
基金
国家自然科学基金项目(61373015
61300052
61402225)资助
-
文摘
近年来,随着偏好查询主体视角的变化,对于反向排名的查询成为研究热点.反向k排名查询以产品作为主体,为给定的产品查询对其而言最优的k个用户,这在产品推荐、商业评估等方面有着非常重要的应用.然而,针对多产品点查询的问题,现有的方法在结果集质量和查询效率上都存在一定的不足.为此,本文提出了一种基于群组的反向k排名查询算法GP-Rkr.该方法首先通过动态阈值调整,对查询点集合进行有效分割;在此基础上,给出了一种层次网格索引结构LG-Index,并基于该索引结构在数据集上进行裁剪和过滤,采用层次渐进式的求解策略,进一步优化查询效率.最后,在人造数据和真实数据集上进行了实验.实验结果表明,本文提出的查询方法能够有效提高结果集质量,并且具有更好的查询效率.
-
关键词
查询主体
反向k排名查询
阈值调整
层次网格索引
-
Keywords
query subject
reverse rank query
threshold adjustment
layer grid index
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-