期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
Supporting Various Top-k Queries over Uncertain Datasets
1
作者 LI Wenfeng FU Zufa +2 位作者 WANG Liwei LI Deyi PENG Zhiyong 《Wuhan University Journal of Natural Sciences》 CAS 2014年第1期84-92,共9页
There have been many researches and semantics in answering top-k queries on uncertain data in various applications. However, most of these semantics must consume much of their time in computing position probability. O... There have been many researches and semantics in answering top-k queries on uncertain data in various applications. However, most of these semantics must consume much of their time in computing position probability. Our approach to support various top-k queries is based on position probability distribution (PPD) sharing. In this paper, a PPD-tree structure and several basic operations on it are proposed to support various top-k queries. In addition, we proposed an approximation method to improve the efficiency of PPD generation. We also verify the effectiveness and efficiency of our approach by both theoretical analysis and experiments. 展开更多
关键词 top-k queries uncertain data position probability distribution
原文传递
Continuous Outlier Monitoring on Uncertain Data Streams
2
作者 曹科研 王国仁 +3 位作者 韩东红 丁国辉 王爱侠 石凌旭 《Journal of Computer Science & Technology》 SCIE EI CSCD 2014年第3期436-448,共13页
Outlier detection on data streams is an important task in data mining. The challenges become even larger when considering uncertain data. This paper studies the problem of outlier detection on uncertain data streams. ... Outlier detection on data streams is an important task in data mining. The challenges become even larger when considering uncertain data. This paper studies the problem of outlier detection on uncertain data streams. We propose Continuous Uncertain Outlier Detection (CUOD), which can quickly determine the nature of the uncertain elements by pruning to improve the efficiency. Furthermore, we propose a pruning approach -- Probability Pruning for Continuous Uncertain Outlier Detection (PCUOD) to reduce the detection cost. It is an estimated outlier probability method which can effectively reduce the amount of calculations. The cost of PCUOD incremental algorithm can satisfy the demand of uncertain data streams. Finally, a new method for parameter variable queries to CUOD is proposed, enabling the concurrent execution of different queries. To the best of our knowledge, this paper is the first work to perform outlier detection on uncertain data streams which can handle parameter variable queries simultaneously. Our methods are verified using both real data and synthetic data. The results show that they are able to reduce the required storage and running time. 展开更多
关键词 outlier detection uncertain data stream data mining parameter variable query
原文传递
一种基于滑动窗口的不确定数据流Top-K查询算法 被引量:2
3
作者 汤克明 戴彩艳 陈崚 《南京大学学报(自然科学版)》 CSCD 北大核心 2012年第3期351-359,共9页
由于不确定数据流在诸如移动计算、无线射频识别技术和传感器网络等实际应用中广泛存在,如何利用有限存储空间进行快速查询处理是不确定数据流管理的重要问题.本文研究基于滑动窗口模型的不确定数据流Top-K查询的问题,提出了相应的算法... 由于不确定数据流在诸如移动计算、无线射频识别技术和传感器网络等实际应用中广泛存在,如何利用有限存储空间进行快速查询处理是不确定数据流管理的重要问题.本文研究基于滑动窗口模型的不确定数据流Top-K查询的问题,提出了相应的算法.该算法利用滑动窗口数据模型存储不确定流数据,建立3个概要表,当前窗口中的元组分别按照它们出现的顺序、它们的得分值的大小、它们的出现概率值的大小存入这3个表中.算法逐次在得分值最高的前若干个元组中选取概率值最高的前k项元组集合,并计算它们的发生概率.我们在理论上证明了,这些前k项元组集合中概率最高的就是Top-K查询结果.实验结果表明,所提出的查询算法在时间与空间复杂性方面优于其他类似的算法. 展开更多
关键词 不确定数据 数据流 top-k查询 滑动窗口
下载PDF
RFID不确定数据流中的Top-K查询研究
4
作者 卢印举 李志超 苏玉 《电子设计工程》 2013年第16期21-23,共3页
在游客游迹跟踪与追溯系统中,产生大量不确定数据,有效的Top-K查询处理是不确定性数据管理中一项重要技术。研究了运用Top-K检索不确定数据的问题,定义了不确定数据流元组的查询语义,提出了一种在记录向量的基础上的不确定数据查询算法... 在游客游迹跟踪与追溯系统中,产生大量不确定数据,有效的Top-K查询处理是不确定性数据管理中一项重要技术。研究了运用Top-K检索不确定数据的问题,定义了不确定数据流元组的查询语义,提出了一种在记录向量的基础上的不确定数据查询算法,并利用实例演示了查询的过程。该算法按照元组的得分值进行降序排列,概率值最高的前k个元组集合就是Top-K的查询结果,实验结果表明,本文的算法更具高效性和实用性。 展开更多
关键词 不确定数据 元组 top-k查询 可能世界
下载PDF
一种有效的不确定数据流Top-K查询算法
5
作者 梁银双 苏玉 卢印举 《电子设计工程》 2013年第16期50-52,55,共4页
Top-K查询处理是不确定性数据管理中一项重要技术。本文在分析不确定性数据模型和可能世界模型的基础上,定义了不确定数据流元组的查询语义,提出了基于记录向量的Top-K查询算法,该算法根据K值,计算并返回分值最高前K个结果,其查询结果... Top-K查询处理是不确定性数据管理中一项重要技术。本文在分析不确定性数据模型和可能世界模型的基础上,定义了不确定数据流元组的查询语义,提出了基于记录向量的Top-K查询算法,该算法根据K值,计算并返回分值最高前K个结果,其查询结果评价综合考虑了查询结果在可能世界语义下的概率大小。实验结果表明,与CSQ和SCSQ算法相比,本算法更具高效性和实用性。 展开更多
关键词 不确定数据 元组 top-k查询 可能世界
下载PDF
一种高效的不确定数据流Top-K查询算法
6
作者 卢印举 单国全 《科学技术与工程》 北大核心 2013年第18期5366-5370,共5页
在传感器网络、RFID等各种应用中会产生大量不确定性数据,有效的Top-K查询处理是不确定性数据管理中一项重要技术。针对已有的Top-K查询没有很好地结合元组的分值和不确定性,在分析不确定性数据模型和可能世界模型的基础上,定义了不确... 在传感器网络、RFID等各种应用中会产生大量不确定性数据,有效的Top-K查询处理是不确定性数据管理中一项重要技术。针对已有的Top-K查询没有很好地结合元组的分值和不确定性,在分析不确定性数据模型和可能世界模型的基础上,定义了不确定数据流元组的查询语义。设计并实现了一种有效的Top-K查询算法。该算法按照元组的得分值进行降序排列,概率值最高的前K个元组集合就是Top-K的查询结果,实验结果表明,与CSQ和SCSQ算法相比,更具高效性和实用性。 展开更多
关键词 不确定数据 元组 top-k查询 可能世界
下载PDF
Continuous ranking on uncertain streams 被引量:3
7
作者 Cheqing JIN Jingwei ZHANG Aoying ZHOU 《Frontiers of Computer Science》 SCIE EI CSCD 2012年第6期686-699,共14页
Data uncertainty widely exists in many web applications, financial applications and sensor networks. Ranking queries that return a number of tuples with maximal ranking scores are important in the field of database ma... Data uncertainty widely exists in many web applications, financial applications and sensor networks. Ranking queries that return a number of tuples with maximal ranking scores are important in the field of database management. Most existing work focuses on proposing static solutions for various ranking semantics over uncertain data. Our focus is to handle continuous ranking queries on uncertain data streams: testing each new tuple to output highly-ranked tuples. The main challenge comes from not only the fact that the possible world space will grow exponentially when new tuples arrive, but also the requirement for low space- and time- complexity to adapt to the streaming environments. This paper aims at handling continuous ranking queries on uncertain data streams. We first study how to handle this issue exactly, then we propose a novel method (exponential sampling) to estimate the expected rank of a tuple with high quality. Analysis in theory and detailed experimental reports evaluate the proposed methods. 展开更多
关键词 possible world semantics uncertain data stream continuous ranking query sampling
原文传递
不确定数据查询技术研究 被引量:17
8
作者 王意洁 李小勇 +1 位作者 祁亚斐 孙伟东 《计算机研究与发展》 EI CSCD 北大核心 2012年第7期1460-1466,共7页
当前不确定数据广泛存在于诸如传感器网络、RFID网络、基于位置服务以及移动对象管理等各种现实的不确定性应用中.不确定数据查询作为不确定数据管理的重要组成部分,在信息检索、数据挖掘、决策制定和环境监控等众多应用中发挥重要作用... 当前不确定数据广泛存在于诸如传感器网络、RFID网络、基于位置服务以及移动对象管理等各种现实的不确定性应用中.不确定数据查询作为不确定数据管理的重要组成部分,在信息检索、数据挖掘、决策制定和环境监控等众多应用中发挥重要作用,目前已成为数据库和网络计算等领域的一个研究热点.从目前不确定数据查询研究的各种查询类型介绍和查询特点分析出发,主要综述了4种典型的不确定数据查询类型,即不确定Skyline查询、不确定Top-k查询、不确定最近邻(NN)查询以及不确定聚集查询;重点论述了各种不确定数据查询的定义,各类查询的特点,并分类介绍了当前各类不确定数据查询研究的现状和各种查询方法的优缺点;最后,基于当前不确定数据查询技术的最新研究动态指出了未来研究工作的趋势. 展开更多
关键词 不确定数据 查询 SKYLINE top-k 最近邻 聚集 数据流 概率
下载PDF
不确定Skyline查询技术研究 被引量:5
9
作者 王意洁 李小勇 +2 位作者 杨永滔 祁亚斐 王广东 《计算机研究与发展》 EI CSCD 北大核心 2012年第10期2045-2053,共9页
当前不确定数据广泛存在于诸如传感器网络、RFID网络、基于位置服务、移动对象管理网上购物和市场监控等各种实际应用中.不确定Skyline查询作为不确定数据管理的一个重要方面,由于其在决策制定、市场分析、环境监控和数据挖掘等方面的... 当前不确定数据广泛存在于诸如传感器网络、RFID网络、基于位置服务、移动对象管理网上购物和市场监控等各种实际应用中.不确定Skyline查询作为不确定数据管理的一个重要方面,由于其在决策制定、市场分析、环境监控和数据挖掘等方面的重要作用,近年来在数据库和网络计算领域受到广泛关注.首先,概述了各种不确定数据类型上的Skyline查询定义,包括离散、连续概率分布模型以及不完全数据上的Skyline查询定义;其次,分析了不确定Skyline查询的特点,并在此基础上综述了现有的各种不确定数据集上的集中式和分布式Skyline查询方法,重点分析了各种算法的原理和优缺点;再次,介绍了不确定数据流上的Skyline查询定义并综述了各种不确定数据流上的Skyline查询方法;最后,基于最新研究动态指出了未来不确定Skyline查询研究的趋势. 展开更多
关键词 SKYLINE 概率 数据流 查询 不确定数据
下载PDF
不确定数据流多维建模方法 被引量:1
10
作者 李明 张维明 刘青宝 《国防科技大学学报》 EI CAS CSCD 北大核心 2014年第5期174-179,共6页
由于不确定数据流应用的出现,给传统的精确、静态数据环境下的多维建模带来了巨大挑战。针对不确定数据流动态、无限和不确定等特征,提出了一种不确定数据流多维模型。该模型中引入了不确定对象来描述不确定事实元组,并且通过定义时间... 由于不确定数据流应用的出现,给传统的精确、静态数据环境下的多维建模带来了巨大挑战。针对不确定数据流动态、无限和不确定等特征,提出了一种不确定数据流多维模型。该模型中引入了不确定对象来描述不确定事实元组,并且通过定义时间维度的层次时间窗口,很好地反映了数据流的动态性和无限性,最后还对此多维不确定数据流模型的基本代数操作和分析代数操作进行了形式化定义,为不确定数据流多维查询与分析提供了理论依据。 展开更多
关键词 多维模型 不确定数据流 时间维度 连续查询
下载PDF
不确定数据流上的并行Skyline查询算法 被引量:4
11
作者 王广东 王意洁 +1 位作者 李小勇 王媛 《计算机科学与探索》 CSCD 2012年第12期1116-1125,共10页
不确定数据流上的Skyline查询技术逐步引起研究者的关注,传统的集中式流处理算法难以满足海量数据的查询需求,并且云计算所提供的海量计算资源和有效的存储管理模式,为研究并行Skyline查询技术提供了充足的条件。基于上述事实,提出了一... 不确定数据流上的Skyline查询技术逐步引起研究者的关注,传统的集中式流处理算法难以满足海量数据的查询需求,并且云计算所提供的海量计算资源和有效的存储管理模式,为研究并行Skyline查询技术提供了充足的条件。基于上述事实,提出了一种不确定数据流上的并行Skyline查询算法(parallel Skyline over uncertain data streams,PSUDS)。该算法通过交叉划分滑动窗口的方式,将集中式流查询转化为并行处理,以并行执行的方式来解决集中式算法处理性能不足的问题。大量实验结果表明,该算法具有较好的并行可扩展性。 展开更多
关键词 不确定数据 数据流 SKYLINE 滑动窗口 并行查询 云计算
下载PDF
一种高效的不确定数据流并行Skyline查询处理方法 被引量:3
12
作者 赵越 王意洁 +1 位作者 王媛 李小勇 《计算机研究与发展》 EI CSCD 北大核心 2013年第S2期132-139,共8页
随着信息技术的不断发展,针对不确定数据流的应用和研究逐步引起学界的广泛关注.目前不确定数据流上Skyline查询的相关研究多关注于单机环境下的查询算法.当用户对查询响应速度要求较高或滑动的窗口规模较大时,基于单机环境进行集中处... 随着信息技术的不断发展,针对不确定数据流的应用和研究逐步引起学界的广泛关注.目前不确定数据流上Skyline查询的相关研究多关注于单机环境下的查询算法.当用户对查询响应速度要求较高或滑动的窗口规模较大时,基于单机环境进行集中处理的查询效率受到计算能力的限制,难以满足查询的实时性需求.当前诸如数据中心等分布式计算环境的兴起和广泛运用,为实现不确定数据流的分布并行Skyline查询处理提供了有利条件.对于高速到达的不确定数据流上的Skyline查询,当前研究的挑战在于如何充分利用分布式计算环境实现并行查询处理,以提高查询处理的效率.文中针对已有基于单机环境的集中式查询处理方法因计算能力不足而难以满足当前用户查询需求的问题,提出了一种针对不确定数据流的分布并行Skyline查询处理的两级并行查询模型TPM.实验表明基于TPM模型对不确定数据流进行分布并行Skyline查询处理的方式在不同滑动窗口规模、数据维度和并行节点数目的条件下,均具有良好的性能. 展开更多
关键词 不确定数据 数据流处理 SKYLINE查询 并行查询模型
下载PDF
基于网格索引的数据流子空间概率轮廓查询
13
作者 杨艳艳 赵雷 杨季文 《计算机工程》 CAS CSCD 2013年第2期50-54,共5页
在数据流子空间上的连续概率轮廓查询(CPSQS)基础上,提出一种基于网格索引结构的概率轮廓查询算法。采用适合于子空间轮廓计算的网格索引结构,将数据空间划分成若干个格,利用格间的支配关系,减少对象之间的比较次数。同时挖掘全空间与... 在数据流子空间上的连续概率轮廓查询(CPSQS)基础上,提出一种基于网格索引结构的概率轮廓查询算法。采用适合于子空间轮廓计算的网格索引结构,将数据空间划分成若干个格,利用格间的支配关系,减少对象之间的比较次数。同时挖掘全空间与子空间上格的概率上下界关系,设计有效的剪枝策略提高CPSQS算法的性能。理论分析和实验结果表明,该算法能满足实际应用中用户的个性化查询要求,降低查询响应时间。 展开更多
关键词 数据流 子空间 轮廓查询 概率查询 不确定数据
下载PDF
面向不确定数据流的近似ER-Topk查询处理
14
作者 刘骁 刘辉平 金澈清 《计算机工程与应用》 CSCD 北大核心 2017年第4期98-105,共8页
随着移动互联网的快速发展以及信息技术的普遍应用,在许多应用中都产生了海量、不确定性数据,包括金融、军事、位置服务、医疗以及气象等。然而,传统的确定性数据管理方法很难管理不确定数据,亟需开发新型数据管理方法。可能世界模型被... 随着移动互联网的快速发展以及信息技术的普遍应用,在许多应用中都产生了海量、不确定性数据,包括金融、军事、位置服务、医疗以及气象等。然而,传统的确定性数据管理方法很难管理不确定数据,亟需开发新型数据管理方法。可能世界模型被广泛用于为不确定数据建模,通过该模型可以衍生出诸多确定性的可能世界实例。不确定性数据流是指高速到达的海量不确定元组序列,因而不确定数据流管理比不确定性静态数据管理更具挑战性。面向于不确定数据流的ER-Topk查询是一个典型问题,但是处理复杂度高。提出一种近似算法来处理该查询,具有较小的空间复杂度;同时,还通过搜索策略优化来进一步提升查询处理效率。实验结果验证了所提方法的有效性和高效性。 展开更多
关键词 数据流 不确定数据 查询优化
下载PDF
改进的概率数据流上Skyline查询算法
15
作者 杨艳艳 赵雷 杨季文 《苏州大学学报(工科版)》 CAS 2012年第2期16-21,共6页
SOPDS是一种概率数据流上的skyline查询算法,它主要采用网格索引结构,使用概率定界、逐步求精、提前淘汰和选择补偿等启发式规则从时间和空间两个方面进行系统的优化。通过对对象间支配关系的进一步分析,在SOPDS算法的基础上,增加有效... SOPDS是一种概率数据流上的skyline查询算法,它主要采用网格索引结构,使用概率定界、逐步求精、提前淘汰和选择补偿等启发式规则从时间和空间两个方面进行系统的优化。通过对对象间支配关系的进一步分析,在SOPDS算法的基础上,增加有效的过滤策略和对象身份判定规则,实现了改进的算法(ISOPDS)。实验表明,ISOPDS算法能有效地减少查询响应时间。 展开更多
关键词 概率数据流 不确定数据 SKYLINE 连续查询
下载PDF
不确定数据流上的并行反Skyline查询
16
作者 张建荣 毛宇光 《计算机与现代化》 2015年第1期46-52,共7页
作为Skyline查询的一种重要变体,不确定数据流上的反Skyline查询已经成为研究的热点。已有的单机算法无法应对诸如高速数据流、高数据维度、大滑动窗口等情况,相应提出并行查询处理算法PRSUDS。算法采用基于角度划分的分发策略将处理任... 作为Skyline查询的一种重要变体,不确定数据流上的反Skyline查询已经成为研究的热点。已有的单机算法无法应对诸如高速数据流、高数据维度、大滑动窗口等情况,相应提出并行查询处理算法PRSUDS。算法采用基于角度划分的分发策略将处理任务分发至各并行节点,给出该分发策略的正确性证明,进而设计、实现算法的并行处理框架。实验结果表明PRSUDS算法较单机算法具有更好的综合性能,更能满足数据流查询的实时性要求。 展开更多
关键词 反Skyline查询 不确定数据流 并行处理 分发策略
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部