-
题名基于x-tuple的概率阈值top-k查询算法
- 1
-
-
作者
黄冬梅
舒博
王建
熊中敏
-
机构
上海海洋大学信息学院
-
出处
《计算机工程》
CAS
CSCD
2013年第4期44-47,共4页
-
基金
国家"973"计划基金资助项目"海量信息可用性基础理论与关键技术研究"(2012CB316200)
南北极环境综合考察与评估专项基金资助项目(CHINARE2012-04-07)
-
文摘
不确定数据库中的概率阈值top-k查询是计算元组排在前k位的概率和,返回概率和不小于p的元组,但现有的查询语义没有将x-tuple内的元组进行整体处理。针对该情况,定义一种新的查询语义——概率阈值x-top-k查询,并给出查询处理算法。在该查询语义下采用动态规划方法求取x-tuple内每个元组排在前k位的概率和,对其进行聚集后做概率阈值top-k查询,并利用观察法、最大上限值等剪枝方法进行优化。实验结果表明,该算法平均扫描全体数据集中60%的数据即可返回正确结果集,证明其查询处理效率较高。
-
关键词
不确定数据库
概率阈值top-k查询
x-元组
动态规划算法
聚集
-
Keywords
uncertain database
probabilistic threshold top-k query
x-tuple
dynamic programming algorithm
aggregation
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名连续不确定XML数据索引技术研究
被引量:3
- 2
-
-
作者
张换香
张晓琳
刘立新
-
机构
内蒙古科技大学工程训练中心
内蒙古科技大学信息工程学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2013年第8期51-53,共3页
-
基金
国家自然科学基金项目(61163015)
内蒙古自然科学基金重点项目(20080404Zd21)
-
文摘
针对连续不确定XML数据的概率阈值查询,提出CPTI(Continuous Probabilistic Threshold Index)索引技术,包括CPTI结构索引和CPTI值索引。CPTI结构索引扩展了结构索引F-index支持连续不确定XML数据,通过CPTI结构索引查询twig小枝,并确定小枝的路径概率;CPTI值索引是一个二维表,记录cont类节点的概率信息,通过CPTI值索引过滤与查询无关的元素以减少查询中需要处理的元素数目。实验表明,此索引技术可极大地提高查询处理的性能。
-
关键词
连续不确定
XML
索引
概率阈值查询
-
Keywords
Continuous uncertain XML Indexing Probabilistic threshold query
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-
-
题名RLPI索引:一种处理连续不确定XML索引
- 3
-
-
作者
张晓琳
郭丹丹
韩雨童
郝琨
谭跃生
-
机构
内蒙古科技大学信息工程学院
-
出处
《计算机应用与软件》
CSCD
2016年第4期25-29,共5页
-
基金
国家自然科学基金项目(61163015)
内蒙古自然科学基金项目(2013MS0909)
-
文摘
针对目前连续不确定XML数据的概率阈值范围查询,提出一种新的包含路径索引和值索引的RLPI(Reverse Label Probabilistic Index)索引。RLPI路径索引以逆序标签路径作为索引项,通过逆序标签路径可区分不同路径上的同名节点,更具针对性地定位所需节点。RLPI值索引借鉴U树的思想,通过提前计算并存储叶子节点的相关信息,以减少查询中需处理的元素数目,并且其对满足任意连续pdf(probability density function)的不确定数据均适用。理论分析和实验结果表明,RLPI索引技术有效地提高了查询处理的性能。
-
关键词
连续不确定数据
XML
索引
概率阈值范围查询
-
Keywords
Continuous uncertain data
XML
Index
Probability threshold range query
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-
-
题名一种适用连续不确定XML数据的索引
- 4
-
-
作者
张晓琳
郭丹丹
郝琨
-
机构
内蒙古科技大学信息工程学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2016年第2期305-311,共7页
-
基金
国家自然科学基金(61163015)
内蒙古自然科学基金(2013MS0909)
-
文摘
针对连续不确定XML数据概率阈值范围查询,提出一种新的CUXI索引树。该索引树的构建方法是借鉴U树对空间数据自顶向下递归构建索引树的思想,将连续不确定XML文档中具有相同父亲的叶子节点构建二维数据矩形,在聚类的基础上来构建相应的CUXI索引树,其中叶子节点存储连续不确定数据辅助信息。为了提高查询效率,对连续不确定数据制定了过滤策略,通过遍历索引树过滤掉不满足查询范围的子树。理论和实验结果表明,此索引技术可提高查询处理的性能。
-
关键词
连续不确定XML
概率阈值范围查询
CUXI索引树
二维数据矩形
过滤
-
Keywords
continuous uncertain XML
probability threshold range query
CUXI index tree
two-di- mensional data rectangle
filter
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-