-
题名不确定关系数据属性级溯源表示与概率计算
被引量:7
- 1
-
-
作者
王梁
周光焱
王黎维
彭智勇
-
机构
武汉大学计算机学院
武汉大学国际软件学院
-
出处
《软件学报》
EI
CSCD
北大核心
2014年第4期863-879,共17页
-
基金
国家自然科学基金(61232002
61202033)
+3 种基金
国家高技术研究发展计划(863)(2012AA011004)
教育部博士点新教师基金(200804861067)
湖北省自然科学基金(2011CDB448)
武汉大学博士研究生自主科研基金(2012211020207)
-
文摘
传统的数据库应用中,数据往往被假定是精确可用的,而实际中数据普遍存在不确定性.以往许多利用溯源信息追踪数据不确定性的方法往往关注元组或单一属性存在不确定性的情况,通过对元组添加唯一变量标识,用变量标识所表示的溯源信息构造布尔表达式计算结果元组概率.当元组中多个属性存在不确定性时,对元组进行标识不能帮助用户快速而准确地找到造成不确定性的源属性值.定义属性表达式,并通过属性表达式构造溯源表达式.利用该溯源表达式不仅可以准确地追溯不确定性产生的具体位置,同时还可以实现结果元组的概率计算.为保证概率计算结果的正确性,提出溯源表达式的转换算法.通过分析影响结果元组概率计算效率的因素,还提出构建共享路径表的方法,在构建过程中对原子析取式进行预计算,以提高概率计算的效率.实验部分将该方法与现有的元组级溯源信息表示方法在时间代价和空间代价方面进行比较,验证其可行性和有效性.此外,实验部分还对利用共享路径加快结果元组概率计算的有效性进行了评估.
-
关键词
不确定性
属性表达式
溯源表达式
概率计算
共享路径
-
Keywords
uncertainty
attribute expression
lineage expression
probabilistic computation
share path
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名数据库中不等式查询语句的resilience计算
- 2
-
-
作者
林杰
覃飙
覃雄派
-
机构
中国人民大学信息学院
-
出处
《计算机应用》
CSCD
北大核心
2018年第7期1893-1897,1915,共6页
-
基金
国家自然科学基金资助项目(61472425)~~
-
文摘
针对数据库中不等式连接查询的因果关系问题,引入并实现了resilience计算,并且为了降低其在路径类型不等式连接查询中计算的时间复杂度,提出了求解resilience的动态规划(DPResi)算法。首先,根据路径类型不等式连接查询的特点及最大流最小割原理,实现了多项式时间复杂度的Min-Cut算法;然后通过将带有不等式布尔连接查询语句的溯源表达式编辑为溯源图,进而将resilience求解问题转换为溯源图中最短距离的计算问题,并结合溯源图的包含关系与最优子结构性质,运用动态规划的思想实现了线性时间复杂度的DPResi算法。在TPC-H数据集上进行了大量实验,实验结果表明,与Min-Cut算法相比,DPResi算法极大地提高了resilience计算的效率,并具有较好的扩展性。
-
关键词
因果关系
RESILIENCE
不等式查询语句
溯源表达式
溯源图
-
Keywords
causality resilience conjunctive
query with inequality
lineage expression lineage graph
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-