-
题名连续不确定XML的Top-k查询算法研究
- 1
-
-
作者
张晓琳
郑春红
刘立新
吕庆
-
机构
内蒙古科技大学信息工程学院
-
出处
《计算机工程与设计》
CSCD
北大核心
2013年第3期1116-1120,共5页
-
基金
国家自然科学基金项目(61163015)
内蒙古自然科学基金重点项目(20080404Zd21)
-
文摘
为了解决连续不确定XML高效的top-k查询,提出CProTJFast算法。该算法基于P-文档模型,扩展PEDewey(probabilistic extended Dewey)编码支持连续分布类型节点的编码,采用路径概率下限值进行节点过滤,并针对连续概率密度函数制定过滤策略,从而在计算连续节点概率之前过滤掉不参与结果的节点。实验结果表明,采用连续节点过滤策略的CProTJFast算法有效地提高了连续不确定XML的top-k查询效率。
-
关键词
p-文档模型
扩展Dewey编码
连续不确定XML
TOp-K查询
过滤策略
-
Keywords
p-document model
extended Dewey coding
continuous probabilistic XML
top-k query
filtering strategy
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种非归并不确定XML小枝模式查询算法
被引量:2
- 2
-
-
作者
刘立新
张晓琳
吕庆
张换香
褚艳华
-
机构
内蒙古科技大学信息工程学院
-
出处
《计算机科学》
CSCD
北大核心
2013年第5期198-200,228,共4页
-
基金
国家自然科学基金(61163015)
内蒙古科技大学创新基金(2011NCL024
2010NC041)资助
-
文摘
针对目前不确定XML小枝模式查询需要存储大量中间结果和归并中间结果的情况,提出一种非归并不确定XML小枝模式查询算法ProTwigList。该算法查询之前通过Tag+Level流进行剪枝,以减少待处理节点的数目;并扩展了区间编码来对剪枝后剩余的普通节点进行编码,用一定规则对分布节点进行标识;查询时采用公共分布节点路径的方法处理分布结点,最后结合最低公共祖先节点的概率计算查询结果的概率值。理论分析和实验结果证明了ProTwigList算法的查询效率。
-
关键词
不确定XML
p-文档
分布节点
区间编码
小枝模式
-
Keywords
Uncertain XML
p-document
Distributed node
Rang encoding
Twig pattern
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名连续概率XML数据查询处理技术
被引量:1
- 3
-
-
作者
张晓琳
郑珍珍
刘立新
李玉峰
-
机构
内蒙古科技大学信息工程学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2012年第12期134-139,共6页
-
基金
国家自然科学基金资助项目(61163015)
内蒙古自然科学基金重点项目(20080404Zd21)
-
文摘
目前查询连续概率XML数据多采用离散化方法,需要处理大量直方图分段,查询效率较低。本文提出了一种基于p-文档模型的连续概率XML数据查询处理技术,首先利用cont节点扩展p-文档模型支持任意的连续分布,在cont节点中编码概率密度函数以及他们的参数;其次采用twig模式匹配找到符合用户要求的路径;然后根据要查询的连续分布类型确定概率查询应该使用符号表示法、积分法或直方图近似法:标准连续分布通过符号表示法中的参数或复杂的累积分布函数计算查询结果,满足积分条件的非标准连续分布采用积分法,其它情况采用直方图近似法。实验结果表明,该方法在概率查询的精确度以及响应时间上比现有方法更高效。
-
关键词
p-文档模型
概率XML
连续分布
查询处理
-
Keywords
p-document model
probabilistic XML
continuous distribution
query process
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-
-
题名支持多维连续随机变量的不确定XML数据模型研究
- 4
-
-
作者
张晓琳
崔光月
刘立新
郑珍珍
-
机构
内蒙古科技大学信息工程学院
-
出处
《内蒙古科技大学学报》
CAS
2012年第1期76-80,共5页
-
基金
国家自然科学基金资助项目(61163015)
内蒙古自然科学基金重点资助项目(20080404Zd21)
-
文摘
不确定数据模型研究已受到广泛关注,但对于支持多维连续随机变量的不确定数据管理却缺乏研究,在已有模型的基础上,提出了一种扩展的基于p-文档的连续不确定数据模型,用于支持多维连续随机变量,并对相关的联合概率及条件概率查询进行了定义;具有相关关系的多维连续随机变量,存储相应的联合概率密度函数,根据不同的分布类型选择相应的查询处理方法;相互独立的多个随机变量,则分别存储每个变量的概率密度函数,并在查询时根据查询条件进行相应的处理.
-
关键词
不确定XML
p-文档模型
多维连续随机变量
-
Keywords
uncertain XML
p-document model
multidimensional continuous random variables
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-
-
题名基于有序对的不确定XML小枝模式查询算法
- 5
-
-
作者
刘立新
王永平
-
机构
内蒙古科技大学信息工程学院
-
出处
《计算机与数字工程》
2017年第3期492-497,共6页
-
基金
国家自然科学基金:连续不确定XML数据管理关键技术研究(编号:61163015)
内蒙古高等学校科学研究项目:云计算环境下海量XML数据关键字查询处理技术研究(编号:NJZY143)
内蒙古科技大学创新基金(编号:2014QDL046)资助
-
文摘
随着不确定数据的广泛应用,不确定数据管理成为一个重要的研究方向。针对目前不确定XML小枝模式查询技术并没有很好解决含父子关系的查询,论文提出基于有序对的ProOPCTwig算法。该算法以有序对的形式存储查询树和P-文档,通过查询树标签流的流指针所指节点的有序对和P-文档中该结点标签流中的节点有序对来进行匹配进行查询。有效处理了不确定XML中的分布节点、查询结果概率的计算。且在有序对匹配时不需要逐条扫描删除,提高匹配速度。理论分析和实验结果证明了ProOPCTwig算法的查询效率。
-
关键词
不确定XML数据
p-文档
小枝模式
父子关系
有序对
-
Keywords
uncertain XML data
p-document
twig pattern
patent-child relationship
ordered pair
-
分类号
TP311.1
[自动化与计算机技术—计算机软件与理论]
-