期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
XML数据中Twig查询处理与优化技术研究综述 被引量:8
1
作者 毕鑫 王国仁 +2 位作者 赵相国 袁野 张盼 《计算机科学与探索》 CSCD 2013年第9期769-782,共14页
可扩展标记语言(extensible markup language,XML)数据已被广泛应用于网络数据交换和存储领域。作为XML数据查询的核心操作,Twig查询处理与优化技术具有十分重要的研究意义。为此,全面总结了Twig查询处理与优化技术在传统XML数据、分布... 可扩展标记语言(extensible markup language,XML)数据已被广泛应用于网络数据交换和存储领域。作为XML数据查询的核心操作,Twig查询处理与优化技术具有十分重要的研究意义。为此,全面总结了Twig查询处理与优化技术在传统XML数据、分布式XML数据、不确定XML数据、图模型XML数据中的发展现状,并分析了存在的问题和挑战,最后探讨了Twig查询处理与优化技术今后的发展趋势和研究方向。 展开更多
关键词 TWIG查询 可扩展标记语言(xml) 分布式xml数据 不确定xml数据 图模型xml数据
下载PDF
一种高效的连续不确定XML小枝模式匹配算法 被引量:4
2
作者 张晓琳 吕庆 +1 位作者 刘立新 郑春红 《计算机应用研究》 CSCD 北大核心 2013年第2期364-366,370,共4页
针对目前不确定XML小枝模式匹配算法均基于归并,易造成很大的空间和时间浪费问题,提出基于P-文档模型的连续不确定XML的非归并的小枝模式匹配算法。算法在节点入队列和出队列时分别进行过滤剪枝操作,减少待处理节点的个数,匹配过程使用... 针对目前不确定XML小枝模式匹配算法均基于归并,易造成很大的空间和时间浪费问题,提出基于P-文档模型的连续不确定XML的非归并的小枝模式匹配算法。算法在节点入队列和出队列时分别进行过滤剪枝操作,减少待处理节点的个数,匹配过程使用相互关联的链表存储中间结果,不需要归并。理论分析与实验结果表明,该算法是一种高效的连续不确定XML查询算法。 展开更多
关键词 连续不确定xml 小枝模式匹配 过滤剪枝 非归并
下载PDF
一种非归并不确定XML小枝模式查询算法 被引量:2
3
作者 刘立新 张晓琳 +2 位作者 吕庆 张换香 褚艳华 《计算机科学》 CSCD 北大核心 2013年第5期198-200,228,共4页
针对目前不确定XML小枝模式查询需要存储大量中间结果和归并中间结果的情况,提出一种非归并不确定XML小枝模式查询算法ProTwigList。该算法查询之前通过Tag+Level流进行剪枝,以减少待处理节点的数目;并扩展了区间编码来对剪枝后剩余的... 针对目前不确定XML小枝模式查询需要存储大量中间结果和归并中间结果的情况,提出一种非归并不确定XML小枝模式查询算法ProTwigList。该算法查询之前通过Tag+Level流进行剪枝,以减少待处理节点的数目;并扩展了区间编码来对剪枝后剩余的普通节点进行编码,用一定规则对分布节点进行标识;查询时采用公共分布节点路径的方法处理分布结点,最后结合最低公共祖先节点的概率计算查询结果的概率值。理论分析和实验结果证明了ProTwigList算法的查询效率。 展开更多
关键词 不确定xml P-文档 分布节点 区间编码 小枝模式
下载PDF
连续不确定XML数据索引技术研究 被引量:3
4
作者 张换香 张晓琳 刘立新 《计算机应用与软件》 CSCD 北大核心 2013年第8期51-53,共3页
针对连续不确定XML数据的概率阈值查询,提出CPTI(Continuous Probabilistic Threshold Index)索引技术,包括CPTI结构索引和CPTI值索引。CPTI结构索引扩展了结构索引F-index支持连续不确定XML数据,通过CPTI结构索引查询twig小枝,并确定... 针对连续不确定XML数据的概率阈值查询,提出CPTI(Continuous Probabilistic Threshold Index)索引技术,包括CPTI结构索引和CPTI值索引。CPTI结构索引扩展了结构索引F-index支持连续不确定XML数据,通过CPTI结构索引查询twig小枝,并确定小枝的路径概率;CPTI值索引是一个二维表,记录cont类节点的概率信息,通过CPTI值索引过滤与查询无关的元素以减少查询中需要处理的元素数目。实验表明,此索引技术可极大地提高查询处理的性能。 展开更多
关键词 连续不确定 xml 索引 概率阈值查询
下载PDF
不确定XML的Top-k关键字查询算法研究 被引量:3
5
作者 张晓琳 苏龙超 +1 位作者 韩雨童 王静宇 《小型微型计算机系统》 CSCD 北大核心 2014年第12期2691-2696,共6页
目前不确定XML的Top-k关键字查询仅返回概率值排在前k的根节点,需要进一步的处理才能构建满足特定条件下的子树,效率低下.针对这一问题,定义了一种新的基于最小相关联通子树的Top-k查询语义SRCT-Top-k(smallest related connected subtr... 目前不确定XML的Top-k关键字查询仅返回概率值排在前k的根节点,需要进一步的处理才能构建满足特定条件下的子树,效率低下.针对这一问题,定义了一种新的基于最小相关联通子树的Top-k查询语义SRCT-Top-k(smallest related connected subtree Top-k),SRCT-Top-k查询返回概率值排在前k的最小相关联通子树,并提出基于动态Keyw ord数据仓的Pr ListTop-k算法来处理SRCT-Top-k查询.Pr List Top-k算法仅扫描一次动态Keyw ord数据仓就能构建满足特定条件下的子树,并制定了过滤策略减少了中间结果.理论分析和实验结果表明,Pr List Top-k是一种高效的不确定XML的Top-k查询算法. 展开更多
关键词 不确定xml 最小相关联通子树 TOP-K 关键字查询
下载PDF
基于扩展倒排索引的不确定XML关键字查询算法 被引量:4
6
作者 牛大伟 苏龙超 +1 位作者 韩雨童 张晓琳 《计算机应用与软件》 CSCD 2015年第4期247-251,共5页
现有的不确定XML关键字查询算法均需遍历不确定XML文档,并且算法在执行过程中需要频繁的字符串比较,造成时间浪费。针对上述问题,提出基于扩展倒排索引的不确定XML关键字查询算法Pr E。扩展倒排索引有效地存储了不确定XML文档中节点的... 现有的不确定XML关键字查询算法均需遍历不确定XML文档,并且算法在执行过程中需要频繁的字符串比较,造成时间浪费。针对上述问题,提出基于扩展倒排索引的不确定XML关键字查询算法Pr E。扩展倒排索引有效地存储了不确定XML文档中节点的相关信息,根据扩展倒排索引即可初始化动态哈希表和序号编码链表,并且Pr E算法在执行过程中利用整数的比较代替了字符串的比较。理论分析与实验结果表明,Pr E算法是一种高效的不确定XML关键字查询算法。 展开更多
关键词 不确定xml 关键字查询 扩展倒排索引 PRE
下载PDF
连续不确定XML数据查询处理算法 被引量:1
7
作者 张晓琳 霍伟 +1 位作者 刘立新 崔光月 《计算机工程与设计》 CSCD 北大核心 2013年第7期2426-2430,共5页
针对目前连续不确定XML数据同步多区间的查询处理算法易造成较大时间开销的问题,提出一种基于蒙特卡洛最小二乘思想的小枝模式查询处理算法QueryLSMC。算法根据查询请求依节点遍历序列顺序处理路径栈中节点,利用链表匹配并存储中间结果... 针对目前连续不确定XML数据同步多区间的查询处理算法易造成较大时间开销的问题,提出一种基于蒙特卡洛最小二乘思想的小枝模式查询处理算法QueryLSMC。算法根据查询请求依节点遍历序列顺序处理路径栈中节点,利用链表匹配并存储中间结果,通过构造随机样本集线性拟合目标节点中的连续分布函数,避免了对大量矩形分段的处理,有效地减少了计算量。实验结果表明,在取得理想精度的同时,该算法具有高效性。 展开更多
关键词 连续不确定xml 蒙特卡洛最小二乘 小枝模式查询 随机样本集 线性拟合
下载PDF
多维连续不确定XML数据查询处理算法 被引量:1
8
作者 张晓琳 霍伟 +1 位作者 刘立新 崔光月 《微电子学与计算机》 CSCD 北大核心 2013年第6期30-33,共4页
提出一种基于蒙特卡洛思想的数据查询处理算法QueryMC.在查询计算过程中,根据小枝查询模式确定待处理多维随机变量联合概率密度函数及查询区域,通过构造相同区域上的均匀分布随机变量将查询问题建模成相应复合函数的期望,利用算法同时... 提出一种基于蒙特卡洛思想的数据查询处理算法QueryMC.在查询计算过程中,根据小枝查询模式确定待处理多维随机变量联合概率密度函数及查询区域,通过构造相同区域上的均匀分布随机变量将查询问题建模成相应复合函数的期望,利用算法同时产生的随机样本集估计该期望的取值作为问题的解,避免了传统的降维操作,有效地减少了处理时间.实验结果表明,在取得理想精度的同时,算法具有高效性. 展开更多
关键词 连续不确定xml 多维随机变量 小枝查询模式 联合概率密度 蒙特卡洛
下载PDF
基于LSPI索引的不确定XML查询处理算法 被引量:1
9
作者 张晓琳 韩雨童 +1 位作者 苏龙超 谭跃生 《计算机应用研究》 CSCD 北大核心 2014年第7期2078-2081,2100,共5页
针对目前已有XML通配符查询处理需将文档中所有元素标签读入内存中,匹配效率低的问题,提出一种新的基于LSPI(leaf sibling of path information)索引的不确定XML包含通配符和复杂谓词的查询处理算法Prob-BooleanStarTwig。算法基于有效... 针对目前已有XML通配符查询处理需将文档中所有元素标签读入内存中,匹配效率低的问题,提出一种新的基于LSPI(leaf sibling of path information)索引的不确定XML包含通配符和复杂谓词的查询处理算法Prob-BooleanStarTwig。算法基于有效过滤策略自底向上进行模式匹配,将通配符转换成A-D关系和层次信息约束,解决传统通配符匹配问题,避免多次扫描查询模式,提高查询速度。理论分析和实验结果表明,算法的查询效率明显优于已有的算法。 展开更多
关键词 不确定xml 通配符查询 LSPI索引 小枝模式匹配
下载PDF
不确定XML序列匹配等价性研究 被引量:1
10
作者 张晓琳 王鹏 《计算机工程与设计》 CSCD 北大核心 2014年第5期1674-1677,1704,共5页
为了保持等价性,将序列匹配应用到不确定XML小枝模式匹配,需要重新考虑假警报和假不予考虑问题。针对这一问题,对不确定XML序列匹配中模式树序列化、子序列匹配和结构过滤的等价性进行分析,使得序列匹配应用到不确定XML小枝模式匹配的... 为了保持等价性,将序列匹配应用到不确定XML小枝模式匹配,需要重新考虑假警报和假不予考虑问题。针对这一问题,对不确定XML序列匹配中模式树序列化、子序列匹配和结构过滤的等价性进行分析,使得序列匹配应用到不确定XML小枝模式匹配的理论依据更为完备;通过实验对不确定XML序列匹配的等价性和效率进行验证。理论分析和实验结果表明,序列匹配应用到不确定XML与普通XML是等价的,具有较高的效率。 展开更多
关键词 序列匹配 小枝模式匹配 不确定xml 等价性 假警报 假不予考虑
下载PDF
一种基于序列的不确定XML小枝匹配方法 被引量:1
11
作者 张晓琳 王鹏 《计算机应用与软件》 CSCD 北大核心 2014年第12期48-51,共4页
针对目前不确定XML小枝模式查询处理方法中繁复的结构连接操作和不便于概率阈值过滤的缺点,提出一种新颖的基于序列的不确定XML小枝模式查询处理方法。该方法包括不确定XML序列索引的建立以及基于序列匹配的查询算法,与现有的不确定XML... 针对目前不确定XML小枝模式查询处理方法中繁复的结构连接操作和不便于概率阈值过滤的缺点,提出一种新颖的基于序列的不确定XML小枝模式查询处理方法。该方法包括不确定XML序列索引的建立以及基于序列匹配的查询算法,与现有的不确定XML查询处理方法相比不需要繁复的结构连接操作,而且可以灵活地进行三次概率阈值过滤。理论分析和实验表明,该方法便于概率阈值过滤,同时具有较高的查询效率。 展开更多
关键词 不确定xml 序列 小枝模式 概率阈值
下载PDF
基于概率SLCA的XML过滤 被引量:2
12
作者 张晨静 王晓玲 周傲英 《计算机学报》 EI CSCD 北大核心 2014年第9期1959-1971,共13页
不确定数据管理逐渐成为一个重要的研究方向.作为网络交换重要标准的XML数据的不确定管理也成为一个研究热点.基于关键字的概率XML检索是其中一个重要的分支.目前对于概率XML关键字检索的研究,都只考察了结点之间的独立(IND)关系和互斥(... 不确定数据管理逐渐成为一个重要的研究方向.作为网络交换重要标准的XML数据的不确定管理也成为一个研究热点.基于关键字的概率XML检索是其中一个重要的分支.目前对于概率XML关键字检索的研究,都只考察了结点之间的独立(IND)关系和互斥(MUX)关系.由于更普遍的结点依赖关系在表述和计算上的复杂性,较少有工作讨论.文中讨论概率XML模型PrXML^({exp,ind,mux})中基于SLCA语义的关键字过滤.这种模型中通过EXP结点描述更普遍的结点依赖关系.文中在定义了子树中关键字概率分布表tab及其相关的运算后,分别给出了模型中不同类型结点关键字概率分布表的计算方法,并给出了不需要构造可能世界直接求解SLCA结点概率的算法.文章通过实验评估了算法的特性和性能. 展开更多
关键词 不确定数据 概率xml 关键字过滤 SLCA 关键字概率分布表
下载PDF
高效的连续不确定XML数据Top-k查询算法
13
作者 张晓琳 郑春红 +1 位作者 刘立新 吕庆 《计算机工程与科学》 CSCD 北大核心 2014年第6期1101-1107,共7页
目前,不确定XML数据的top-k查询算法中都没有处理连续不确定数据,本文提出SPCProTJFast算法,该算法改进了传统的归并算法,并结合连续不确定数据的过滤方法,实现了连续不确定XML的Top-k查询。为了避免概率下限值过小对过滤效果的影响,又... 目前,不确定XML数据的top-k查询算法中都没有处理连续不确定数据,本文提出SPCProTJFast算法,该算法改进了传统的归并算法,并结合连续不确定数据的过滤方法,实现了连续不确定XML的Top-k查询。为了避免概率下限值过小对过滤效果的影响,又提出HPCProTJFast算法,该算法推迟了对连续节点的处理,只有在获得满足概率条件的整枝路径时才对连续节点进行访问。实验表明,在执行时间以及过滤效率上,同直接处理连续不确定数据的ProTJFast算法相比,这两种算法都要更高效,并且HPCProTJFast算法的效率更高。 展开更多
关键词 连续不确定 xml 归并 TOP-K
下载PDF
多维连续不确定XML数据模型及聚集查询算法
14
作者 张晓琳 崔光月 +1 位作者 刘立新 霍伟 《计算机应用与软件》 CSCD 北大核心 2014年第1期14-17,共4页
提出一种基于p-文档的连续不确定XML数据模型,支持多维连续随机变量的不确定XML数据表示。提出高效的XML聚集算法,既支持XPath表达式,又能够根据不同类型的连续函数选择合适的聚集方法。实验结果表明,该算法能够有效地处理支持多维连续... 提出一种基于p-文档的连续不确定XML数据模型,支持多维连续随机变量的不确定XML数据表示。提出高效的XML聚集算法,既支持XPath表达式,又能够根据不同类型的连续函数选择合适的聚集方法。实验结果表明,该算法能够有效地处理支持多维连续不确定XML数据的聚集查询,并且具有很好的可扩展性。 展开更多
关键词 数据模型 多维连续不确定xml聚集
下载PDF
RLPI索引:一种处理连续不确定XML索引
15
作者 张晓琳 郭丹丹 +2 位作者 韩雨童 郝琨 谭跃生 《计算机应用与软件》 CSCD 2016年第4期25-29,共5页
针对目前连续不确定XML数据的概率阈值范围查询,提出一种新的包含路径索引和值索引的RLPI(Reverse Label Probabilistic Index)索引。RLPI路径索引以逆序标签路径作为索引项,通过逆序标签路径可区分不同路径上的同名节点,更具针对性地... 针对目前连续不确定XML数据的概率阈值范围查询,提出一种新的包含路径索引和值索引的RLPI(Reverse Label Probabilistic Index)索引。RLPI路径索引以逆序标签路径作为索引项,通过逆序标签路径可区分不同路径上的同名节点,更具针对性地定位所需节点。RLPI值索引借鉴U树的思想,通过提前计算并存储叶子节点的相关信息,以减少查询中需处理的元素数目,并且其对满足任意连续pdf(probability density function)的不确定数据均适用。理论分析和实验结果表明,RLPI索引技术有效地提高了查询处理的性能。 展开更多
关键词 连续不确定数据 xml 索引 概率阈值范围查询
下载PDF
一种适用连续不确定XML数据的索引
16
作者 张晓琳 郭丹丹 郝琨 《计算机工程与科学》 CSCD 北大核心 2016年第2期305-311,共7页
针对连续不确定XML数据概率阈值范围查询,提出一种新的CUXI索引树。该索引树的构建方法是借鉴U树对空间数据自顶向下递归构建索引树的思想,将连续不确定XML文档中具有相同父亲的叶子节点构建二维数据矩形,在聚类的基础上来构建相应的CUX... 针对连续不确定XML数据概率阈值范围查询,提出一种新的CUXI索引树。该索引树的构建方法是借鉴U树对空间数据自顶向下递归构建索引树的思想,将连续不确定XML文档中具有相同父亲的叶子节点构建二维数据矩形,在聚类的基础上来构建相应的CUXI索引树,其中叶子节点存储连续不确定数据辅助信息。为了提高查询效率,对连续不确定数据制定了过滤策略,通过遍历索引树过滤掉不满足查询范围的子树。理论和实验结果表明,此索引技术可提高查询处理的性能。 展开更多
关键词 连续不确定xml 概率阈值范围查询 CUXI索引树 二维数据矩形 过滤
下载PDF
高效不确定XML复杂Twig查询处理算法
17
作者 张晓琳 韩雨童 +1 位作者 苏龙超 刘立新 《计算机工程与设计》 CSCD 北大核心 2014年第4期1258-1263,共6页
针对目前普通XML复杂Twig查询处理算法易造成大量空间和时间浪费,且不能完全适用于不确定XML的问题,提出一种基于P-文档模型的不确定XML复杂Twig查询处理算法Prob-BooleanTwig,处理包含AND,NOT和OR复杂谓词的查询模式。算法在扩展了EDe... 针对目前普通XML复杂Twig查询处理算法易造成大量空间和时间浪费,且不能完全适用于不确定XML的问题,提出一种基于P-文档模型的不确定XML复杂Twig查询处理算法Prob-BooleanTwig,处理包含AND,NOT和OR复杂谓词的查询模式。算法在扩展了EDewey编码的基础上,构建路径叶子节点索引,进行自底向上的查询模式匹配,避免了对查询模式的多次扫描。理论分析和实验结果表明,Prob-BooleanTwig算法具有高效性。 展开更多
关键词 不确定xml 复杂Twig查询 编码 路径索引 查询处理
下载PDF
不确定XML序列匹配关键技术研究
18
作者 张晓琳 王鹏 《微电子学与计算机》 CSCD 北大核心 2014年第4期123-127,共5页
不确定XML小枝模式匹配的关键技术包括不确定XML文档格式,互斥节点识别,实例树概率计算和概率阈值过滤.目前,不确定XML二元结构连接和整体匹配方法无法充分利用算法的特点解决关键技术问题,针对这一不足,将序列匹配应用到不确定XML小枝... 不确定XML小枝模式匹配的关键技术包括不确定XML文档格式,互斥节点识别,实例树概率计算和概率阈值过滤.目前,不确定XML二元结构连接和整体匹配方法无法充分利用算法的特点解决关键技术问题,针对这一不足,将序列匹配应用到不确定XML小枝模式匹配,并对不确定XML序列匹配关键技术问题进行分析和证明,理论分析和实验结果表明序列匹配方法应用到不确定XML小枝模式匹配是有效的. 展开更多
关键词 不确定xml 小枝模式匹配 序列匹配 概率阈值过滤
下载PDF
基于序列的不确定XML整体小枝查询技术
19
作者 王鹏 张晓琳 《电子科技》 2013年第11期146-150,共5页
针对基于序列的不确定XML小枝模式匹配算法需要子序列匹配和结构过滤两个阶段,而导致查询效率低的问题,提出一种以PrTRIM算法为基础的整体小枝模式匹配算法。H-PrTRIM算法将PrTRIM算法中子序列匹配和结构过滤两个阶段合并,在子序列匹配... 针对基于序列的不确定XML小枝模式匹配算法需要子序列匹配和结构过滤两个阶段,而导致查询效率低的问题,提出一种以PrTRIM算法为基础的整体小枝模式匹配算法。H-PrTRIM算法将PrTRIM算法中子序列匹配和结构过滤两个阶段合并,在子序列匹配的同时进行结构过滤,使子序列匹配得到的结果就是查询的最终结果,解决了由于子序列匹配产生过多的中间结果而降低查询效率的问题。实验结果表明,H-PrTRIM算法的效率高于PrTRIM算法,应用于查询大文档和结构复杂的查询语句时更能体现出优势。 展开更多
关键词 不确定xml 序列 整体小枝模式
下载PDF
PrList:一种高效的不确定XML关键字查询算法
20
作者 张晓琳 苏龙超 +1 位作者 韩雨童 刘立新 《微电子学与计算机》 CSCD 北大核心 2014年第3期36-39,43,共5页
提出基于动态Keyword数据仓的不确定XML关键字查询算法PrList.算法首先初始化动态Keyword数据仓,然后自底向上、自左向右遍历Keyword数据仓中的结点求解SLCA节点,不需要进出栈和字符串的比较.实验结果表明,PrList算法是一种高效的不确定... 提出基于动态Keyword数据仓的不确定XML关键字查询算法PrList.算法首先初始化动态Keyword数据仓,然后自底向上、自左向右遍历Keyword数据仓中的结点求解SLCA节点,不需要进出栈和字符串的比较.实验结果表明,PrList算法是一种高效的不确定XML关键字查询算法. 展开更多
关键词 不确定xml 关键字查询 动态Keyword数据仓 PrList
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部