期刊文献+
共找到135篇文章
< 1 2 7 >
每页显示 20 50 100
基于FP-tree和MapReduce的集合相似度自连接算法 被引量:1
1
作者 冯禹洪 吴坤汉 +4 位作者 黄志鸿 冯洋洲 陈欢欢 白鉴聪 明仲 《计算机研究与发展》 EI CSCD 北大核心 2023年第12期2890-2906,共17页
利用集合相似度自连接算法找出一个集合集中所有相似度大于给定阈值的集合对有着广泛的应用.基于过滤-验证框架和并行分布式计算框架MapReduce的集合相似度连接是近年来的研究热点.但现有算法在阈值低时产生较大规模的候选集,导致性能... 利用集合相似度自连接算法找出一个集合集中所有相似度大于给定阈值的集合对有着广泛的应用.基于过滤-验证框架和并行分布式计算框架MapReduce的集合相似度连接是近年来的研究热点.但现有算法在阈值低时产生较大规模的候选集,导致性能不理想.针对这一问题,提出采用频繁模式树FP-tree及其派生结构FP-tree*将数据压缩在内存中计算集合相似度自连接以减小候选集规模.首先设计并讨论基于现有FP-tree*的集合相似度连接计算及其优缺点,提出遍历效率更高的线性频繁模式树结构模型TELP-tree及基于它的算法TELP-SJ(TELP-tree self join),其包括分别面向构建树和遍历树的2阶段过滤算法,这些算法可以减小树规模和减少树遍历.然后,设计基于MapReduce的并行分布式算法FastTELP-SJ.最后,基于4组真实应用数据集进行3组性能比较实验.实验结果表明FastTELP-SJ算法面向高维大规模集合相似度自连接计算时,包括执行时间、内存占用率、磁盘使用量和可扩展性的运行效率最好. 展开更多
关键词 相似度连接 FP树 MAPREDUCE框架 Jaccard函数 集合
下载PDF
Graph Similarity Join with K-Hop Tree Indexing
2
作者 Yue Wang Hongzhi Wang +1 位作者 Chen Ye Hong Gao 《国际计算机前沿大会会议论文集》 2015年第1期13-14,共2页
Graph similarity join has become imperative for integrating noisy and inconsistent data from multiple data sources. The edit distance is commonly used to measure the similarity between graphs. To accelerate the simila... Graph similarity join has become imperative for integrating noisy and inconsistent data from multiple data sources. The edit distance is commonly used to measure the similarity between graphs. To accelerate the similarity join based on graph edit distance, in the paper, we make use of a preprocessing strategy to remove the mismatching graph pairs with significant differences. Then a novel method of building indexes for each graph is proposed by grouping the nodes which can be reached in k hops for each key node with structure conservation, which is the k-hop-tree based indexing method. Experiments on real and synthetic graph databases also confirm that our method can achieve good join quality in graph similarity join. Besides, the join process can be finished in polynomial time. 展开更多
关键词 GRAPH SIMILARITY join EDIT distance constraint k-hop tree based INDEXING structure conservation boundary filtering
下载PDF
基于并行B^+-树的并行Join算法的设计、分析与实现 被引量:2
3
作者 孙文隽 李建中 常红 《计算机学报》 EI CSCD 北大核心 1998年第1期10-17,共8页
B+-树是一种有效的数据库存储结构,被普遍应用于各种关系数据库系统.把B+-树并行化,使之用于并行数据库系统显然是一项很有意义的重要工作.本文研究了适用于并行数据库的并行B+-树存储结构,提出两类基于并行B+-树的并行Join算... B+-树是一种有效的数据库存储结构,被普遍应用于各种关系数据库系统.把B+-树并行化,使之用于并行数据库系统显然是一项很有意义的重要工作.本文研究了适用于并行数据库的并行B+-树存储结构,提出两类基于并行B+-树的并行Join算法.理论和实验结果表明,这些算法效率高于其它并行Join算法. 展开更多
关键词 并行数据库 并行B^+-树 并行join算法 数据库
下载PDF
基于R-Tree的空间连接代价模型的改进 被引量:1
4
作者 杨静 鞠艳丰 +1 位作者 张健沛 宋尊锋 《计算机工程》 EI CAS CSCD 北大核心 2006年第11期109-110,共2页
对基于R-Tree的空间连接代价模型进行了探讨,主要研究了HUANG Y W提出的空间连接代价模型。利用最优/最差选择策略降低该算法的时间复杂度,对基于缓冲区的代价模型提出了改进后的评估公式,通过实验验证了改进后的模型比原模型提高了评... 对基于R-Tree的空间连接代价模型进行了探讨,主要研究了HUANG Y W提出的空间连接代价模型。利用最优/最差选择策略降低该算法的时间复杂度,对基于缓冲区的代价模型提出了改进后的评估公式,通过实验验证了改进后的模型比原模型提高了评估的精确度。 展开更多
关键词 R-tree 空间连接 代价模型 窗口查询 空间数据
下载PDF
基于EXN-Tree编码的XML结构连接算法研究
5
作者 李英俊 宗金良 孙志胜 《计算机应用》 CSCD 北大核心 2006年第10期2405-2407,2412,共4页
提出了EXN-Tree的概念,将XML文档树的节点映射到EXN-Tree,依据EXN-Tree的节点编码生成XML文档树节点数据结构。基于此新型的节点编码结构,就无序无索引节点集和有序有索引节点集两种情况下的XML结构连接算法展开研究,提出了一系列的结... 提出了EXN-Tree的概念,将XML文档树的节点映射到EXN-Tree,依据EXN-Tree的节点编码生成XML文档树节点数据结构。基于此新型的节点编码结构,就无序无索引节点集和有序有索引节点集两种情况下的XML结构连接算法展开研究,提出了一系列的结构连接算法,解决了无序无索引节点集和有序有索引节点集两种情况下的XML结构连接。分析表明该算法的I/O复杂性优于已有算法,具有良好的性能。 展开更多
关键词 XML EXN—tree编码 结构连接
下载PDF
基于HRR划分的并行RDB^n树Join算法
6
作者 许向阳 高东升 张勇 《计算机工程与应用》 CSCD 北大核心 2002年第8期189-191,共3页
文章首先介绍了PDBMS采用的Hash-Round-Robin(HRR)数据划分方法以及基于该划分方法的并行RDBn树,最后着重、详细地给出了基于该树的并行Join算法,分析了该算法的效率。
关键词 并行数据库 HRR数据划分 并行RDB^n树 并行连接算法 join算法
下载PDF
优化的XML查询匹配:基于B^+-Tree索引的包含段的结构化联接算法 被引量:2
7
作者 樊小华 庞引明 +3 位作者 张谧 汪卫 陈金海 施伯乐 《计算机科学》 CSCD 北大核心 2004年第6期72-75,共4页
高效的结构化联接方法是XML查询的关键。本文提出一种新颖的结构化联接方法,使用了包含段结构化XML文档树,并且使用了B^+-Tree索引技术支持该新方法,从而在基于栈的结构化联接过程中得以忽略若干时空耗费,提高处理效率。
关键词 XML 结构化联接 包含段 B'-tree 查询
下载PDF
pgi-distance:一种高效的并行KNN-join处理方法 被引量:3
8
作者 何洪辉 王丽珍 周丽华 《计算机研究与发展》 EI CSCD 北大核心 2007年第10期1774-1781,共8页
KNN-join是一种新近才提出的操作,它在数据挖掘中有着广泛的应用.利用KNN-join的"一次一个集合"的性质,一些数据挖掘任务,例如分类、例外挖掘和聚类等,就会更加容易地进行.MuX和Goreder则是两种专为KNN-join设计的算法.为了... KNN-join是一种新近才提出的操作,它在数据挖掘中有着广泛的应用.利用KNN-join的"一次一个集合"的性质,一些数据挖掘任务,例如分类、例外挖掘和聚类等,就会更加容易地进行.MuX和Goreder则是两种专为KNN-join设计的算法.为了综合利用这两种方法的优点,一种新的KNN-join并行处理方法——pgi-distance(parallel grid index-distance)——被提了出来.pgi-distance使用双层结构,可以对I/O和CPU进行同时优化;基于距离的索引能够让它更好地适应数据维度和分布的变化.由于采用的是各DBMS厂商广泛支持的B+树索引,这让pgi-distance得以成为一种更为实用的KNN-join处理方法.在合成数据集和真实数据集上的测试也表明pgi-distance是实用的和高效的. 展开更多
关键词 KNN-join 数据挖掘 分类 基于距离的索引 B+树
下载PDF
空间数据库R-tree连接方法研究
9
作者 回敬齐 李伯权 陈芳芳 《齐齐哈尔大学学报(自然科学版)》 2010年第4期27-30,共4页
空间连接是空间数据库中最重要最耗时的操作,国内外学者的研究多是基于索引结构空间连接的一次过滤方法,其中基于R-tree的空间连接算法被认为是一种高效的处理机制。本文提出了基于R-tree空间连接的二次过滤方法,缩小了过滤阶段的候选... 空间连接是空间数据库中最重要最耗时的操作,国内外学者的研究多是基于索引结构空间连接的一次过滤方法,其中基于R-tree的空间连接算法被认为是一种高效的处理机制。本文提出了基于R-tree空间连接的二次过滤方法,缩小了过滤阶段的候选集大小,可有效提高查询效率。 展开更多
关键词 R-tree 空间存取方法 空间连接 二次过滤
下载PDF
基于混合团树的贝叶斯网络智能推理算法 被引量:1
10
作者 郑靓 孙毅 《东北师大学报(自然科学版)》 CAS 北大核心 2023年第2期35-44,共10页
提出了一种基于混合团树的智能推理体系架构,利用原始贝叶斯网络中变量之间的依赖关系对连接树进行改造,使得在推理过程中满足以下两个优势:(1)它能直接消除与证据和查询的无关的变量集,使得混合团树得以缩减为更小规模的二级树状结构,... 提出了一种基于混合团树的智能推理体系架构,利用原始贝叶斯网络中变量之间的依赖关系对连接树进行改造,使得在推理过程中满足以下两个优势:(1)它能直接消除与证据和查询的无关的变量集,使得混合团树得以缩减为更小规模的二级树状结构,进而使消息不必在所有节点中传播;(2)它继承了连接树传播算法中可以重复利用混合团树中预先储存的信息进行加速推理. 展开更多
关键词 贝叶斯网络 智能推理 连接树传播 混合团树 Barren团
下载PDF
基于遗传算法的关系数据库查询优化策略 被引量:8
11
作者 任美睿 李建中 李金宝 《黑龙江大学自然科学学报》 CAS 2004年第3期64-67,共4页
介绍基本遗传算法的基本思想和工作流程,针对数据库管理系统中最难处理和优化的连接操作,讨论在左深连接树的计划集合和浓密连接树的计划集合上的基于遗传算法的查询优化策略。同时通过具体的查询实例说明其左深度连接树和浓密连接树的... 介绍基本遗传算法的基本思想和工作流程,针对数据库管理系统中最难处理和优化的连接操作,讨论在左深连接树的计划集合和浓密连接树的计划集合上的基于遗传算法的查询优化策略。同时通过具体的查询实例说明其左深度连接树和浓密连接树的染色体编码方法,并基于该编码方式进一步确定了基本遗传算法中其它的七个变元。 展开更多
关键词 遗传算法 左深连接树 浓密连接树 查询计划树
下载PDF
粉拟青霉种内nrDNA ITS分析 被引量:11
12
作者 黄勃 王成树 +2 位作者 王滨 樊美珍 李增智 《生物多样性》 CAS CSCD 2003年第6期480-485,共6页
通过对 2 0株粉拟青霉 (Paecilomycesfarinosus)ITS1- 5 .8S -ITS2 (rDNA)区域序列测定 ,确定了粉拟青霉ITS序列 ,而韩国学者测定的粉拟青霉ITS序列应为细脚拟青霉 (P .tenuipes)的序列。序列比较发现 ,韩国 2株未定名的拟青霉 (Paecilo... 通过对 2 0株粉拟青霉 (Paecilomycesfarinosus)ITS1- 5 .8S -ITS2 (rDNA)区域序列测定 ,确定了粉拟青霉ITS序列 ,而韩国学者测定的粉拟青霉ITS序列应为细脚拟青霉 (P .tenuipes)的序列。序列比较发现 ,韩国 2株未定名的拟青霉 (Paecilomycesspp .)菌株 (KACC4 0 2 19、KACC4 0 2 2 1)应为粉拟青霉。基于本研究构建的邻接树推断 ,粉拟青霉的有性型可能是一种虫草。粉拟青霉的起源应为单源的。不同的粉拟青霉菌株的ITS序列具有多态性 ,源于同一地区的菌株的ITS变异也较大。ITS序列的证据表明 。 展开更多
关键词 粉拟青霉 nrDNAITS分析 邻接树 内转录问区 多态性 真菌 生物防治
下载PDF
入侵害虫西花蓟马及其他8种常见蓟马的分子鉴定 被引量:40
13
作者 游中华 路虹 +4 位作者 张宪省 冯纪年 石宝才 宫亚军 黄大卫 《昆虫学报》 CAS CSCD 北大核心 2007年第7期720-726,共7页
用PCR产物直接测序法对入侵害虫西花蓟马和其他8种蓟马的线粒体COⅠ基因433bp片段测序,获得62个个体的序列。分子数据分析显示:种内个体间平均遗传距离在0~0.005之间,2003年在北京发现的西花蓟马与欧洲等地区报导的西花蓟马不存在明显... 用PCR产物直接测序法对入侵害虫西花蓟马和其他8种蓟马的线粒体COⅠ基因433bp片段测序,获得62个个体的序列。分子数据分析显示:种内个体间平均遗传距离在0~0.005之间,2003年在北京发现的西花蓟马与欧洲等地区报导的西花蓟马不存在明显的遗传差异;9种蓟马种间平均遗传距离为0.213。构建的NJ树可以很好的显示蓟马的聚类,物种各单元型最初分支自展值均达到100%。结果表明,基于PCR及直接测序技术的分子鉴定可以达到准确鉴定蓟马物种之目的。 展开更多
关键词 缨翅目 蓟马 分子鉴定 线粒体DNA COⅠ基因 遗传距离 NJ树
下载PDF
MapReduce框架下基于R-树的k-近邻连接算法 被引量:60
14
作者 刘义 景宁 +1 位作者 陈荦 熊伟 《软件学报》 EI CSCD 北大核心 2013年第8期1836-1851,共16页
针对大规模空间数据的高性能k-近邻连接查询处理,研究了MapReduce框架下基于R-树索引的k-近邻连接查询处理.首先利用无依赖并行和串行同步计算的形式化定义抽象了MapReduce并行编程模型,基于此并行计算模型抽象,分别提出了R-树索引快速... 针对大规模空间数据的高性能k-近邻连接查询处理,研究了MapReduce框架下基于R-树索引的k-近邻连接查询处理.首先利用无依赖并行和串行同步计算的形式化定义抽象了MapReduce并行编程模型,基于此并行计算模型抽象,分别提出了R-树索引快速构建算法和基于R-树的并行k-近邻连接算法.在索引构建过程中,提出一种采样算法以快速确立空间划分函数,使得索引构建符合无依赖并行和串行同步计算抽象,在MapReduce框架下非常容易进行表达.在k-近邻连接查询过程中,基于构建的分布式R-树索引,引入k-近邻扩展框限定查询范围并进行数据划分,然后利用R-树索引进行k-近邻连接查询,提高了查询效率.从理论上分析了所提出算法的通信和计算代价.实验与分析结果表明,该算法在真实数据集的查询上具有良好的效率和可扩展性能,可以很好地支持大规模空间数据的k-近邻连接查询处理,具有良好的实用价值. 展开更多
关键词 云计算 MAPREDUCE k-近邻连接 空间查询 R-树
下载PDF
系统发生树构建技术综述 被引量:17
15
作者 李建伏 郭茂祖 《电子学报》 EI CAS CSCD 北大核心 2006年第11期2047-2052,共6页
随着不同的分子测序技术的飞速发展使得大量的DNA分子数据不断涌现,这给生物学家提供了大量的数据使其实现重构地球上所有生命的进化树的梦想.并且,进化树的研究对于解决现代分子生物学中的许多问题都是非常关键的,如多序列比对、蛋白... 随着不同的分子测序技术的飞速发展使得大量的DNA分子数据不断涌现,这给生物学家提供了大量的数据使其实现重构地球上所有生命的进化树的梦想.并且,进化树的研究对于解决现代分子生物学中的许多问题都是非常关键的,如多序列比对、蛋白质结构和功能预测以及药物设计等等.但是构建进化树又是一个非常复杂的问题.因此,进化树的研究成了一个研究热点.本文介绍了进化树研究的发展、研究现状,最后在总结现有的进化树构建技术存在的问题的基础上探讨了该领域进一步的研究方向. 展开更多
关键词 系统发生树 邻接法 最大简约法 最大似然法
下载PDF
基于R-树索引的Map-Reduce空间连接聚集操作 被引量:5
16
作者 刘义 陈荦 +1 位作者 景宁 熊伟 《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第1期136-141,共6页
空间连接聚集是一种常用并且非常耗时的空间数据库操作,特别是在面对大规模空间数据集时,单机运行环境难以满足其对时空开销的需求,如何设计高效的面向云计算环境中的分布式空间连接聚集算法越来越受到人们关注。Map-Reduce作为云计算... 空间连接聚集是一种常用并且非常耗时的空间数据库操作,特别是在面对大规模空间数据集时,单机运行环境难以满足其对时空开销的需求,如何设计高效的面向云计算环境中的分布式空间连接聚集算法越来越受到人们关注。Map-Reduce作为云计算的核心模式受限于其扁平化的串行扫描操作模型,常被用来加速非索引的空间连接操作,现有工作尚无将Map-Reduce和R-树索引结合来处理空间连接聚集。因此,提出了基于R-树索引的Map-Reduce空间连接聚集算法(RSJA-MR)来更高效地返回连接聚集结果。提出一种分布式R-树索引结构以支持大规模空间数据的索引,RSJA-MR算法利用分布式R-树生成任务集,任务集的执行满足无依赖并行计算模式,很容易在Map-Reduce框架中进行表达。文中提出一种实时缓存策略以支持索引并发访问。实验结果表明:相比非索引的Map-Reduce连接聚集算法,在空间交叠连接聚集查询上,时间性能最少提升8%,在空间包含连接聚集查询上,时间性能最少提升近35%。 展开更多
关键词 云计算 MAP-REDUCE 空间连接聚集 R-树
下载PDF
贵州威宁黄牛线粒体DNA D-loop区全序列分析 被引量:8
17
作者 刘若余 杨公社 +3 位作者 夏先林 刘培琼 张明忠 雷初朝 《黑龙江畜牧兽医》 CAS 北大核心 2005年第10期11-12,共2页
为了解贵州威宁黄牛的遗传多样性及遗传背景,测定了19个个体的线粒体DNAD-loop区全序列。威宁黄牛D-loop区全序列中,A+T平均含量为61.4%,G+C含量为38.6%。经比对,共检测到威宁黄牛D-loop区8种单倍型,核苷酸多态位点45个,其中7种为普通... 为了解贵州威宁黄牛的遗传多样性及遗传背景,测定了19个个体的线粒体DNAD-loop区全序列。威宁黄牛D-loop区全序列中,A+T平均含量为61.4%,G+C含量为38.6%。经比对,共检测到威宁黄牛D-loop区8种单倍型,核苷酸多态位点45个,其中7种为普通牛血统的单倍型,1种为瘤牛血统的单倍型,表明威宁黄牛同时受到普通牛和瘤牛的影响。在威宁黄牛19个个体中,其单倍型多样度为0.715,核苷酸歧异度(π值)为2.415%,表明威宁黄牛品种的遗传多样性丰富。 展开更多
关键词 威宁黄牛 线粒体DNA D-LOOP 单倍型 邻接树 遗传多样性
下载PDF
一种分布式数据库多元连接查询优化算法及改进 被引量:25
18
作者 胡枫 陶世群 《计算机工程与应用》 CSCD 北大核心 2001年第16期125-127,共3页
论文对于分布式数据库中的多元连接查询提出了一种优化算法。该算法产生的操作序列具有全局优化特征。在远程网中,采用最小生成树算法,生成最佳的连接序对能使得总的代价达到最小。而在局域网中,采用改进的最小生成树算法,生成尽可... 论文对于分布式数据库中的多元连接查询提出了一种优化算法。该算法产生的操作序列具有全局优化特征。在远程网中,采用最小生成树算法,生成最佳的连接序对能使得总的代价达到最小。而在局域网中,采用改进的最小生成树算法,生成尽可能多的并行连接序对,最大程度地应用并行性,使得响应时间最小。 展开更多
关键词 分布式数据库 多元连接 查询优化 最小生成树 并行性 算法
下载PDF
基于改进B+树索引的结构连接算法 被引量:3
19
作者 吴恒山 徐晓军 桂浩 《计算机工程》 CAS CSCD 北大核心 2005年第16期86-88,共3页
基本的结构连接是XML数据库查询处理的一个核心操作。Stack_Tree_Desc_B+算法能够有效地跳过不参加连接的后代,但跳过祖先的能力不强。通过对B+树叶子结点的每一项增加了parent和nextNeighbour指针,该文提出了一种改进算法Stack_Tree_De... 基本的结构连接是XML数据库查询处理的一个核心操作。Stack_Tree_Desc_B+算法能够有效地跳过不参加连接的后代,但跳过祖先的能力不强。通过对B+树叶子结点的每一项增加了parent和nextNeighbour指针,该文提出了一种改进算法Stack_Tree_Desc_B+_pn。改进算法不但具有较强的跳过后代的能力,而且具有较强的跳过祖先的能力。实验表明Stack_Tree_Desc_B+_pn算法可以有效地减少I/O次数,具有更高的性能。 展开更多
关键词 XML数据库 结构连接算法 B+树
下载PDF
基于最小生成树的数据流窗口连接优化算法 被引量:3
20
作者 钱江波 徐宏炳 +3 位作者 董逸生 王永利 刘学军 杨雪梅 《计算机研究与发展》 EI CSCD 北大核心 2007年第6期1000-1007,共8页
与传统关系数据库不同,数据流管理系统主要处理并发的连续查询.由于查询可能随时增删,所以其主要关注适合查询增删的并发连续查询优化,而不是单条查询优化.提出适合频繁增删查询环境下的数据流窗口连接优化算法.对于新注册的查询以类似... 与传统关系数据库不同,数据流管理系统主要处理并发的连续查询.由于查询可能随时增删,所以其主要关注适合查询增删的并发连续查询优化,而不是单条查询优化.提出适合频繁增删查询环境下的数据流窗口连接优化算法.对于新注册的查询以类似最小生成树算法写出数据流的探测序列,然后在不更改其他查询探测序列顺序的情况下尽量合并,减少重复计算.注册或删除查询并不影响其他的查询计划,不需要执行繁琐的查询计划迁移.理论分析和实验证明,该算法简单,优化性能在可接受的范围内,尤其适合查询更新频率较高的系统. 展开更多
关键词 窗口连接 多查询优化 最小生成树 连续查询
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部