期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
面向大规模机群的可扩展OLAP查询技术 被引量:8
1
作者 王会举 覃雄派 +2 位作者 王珊 张延松 李芙蓉 《计算机学报》 EI CSCD 北大核心 2015年第1期45-58,共14页
大数据时代,由中低端硬件组成的大规模机群逐渐成为海量数据处理的主流平台之一.然而传统基于高端硬件平台设计的并行OLAP查询算法并不适应这种由不可靠计算单元组成的大规模并行计算的环境.为改善其在新计算环境下的的扩展性和容错性,... 大数据时代,由中低端硬件组成的大规模机群逐渐成为海量数据处理的主流平台之一.然而传统基于高端硬件平台设计的并行OLAP查询算法并不适应这种由不可靠计算单元组成的大规模并行计算的环境.为改善其在新计算环境下的的扩展性和容错性,该文对传统数据仓库的数据组织模式及处理模式进行改造,提出了全新的无连接雪花模型和TRM执行模型.无连接雪花模型基于层次编码技术,将维表层次等关键信息压缩进事实表,使得事实表可以独立处理数据,从数据模型层保证了数据计算的独立性;TRM执行模型将OLAP查询的处理抽象为Transform、Reduce、Merge 3个操作,使得OLAP查询可被划分为众多可并行执行的独立子任务,从执行层保证了系统的高度可扩展特性.在性能优化方面,该文提出了Scan-index扫描和跳跃式扫描算法,以尽可能地减少I/O访问操作;设计了并行谓词判断、批量谓词判断等优化算法,以加速本地计算速度.实验表明:LaScOLAP原型可以获得较好的扩展性和容错性,其性能比HadoopDB高出一个数量级. 展开更多
关键词 大规模可扩展 OLAP查询 无连接雪花模型 TRM执行模型 跳跃式扫描 Scan-index 大数据
下载PDF
无冲突满足P_4的无U环数据库模式分解条件的研究 被引量:2
2
作者 刘文远 郝忠孝 《计算机研究与发展》 EI CSCD 北大核心 2000年第2期170-174,共5页
无β环是一种重要的无环级别,与无损联接、保持依赖和4NF一起,成为多值依赖环境下数据库模式规范化的基本要求,能够直接指导数据库的模式设计.文中提出了严格无冲突的概念,以线图为工具,证明了应用分解树算法对一个严格无冲突... 无β环是一种重要的无环级别,与无损联接、保持依赖和4NF一起,成为多值依赖环境下数据库模式规范化的基本要求,能够直接指导数据库的模式设计.文中提出了严格无冲突的概念,以线图为工具,证明了应用分解树算法对一个严格无冲突的MVD集分解得到的数据库模式对应的线图及等权化简子图都是三角化的,而且线图中每个三角形都是相容的.最后得出无冲突条件下无β环且满足保持数据依赖、无损联接和4NF的数据库模式分解的充要条件是给定的MVD集存在一个严格无冲突的覆盖. 展开更多
关键词 数据库模式 设计 无冲突 无β
下载PDF
认知语言学翻译视角下图式知识对旅游翻译的启示 被引量:5
3
作者 李江春 《外国语文》 北大核心 2012年第2期101-104,共4页
以认知语言学翻译观为出发点,分析语言图式、内容图式、结构图式和意象图式对旅游翻译的启示可知,在旅游翻译实践中,图式知识的正影响可以促进翻译质量的提高,有效扼制翻译中的胡乱"创造",并促进国际交流。
关键词 认知 图式知识 扼制 胡乱创造 旅游翻译
下载PDF
基于列存储机制下多维数据仓库模型的优化与研究 被引量:3
4
作者 徐晓锦 孙蕾 《计算机应用与软件》 2017年第2期48-52,共5页
通过对分布式列存储机制下多维数据仓库模型的研究,考虑到多维数据仓库模型上的关联和聚集操作常常会引入大量的数据迁移,提出一种有效的列存储机制下多维数据仓库模型的优化方法即结合层次编码技术。采用维表层次全局域编码和维表层次... 通过对分布式列存储机制下多维数据仓库模型的研究,考虑到多维数据仓库模型上的关联和聚集操作常常会引入大量的数据迁移,提出一种有效的列存储机制下多维数据仓库模型的优化方法即结合层次编码技术。采用维表层次全局域编码和维表层次局部域编码相结合的方式对传统星型模型维表中的层次信息进行二进制编码整合,将维表的层次信息压缩进事实表形成无连接星型模型,并针对新模型下的数据特征提出一种复合压缩策略,以期减少分布式列存储机制下的OLAP操作引入的数据迁移并降低数据存储空间,提升系统的查询性能。实验结果表明,该优化方法是可行且有效的。 展开更多
关键词 数据仓库 OLAP 无连接星型模型 列存储 数据压缩
下载PDF
基于MongoDB的地震风险评估综合地情数据服务平台设计与实现
5
作者 杨理臣 帅向华 +2 位作者 董翔 刘钦 李继赓 《中国地震》 北大核心 2022年第1期120-130,共11页
本文介绍了基于MongoDB的地震风险评估综合地情数据服务平台,以灵活的文档结构存储与查询为目标,使用Web Service技术,采用前后端分离的开发方式,给出了系统的总体设计以及关键技术和功能,实现了全国区县级地震风险评估综合地情数据更... 本文介绍了基于MongoDB的地震风险评估综合地情数据服务平台,以灵活的文档结构存储与查询为目标,使用Web Service技术,采用前后端分离的开发方式,给出了系统的总体设计以及关键技术和功能,实现了全国区县级地震风险评估综合地情数据更灵活地上传、编辑、查询等功能。通过建立全国统一的地震风险评估综合地情数据服务平台,对数据进行可视化展示,提高了全国综合地情数据的利用率和服务能力。 展开更多
关键词 综合地情数据 自由存储 前后端分离 MONGODB
下载PDF
一种基于模式覆盖的XML文档自动生成方法
6
作者 郑黎晓 王成 常青玲 《小型微型计算机系统》 CSCD 北大核心 2015年第1期77-82,共6页
XML文档自动生成在XML模式验证及网络环境下应用程序的测试中有广泛的应用.提出一种基于模式覆盖的XML文档自动生成方法,从给定模式中生成一组有效的且具有一定模式覆盖性的XML文档.采用正规树文法作为XML模式语言的形式模型,通过分析XM... XML文档自动生成在XML模式验证及网络环境下应用程序的测试中有广泛的应用.提出一种基于模式覆盖的XML文档自动生成方法,从给定模式中生成一组有效的且具有一定模式覆盖性的XML文档.采用正规树文法作为XML模式语言的形式模型,通过分析XML文档树与字符串之间的对应关系,将正规树文法转换为上下文无关文法,然后利用基于文法覆盖准则的句子生成算法从上下文无关文法中生成一组满足特定覆盖准则的句子,最后将句子还原为XML文档.实例分析和实验结果表明,生成的XML文档能较好地反映模式定义中的各种结构信息,可有效应用于XML模式验证及相关应用程序的功能测试. 展开更多
关键词 XML XML模式 自动生成 正规树文法 上下文无关文法
下载PDF
健康无忧网
7
作者 华辉 闫哲 《电脑知识与技术(过刊)》 2016年第5X期43-44,50,共3页
健康是万源之本,是一切生命活动及社会活动的前提和保障,健康的重要性不言而喻,当今利用高速发展的信息网络来提高民众的健康水平已是使命使然。疾病重在防患于未然,心理和身体的疾病同样重要,为此,该文主要对健康无忧网的设计和实现进... 健康是万源之本,是一切生命活动及社会活动的前提和保障,健康的重要性不言而喻,当今利用高速发展的信息网络来提高民众的健康水平已是使命使然。疾病重在防患于未然,心理和身体的疾病同样重要,为此,该文主要对健康无忧网的设计和实现进行分析。 展开更多
关键词 健康无忧网 架构设计 功能实现 数据库
下载PDF
语言的先验想象之力 被引量:2
8
作者 陈杰 《外语学刊》 CSSCI 北大核心 2017年第1期6-9,共4页
本文以语言直观为切入点,提出想象力是以"自由基"的形式结构性地粘着于语言和语法之上。根据"语言键"和"语法键"联结对象的不同,想象力分为"创制的想象力"和"复制的想象力",二者在&q... 本文以语言直观为切入点,提出想象力是以"自由基"的形式结构性地粘着于语言和语法之上。根据"语言键"和"语法键"联结对象的不同,想象力分为"创制的想象力"和"复制的想象力",二者在"先验想象之力"和"经验想象之力"的作用下自由扩展,接受规约。在这种"键理论"框架内,"想象力的图式"属于冗余概念。 展开更多
关键词 语言 直观 想象力 自由基 图式
原文传递
Efficient query processing framework for big data warehouse: an almost join-free approach 被引量:3
9
作者 Huiju WANG Xiongpai QIN +4 位作者 Xuan ZHOU Furong LI Zuoyan QIN Qing ZHU Shan WANG 《Frontiers of Computer Science》 SCIE EI CSCD 2015年第2期224-236,共13页
The rapidly increasing scale of data warehouses is challenging today's data analytical technologies. A con- ventional data analytical platform processes data warehouse queries using a star schema -- it normalizes the... The rapidly increasing scale of data warehouses is challenging today's data analytical technologies. A con- ventional data analytical platform processes data warehouse queries using a star schema -- it normalizes the data into a fact table and a number of dimension tables, and during query processing it selectively joins the tables according to users' demands. This model is space economical. However, it faces two problems when applied to big data. First, join is an expensive operation, which prohibits a parallel database or a MapReduce-based system from achieving efficiency and scalability simultaneously. Second, join operations have to be executed repeatedly, while numerous join results can actually be reused by different queries. In this paper, we propose a new query processing frame- work for data warehouses. It pushes the join operations par- tially to the pre-processing phase and partially to the post- processing phase, so that data warehouse queries can be transformed into massive parallelized filter-aggregation oper- ations on the fact table. In contrast to the conventional query processing models, our approach is efficient, scalable and sta- ble despite of the large number of tables involved in the join. It is especially suitable for a large-scale parallel data ware- house. Our empirical evaluation on Hadoop shows that our framework exhibits linear scalability and outperforms some existing approaches by an order of magnitude. 展开更多
关键词 data warehouse large scale TAMP join-free multi-version schema
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部