期刊文献+
共找到85篇文章
< 1 2 5 >
每页显示 20 50 100
初中生课外补习的影响因素研究——基于CEPS的调查数据分析 被引量:23
1
作者 吴翌琳 《教育科学》 CSSCI 北大核心 2016年第5期63-73,共11页
课外补习由于依附于主流教育,因此被称为影子教育(shadow education)。本文通过对全国112所初中进行抽样调查,对现阶段我国初中生课外补习的规模、强度、支出及其影响因素进行了分析与探讨。研究显示:参加课外补习的学生规模庞大。九年... 课外补习由于依附于主流教育,因此被称为影子教育(shadow education)。本文通过对全国112所初中进行抽样调查,对现阶段我国初中生课外补习的规模、强度、支出及其影响因素进行了分析与探讨。研究显示:参加课外补习的学生规模庞大。九年级比七年级课外补习的强度更大。课外补习支出与家庭经济水平呈正比例关系。女性比男性的补习参与几率、强度与支出都高。成绩排名越高,父亲受教育程度越高,学生参加补习的几率、强度与支出越大。 展开更多
关键词 课外补习 补习强度 LOGISTIC回归
下载PDF
一种基于管算存分离的内存数据库实现技术
2
作者 张延松 韩瑞琛 +1 位作者 刘专 张宇 《计算机学报》 EI CAS CSCD 北大核心 2023年第4期761-779,共19页
在多核处理器、大内存、非易失内存等新硬件技术的支持下,异构存储与计算平台成为主流的高性能计算平台.传统的数据库引擎采用一体化设计,新兴数据库则采用存算分离和算子下推技术以更好适应新型分布式存储架构.提出了一种新颖的基于管... 在多核处理器、大内存、非易失内存等新硬件技术的支持下,异构存储与计算平台成为主流的高性能计算平台.传统的数据库引擎采用一体化设计,新兴数据库则采用存算分离和算子下推技术以更好适应新型分布式存储架构.提出了一种新颖的基于管算存分离方法的内存数据库实现技术,在存算分离技术的基础上进一步根据数据库模式、数据分布与负载计算特征将数据集划分为元数据集和数值集,将统一的查询引擎分解为元数据管理引擎、计算引擎和存储引擎,将包含语义信息的元数据管理抽象为独立的管理层,将无语义的数值存储和计算抽象为计算存储层,其中计算密集型负载定义为计算层,数据密集型负载设计为存储层,并根据硬件平台的不同分离或合并计算与存储层.内存数据库的实现技术分为几个层次:1)模式优化,实现数据库存储中“数(数值)”与“据(元数据)”的分离,根据数据的内在特性选择不同的存储与计算策略;2)模型优化,采用Fusion OLAP模型,实现在关系存储模型上的高性能多维计算;3)算法优化,通过代理键索引、向量索引支持优化的向量连接、向量聚集算法,提高OLAP性能;4)系统设计优化,通过数据库引擎分层技术实现管理与计算分离、存储与计算分离以及多维计算算子下推到存储层.实验结果表明,管算存分离计算模型可以灵活地支持CPU-GPU异构计算平台、DRAM-PM(Persistent Memory,持久内存)异构存储平台和外部存储平台,采用开源的Arrow内存列存储引擎作为数据库“数”的存储引擎,以及应用多维计算算子下推到Arrow存储引擎技术的OLAP实现技术在SSB基准测试中与存算结合的内存OLAP实现技术性能相当,查询性能优于主流内存数据库Hyper和OmniSciDB,以及基于Arrow存储的GPU数据库PG-Strom. 展开更多
关键词 内存数据库 数据分离 存算分离 管算分离 向量索引
下载PDF
企业家精神对创新影响的均衡性与差异性研究——基于创新调查与财务数据对接的微观证据 被引量:4
3
作者 吴翌琳 《财经问题研究》 CSSCI 北大核心 2019年第4期113-121,共9页
企业家是市场经济中的"关键少数"和特殊人才,是推进创新驱动发展战略的重要力量。本文构建CDM协同创新系统模型,基于创新调查与企业财务数据对接,考察企业家精神对于不同创新活动的系统影响。研究发现,创新受到企业家的普遍重... 企业家是市场经济中的"关键少数"和特殊人才,是推进创新驱动发展战略的重要力量。本文构建CDM协同创新系统模型,基于创新调查与企业财务数据对接,考察企业家精神对于不同创新活动的系统影响。研究发现,创新受到企业家的普遍重视,创新方式趋于多元化,以实现技术创新与非技术创新的优化组合,其中,企业家创新精神促进技术创新与非技术创新的均衡发展,而企业家教育背景及对创新重视程度对创新的影响具有结构性和差异性;企业家创新决策面临人才支撑不协同、知识产权保护不够和创新政策普惠性低等一系列问题制约,抑制了企业家创新精神的实现。 展开更多
关键词 企业家创新精神 协同创新系统 CDM模型
下载PDF
海量数据分析的One-size-fits-all OLAP技术 被引量:30
4
作者 张延松 焦敏 +2 位作者 王占伟 王珊 周烜 《计算机学报》 EI CSCD 北大核心 2011年第10期1936-1946,共11页
传统的OLAP被迅速膨胀的海量数据推动进入了大规模数据分析时代,其主要特点是存储密度大,计算强度大,需要大规模并行存储和处理能力.无论是传统的并行数据库技术还是热点的MapReduce技术都不得不面对海量数据在大规模并行处理环境下的... 传统的OLAP被迅速膨胀的海量数据推动进入了大规模数据分析时代,其主要特点是存储密度大,计算强度大,需要大规模并行存储和处理能力.无论是传统的并行数据库技术还是热点的MapReduce技术都不得不面对海量数据在大规模并行处理环境下的性能和并行处理效率的问题.以星型模型上复杂多表连接为基础的OLAP算法的复杂度和并行处理过程中的数据网络传输代价都成为制约性能的重要因素.通过深入分析OLAP存储模型和查询负载特征,提出了对OLAP查询中最基础的SPJGA-OLAP子集在存储、查询处理、数据分布、网络传输和分布式缓存等方面面向海量数据大规模并行处理框架的优化策略和实现技术.通过对TPC-H和SSB两个工业界和学术界公认的测试标准的分析,评估了技术的可行性.提出了以内存predicate-vector DDTA-JOIN算法为核心的并行内存OLAP架构,以维表上规范化的谓词向量操作替代了多样的连接执行计划,实现以一种查询处理模型同时满足集中式处理和大规模并行OLAP处理的需求,充分利用现代计算机的硬件优势,最小化网络传输和OLAP查询处理代价.实验中分析了在1TB和100TB数据集中数据分布策略的存储代价和传输代价,通过并行OLAP代价模型和实际数据的实验测试验证了技术的可行性和并行处理效率. 展开更多
关键词 OLAP 海量数据分析处理 谓词向量 星型模型
下载PDF
大数据时代的统计教育 被引量:84
5
作者 孟生旺 袁卫 《统计研究》 CSSCI 北大核心 2015年第4期3-7,共5页
2014年11月,美国统计学会适应大数据时代的要求,发布了统计学本科专业指导性教学纲要。而在2013年,我国统计类本科专业刚刚进行了一次较大调整,目前的专业课程设置和教学内容改革还处于探索阶段。美国统计学会发布的这份指导性教学纲要... 2014年11月,美国统计学会适应大数据时代的要求,发布了统计学本科专业指导性教学纲要。而在2013年,我国统计类本科专业刚刚进行了一次较大调整,目前的专业课程设置和教学内容改革还处于探索阶段。美国统计学会发布的这份指导性教学纲要对于推进我国统计类本科专业教育改革具有重要借鉴意义。本文首先概括性地介绍了美国统计学会发布的统计学本科专业指导性教学纲要的核心内容,包括统计专业本科生应该掌握的基本技能和应该修读的主要课程,然后分析了我国统计类本科专业教育存在的问题,并提出了在大数据时代改进我国统计类本科专业教育的几点建议。 展开更多
关键词 统计教育 大数据 课程体系 本科专业
下载PDF
中国阿尔茨海默病报告2021 被引量:153
6
作者 任汝静 殷鹏 +23 位作者 王志会 齐金蕾 汤然 王金涛 黄强 李建平 谢心怡 胡勇博 崔诗爽 余小萍 朱圆 刘馨雅 朱怡康 林绍慧 王怡然 黄延焱 胡以松 王学锋 王鸿利 褚敬申 王颖 李春波 周脉耕 王刚 《诊断学理论与实践》 2021年第4期317-337,共21页
随着我国社会经济的发展和人口老龄化进程的加速,与成功老龄化对应的老年性疾病对国民的影响日益突出,其中阿尔茨海默病(Aizheimer’s disease,AD)及相关认知障碍尤为突出和显著。目前,中国AD发病率、患病率及死亡率仍持续增高,AD死亡... 随着我国社会经济的发展和人口老龄化进程的加速,与成功老龄化对应的老年性疾病对国民的影响日益突出,其中阿尔茨海默病(Aizheimer’s disease,AD)及相关认知障碍尤为突出和显著。目前,中国AD发病率、患病率及死亡率仍持续增高,AD死亡占城乡居民总死亡原因的第5位,给居民和社会带来的经济负担日渐加重。为响应"健康中国行动",促进由疾病治疗向健康维护转变,由上海交通大学医学院附属瑞金医院和中国疾病预防控制中心慢性非传染性疾病预防控制中心、复旦大学公共卫生学院、上海交通大学医学院附属精神卫生中心等单位专家联合编撰了本报告。本报告动态跟踪报道我国的AD流行趋势,综合评价我国的AD疾病经济负担,全面揭示我国的AD诊疗现状以及现有的相关公共卫生资源,旨在为AD的防治提供技术指导和支持,为政府制定相关卫生政策提供专业支持依据,为开展国际交流合作提供信息平台。 展开更多
关键词 标化患病率 年龄组 患病情况 老年认知障碍 照护服务 公共卫生资源 阿尔茨海默病 死亡率
下载PDF
内存数据仓库集群技术研究 被引量:2
7
作者 张延松 王珊 周烜 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第5期117-132,共16页
随着硬件的集成度不断提高,多核处理器和大内存成为当前主流的计算平台,内存计算也成为新兴的高性能数据分析平台.内存数据仓库集群技术面向高性能分析计算,是实现大数据实时分析的基础平台.本文概括地介绍了中国人民大学高性能数据库... 随着硬件的集成度不断提高,多核处理器和大内存成为当前主流的计算平台,内存计算也成为新兴的高性能数据分析平台.内存数据仓库集群技术面向高性能分析计算,是实现大数据实时分析的基础平台.本文概括地介绍了中国人民大学高性能数据库团队在内存数据仓库集群技术方面的研究工作,包括:以列分布和列计算服务为中心的ScaMMDB内存数据仓库集群,以水平分片、并行计算为中心的ScaMMDBⅡ和reverse-star schema分布、集群向量计算为特征的MiNT-OLAP Cluster等技术的研究发展过程.分析了内存数据仓库集群技术的关键问题及技术挑战,并针对新的内存数据仓库集群应用需求展望未来技术的发展. 展开更多
关键词 内存数据仓库 集群 向量计算
下载PDF
内存数据库可控的page-color优化技术研究 被引量:1
8
作者 张延松 王占伟 +1 位作者 孙妍 王珊 《计算机研究与发展》 EI CSCD 北大核心 2011年第S3期95-104,共10页
page-color的研究集中在如何通过有效的cache分区技术隔离弱局部性数据与强局部性数据的访问冲突,减少数据处理过程中由弱局部性数据产生的cache污染对强局部性数据的影响.但这些优化技术依赖于特殊的处理器硬件设计、操作系统内核功能... page-color的研究集中在如何通过有效的cache分区技术隔离弱局部性数据与强局部性数据的访问冲突,减少数据处理过程中由弱局部性数据产生的cache污染对强局部性数据的影响.但这些优化技术依赖于特殊的处理器硬件设计、操作系统内核功能的扩展或同时依赖于硬件的特殊设计和操作系统扩展功能的支持.提出了应用软件层上基于page-color的W-order扫描优化技术,不依赖特殊的处理器硬件设计,最小化依赖操作系统的扩展功能.研究的核心思想是通过page-color控制弱局部性数据的页面地址访问顺序,将弱局部性数据与强局部性数据在cache中的冲突域由整个地址空间缩小为指定page-color的地址空间内,从而降低整体的cachemiss,降低数据处理时的延迟.与典型的page-coloring技术相比,不需要扩展操作系统内核功能,具有更好的内存地址空间利用率,能够实现查询内数据集粒度上的cache分区优化.实验中模拟了内存数据库中典型的多表连接算法,通过模拟cache行为模式和在实际查询处理时使用cache监测工具验证了W-order区优化技术的可行性与cache性能.实验结果表明,通过在应用软件层次上对顺序访问操作的控制,能够有效地降低cachemiss,提高内存数据库查询处理性能. 展开更多
关键词 内存数据库 cache污染 page-color W-order扫描
下载PDF
有限机会的公平分配 中国农民子女市民化的水平与模式 被引量:10
9
作者 李丁 《社会》 CSSCI 北大核心 2014年第4期91-118,共28页
本文将农民、农民工以及已经获得非农户籍的"新市民"的"农民子女"作为分析对象,以农民子女跨越城乡二元系统的市民化进程来透视中国社会系统的开放性与社会分层流动机制。基于CGSS调查数据等资料的分析表明,改革开... 本文将农民、农民工以及已经获得非农户籍的"新市民"的"农民子女"作为分析对象,以农民子女跨越城乡二元系统的市民化进程来透视中国社会系统的开放性与社会分层流动机制。基于CGSS调查数据等资料的分析表明,改革开放以来,中国农民的职业非农化水平快速提高,但身份市民化机会长期保持不变,两者之间的断裂日益扩大。这种断裂不仅表现在水平上,也表现在分配机制上。职业非农化的途径日益多元化,教育的作用相对弱化,家庭背景有着相对重要的作用。而户籍非农化(身份市民化)因升学之外的传统途径不断收缩,教育成为影响户籍非农化的主要因素,从而保持了有限的户籍非农化机会在农民子女间分配的公平性。 展开更多
关键词 农民子女 市民化 职业非农化 身份市民化
下载PDF
互联网企业广告收入预测研究——基于低频数据的神经网络和时间序列组合模型 被引量:6
10
作者 吴翌琳 南金伶 《统计研究》 CSSCI 北大核心 2020年第5期94-103,共10页
神经网络模型对大样本时间序列的拟合效果优于传统时间序列模型,但对于年度、月度、日度等低频时间序列的预测则难以发挥其优势。鉴于此,本文应用传统时间序列模型和神经网络模型,建立Holtwinters-BP组合模型,利用Holtwinters模型分别... 神经网络模型对大样本时间序列的拟合效果优于传统时间序列模型,但对于年度、月度、日度等低频时间序列的预测则难以发挥其优势。鉴于此,本文应用传统时间序列模型和神经网络模型,建立Holtwinters-BP组合模型,利用Holtwinters模型分别拟合各解释变量序列,利用BP模型拟合解释变量和自变量的非线性关系,基于某社交新闻类APP的日广告收入数据进行互联网企业广告收入预测研究。通过与循环神经网络(RNN)模型、长短期记忆神经网络(LSTM)模型等预测结果的对比发现:Holtwinters-BP组合模型的预测精度和稳定性更高;证明多维变量对于广告收入的显著影响,多变量模型的预测准确性高于单变量模型;构建的Holtwinters-BP组合模型对于低频数据预测有较好的有效性和适用性。 展开更多
关键词 广告收入预测 神经网络模型 Holtwinters模型 组合模型
下载PDF
“数据治国”的三个关键理念--从互联网思维到未来治理图景 被引量:6
11
作者 杜小勇 冯启娜 《学术前沿》 CSSCI 2015年第2期49-61,共13页
大数据因其规模巨大、类型复杂、产生速度快、价值密度低等特点,对现有信息技术构成巨大挑战。运用新理念、新技术、新方法对大数据进行全生命周期的创新管理和应用,是推动国民经济转型和社会管理创新的重要契机,也是提升国家综合竞争... 大数据因其规模巨大、类型复杂、产生速度快、价值密度低等特点,对现有信息技术构成巨大挑战。运用新理念、新技术、新方法对大数据进行全生命周期的创新管理和应用,是推动国民经济转型和社会管理创新的重要契机,也是提升国家综合竞争力的重要趋势。支撑这场大数据革命的底层力量,不仅仅是技术革命,更是涉及领导意识、组织文化和行为方式的思维革命。在国家治理层面,尤其需要形成"数据治国"的治理理念,掌握用数据思考和解决社会问题的新方法,最重要的是树立数据思维、互联网思维和计算思维这三种思维方式。 展开更多
关键词 治理现代化 数据治国 计算思维 技术革命
下载PDF
中国区域创新系统协同发展路径研究——基于区域集成创新指数的实证分析 被引量:4
12
作者 吴翌琳 《调研世界》 CSSCI 北大核心 2013年第1期53-57,共5页
当前我国出口导向型发展模式受到严峻挑战,自主创新具有更加重要的意义,有助于形成新的增长点和竞争优势。本文系统梳理区域创新多层次主体、多种类创新要素、众多关联产业的关系脉络和传导机制,构建区域创新系统评价体系,对2001-2010... 当前我国出口导向型发展模式受到严峻挑战,自主创新具有更加重要的意义,有助于形成新的增长点和竞争优势。本文系统梳理区域创新多层次主体、多种类创新要素、众多关联产业的关系脉络和传导机制,构建区域创新系统评价体系,对2001-2010年区域创新系统发展状况进行横向纵向的综合分析,并利用系统聚类方法将31省区市分为4种类型,归纳出4种不同类型区域的创新系统发展模式。本文从现实角度用科学数据描述、分析我国创新型国家建设中区域均衡发展问题,为推进国家创新进程提供实务性思路。 展开更多
关键词 区域创新系统 协同创新发展模式 区域集成创新指数
下载PDF
代际传承与学校过程:大学本科毕业生的地位获得 被引量:11
13
作者 王卫东 《中国人民大学教育学刊》 2013年第3期5-25,共21页
本文利用中国教育追踪调查数据,在综合第二代代际流动模型中的布劳—邓肯模型和威斯康星模型的基础上,利用代际传承、学校过程、结构性制约这三组因素来构造大学本科毕业生的地位获得模型。分析显示学校过程和结构性制约对于大学本科毕... 本文利用中国教育追踪调查数据,在综合第二代代际流动模型中的布劳—邓肯模型和威斯康星模型的基础上,利用代际传承、学校过程、结构性制约这三组因素来构造大学本科毕业生的地位获得模型。分析显示学校过程和结构性制约对于大学本科毕业生的地位获得有着直接的影响,而代际传承对于地位获得没有直接效应,只能通过父代的教育水平来影响学校过程,尤其是学业表现来间接地影响本科毕业生的地位获得。这说明目前中国的高等教育体系在一定程度上阻隔了代际传承的作用,发挥了教育促进社会流动,缓解社会结构固化效应的功能。 展开更多
关键词 代际流动 地位获得 学校过程 教育追踪调查
下载PDF
意义的匮乏与北京市大学生对宗教的兴趣态势 被引量:1
14
作者 孙尚扬 李丁 《宗教社会学》 2013年第1期290-309,共20页
在国学热与宗教热中,北京市大学生对宗教的兴趣取向因历史上的学生运动在现当代中国颇具示范性而值得进行调查研究。本文基于以PPS抽样法获取的数据,以宗教社会学中的意义问题为基本切入点,展示了北京市大学生思考人生意义问题的频率很... 在国学热与宗教热中,北京市大学生对宗教的兴趣取向因历史上的学生运动在现当代中国颇具示范性而值得进行调查研究。本文基于以PPS抽样法获取的数据,以宗教社会学中的意义问题为基本切入点,展示了北京市大学生思考人生意义问题的频率很高,但半数以上的大学生并未找到令其满意的关于终极性问题的答案,对于自己在未来社会中的角色定位也感到困惑,意义的匮乏在北京市大学生中确实存在。在对意义的探寻中,不超过20%的大学生成了各种宗教的信徒。调查表明,思考人生意义问题的频率与信仰宗教的可能性之间存在着正相关。而大学生最感兴趣的是佛教,其次是基督宗教,然后依次是道教、儒教和伊斯兰教。他们在遭遇意义危机时求助的意义系统首先是科学的世界观,其次是非马克思主义的人生哲学,再次是宗教,最后才是马克思主义哲学或在政治思想教育中获得的知识。北京市大学生的意义支持系统既有鲜明的世俗化倾向,也具有多元化倾向。在意义危机中求助于主流意识形态的人数少于求助于宗教的人数,这一事实表明宗教正在部分大学生中凸显其提供意义系统的核心功能,而任何意义系统若想增进自身的竞争力,首先需要强化其说服力。 展开更多
关键词 意义的匮乏 宗教兴趣取向 意义危机 世俗化 多元化
下载PDF
科学使用服务业数据 促进服务业健康发展——以生产性服务业数据为例
15
作者 吴翌琳 谷彬 《调研世界》 CSSCI 北大核心 2012年第1期45-47,共3页
"十二五"时期是我国服务业大发展的重要时期,国家"十二五"规划提出,要把推动服务业大发展作为产业结构优化升级的战略重点,营造有利于服务业发展的政策和体制环境。但现有服务业研究普遍存在数据使用的偏误,严重影... "十二五"时期是我国服务业大发展的重要时期,国家"十二五"规划提出,要把推动服务业大发展作为产业结构优化升级的战略重点,营造有利于服务业发展的政策和体制环境。但现有服务业研究普遍存在数据使用的偏误,严重影响研究结论的科学性和可信性。鉴于生产性服务业在推动我国产业结构升级与高端化中的重要作用,本文选取生产性服务业为研究范例,指出现有文献在数据选用方面存在的问题,并作出尝试性改进。 展开更多
关键词 核算体系转型 数据选用误区 生产性服务业
下载PDF
多核处理器下事务型数据库性能优化技术综述 被引量:11
16
作者 朱阅岸 周烜 +3 位作者 张延松 周明 牛嘉 王珊 《计算机学报》 EI CSCD 北大核心 2015年第9期1865-1879,共15页
传统数据库的设计假设磁盘为主要存储设备,其性能取决于基于I/O代价模型的优化.然而,当前数据库运行的平台已逐渐转移到由多核处理器、大内存和以闪存为代表的低延迟存储所构成的新型硬件平台上.在大多数情况下,工作数据集能够全部加载... 传统数据库的设计假设磁盘为主要存储设备,其性能取决于基于I/O代价模型的优化.然而,当前数据库运行的平台已逐渐转移到由多核处理器、大内存和以闪存为代表的低延迟存储所构成的新型硬件平台上.在大多数情况下,工作数据集能够全部加载到内存或者闪存等高速存储器中.这样,数据库的性能瓶颈由传统的I/O转移到CPU上.而传统数据库的加锁操作、闩锁竞争、日志管理以及缓冲区管理在设计时均未考虑到多核处理器的使用,因而成为了限制CPU利用率的明显瓶颈.改变传统数据库的优化重点以适应硬件的发展对应用而言是十分必要的.该文针对当前新的应用背景,主要围绕数据库系统中锁管理、日志管理、缓冲区管理以及B树索引等核心模块在多核平台下已有的优化技术进行详细介绍和归纳总结.同时介绍了中国人民大学在数据库系统的多核处理器优化方面所做的一些工作. 展开更多
关键词 数据库系统优化 日志 缓冲区管理 B树
下载PDF
中国地区间义务教育公用经费价格建模研究
17
作者 付尧 陶涛 《中国人民大学教育学刊》 2011年第3期155-164,共10页
义务教育公用部分是维持学校正常运作不可或缺的部分,除公用部分资源投入在地区间的差异外,资源的价格差异也会引起公用经费支出的差异。通过构造公用经费价格指数,从公用经费支出差异中剥离价格差异的影响,才能揭示公用部分资源在地区... 义务教育公用部分是维持学校正常运作不可或缺的部分,除公用部分资源投入在地区间的差异外,资源的价格差异也会引起公用经费支出的差异。通过构造公用经费价格指数,从公用经费支出差异中剥离价格差异的影响,才能揭示公用部分资源在地区间的配置状况。本文借鉴购买力平价的理论框架,给出了中国地区间义务教育公用经费价格指数的构造方法。 展开更多
关键词 义务教育 公用经费 价格指数
下载PDF
面向多核CPU和GPU平台的数据库星形连接优化 被引量:3
18
作者 刘专 韩瑞琛 +2 位作者 张延松 陈跃国 张宇 《计算机应用》 CSCD 北大核心 2021年第3期611-617,共7页
针对联机分析处理(OLAP)中事实表与多个维表之间的星形连接执行代价较高的问题,提出了一种在先进的多核中央处理器(CPU)和图形处理器(GPU)上的星形连接优化方法。首先,对于多核CPU和GPU平台的星形连接中的物化代价问题,提出了基于向量... 针对联机分析处理(OLAP)中事实表与多个维表之间的星形连接执行代价较高的问题,提出了一种在先进的多核中央处理器(CPU)和图形处理器(GPU)上的星形连接优化方法。首先,对于多核CPU和GPU平台的星形连接中的物化代价问题,提出了基于向量索引的CPU和GPU平台上的向量化星形连接算法;然后,通过面向CPU cache和GPU shared memory大小的向量划分来提出基于向量粒度的星形连接操作,从而优化星形连接中向量索引的物化代价;最后,提出了基于压缩向量的星形连接算法,将定长向量索引压缩为变长的二元向量索引,从而在低选择率时提高cache内向量索引的存储访问效率。实验结果表明,在CPU平台上向量化星形连接算法相对于常规的行式或列式连接性能提升了40%以上,在GPU平台上向量化星形连接算法相对于常规星形连接算法性能提升超过了15%;与当前主流的内存数据库和GPU数据库相比,优化的星形连接算法性能相对于最优内存数据库Hyper性能提升了130%,相对于最优的GPU数据库OmniSci性能提升了80%。可见基于向量索引的向量化星形连接优化技术有效地提高了多表连接性能,与传统优化技术相比,基于向量索引的向量化处理提高了较小cache上的数据存储访问效率,压缩向量进一步提升了向量索引在cache内的访问效率。 展开更多
关键词 联机分析处理 星形连接 向量化查询处理 向量压缩技术 异构计算
下载PDF
构建新型高性能与高可用的键值数据库系统 被引量:4
19
作者 朱阅岸 简怀兵 +5 位作者 龙永超 李彬 王树 吴喜亮 钟治初 张延松 《软件学报》 EI CSCD 北大核心 2021年第10期3203-3218,共16页
近年来,写密集型应用程序越来越普遍.如何有效地处理这种工作负载,是数据库系统领域深入研究的方向之一.写操作开销主要由以下两个方面的因素构成:(1)硬件级别,即写操作引起的I/O,目前无法在短时间内消除这种开销;(2)软件开销,即修改内... 近年来,写密集型应用程序越来越普遍.如何有效地处理这种工作负载,是数据库系统领域深入研究的方向之一.写操作开销主要由以下两个方面的因素构成:(1)硬件级别,即写操作引起的I/O,目前无法在短时间内消除这种开销;(2)软件开销,即修改内存数据拷贝以及构造日志记录造成的多次写操作.日志即数据(log-as-database,称其为单拷贝系统)的架构能够减少写操作引起的I/O,同时降低软件方面的开销.目前,业界对单拷贝系统展现出浓厚的兴趣.现有的单拷贝系统大部分建立在特殊的基础设施之上,例如infiniband或NVRam(非易失性随机存取存储器),这种基础设施尚未达到广泛可用或者是依托他系统(例如Dynamo)构建,这种方法缺乏灵活性与普适性.在商用机器环境中,自底向上构建了一个称为LogStore的键值数据库系统,采用log-as-database设计理念,以充分利用单拷贝系统的优点,在提升写操作性能的同时,有效缩短主备数据之间的差距.在系统中内嵌复制协议达到高可用性而不是依赖其他系统,使得系统灵活可控.系统新颖的查询执行模型将执行线程与特定分片绑定,结合多版本并发控制技术,以无锁的方式消除读写冲突、写写冲突以及上下文切换开销.用YCSB对系统性能进行了详细的评估,对比主流的键值系统HBase以及单拷贝系统实现LogBase,LogStore在写密集型工作负载上性能要优4倍左右.在崩溃恢复方面,LogStore可在1分钟之内完成TB级别数据规模的恢复,比LogBase要快1个数量级以上. 展开更多
关键词 单拷贝系统 复制协议 写优化 恢复 细粒度缓冲区管理
下载PDF
诈骗与信任的社会机制分析——以中国台湾跨境电信诈骗现象为例 被引量:18
20
作者 唐丽娜 王记文 《学术论坛》 CSSCI 北大核心 2016年第5期97-103,共7页
文章使用2012年东亚社会调查(EASS)数据,对中国大陆、日本、韩国和中国台湾民众的社会信任度进行对比,发现中国大陆、日本、韩国以及中国台湾民众对熟人的信任度差距较小,而对公共权威的信任存在较大差异,这说明了针对中国大陆的中国台... 文章使用2012年东亚社会调查(EASS)数据,对中国大陆、日本、韩国和中国台湾民众的社会信任度进行对比,发现中国大陆、日本、韩国以及中国台湾民众对熟人的信任度差距较小,而对公共权威的信任存在较大差异,这说明了针对中国大陆的中国台湾跨境电信诈骗现象的发生机制不是基于居民对熟人的信任,而是基于居民对权威部门的信任,即中国大陆民众对公共权威部门具有较高的信任度,因而更容易陷入诈骗集团的圈套;同时,中国台湾民众对公共权威部门的信任度较低,加之中国台湾公共权威部门对电信诈骗惩治力度不够,致使中国台湾籍电信骗子泛滥。因此政府应为居民提供足够的保护,两岸携手共同打击跨境电信诈骗。 展开更多
关键词 电信诈骗 社会信任 东亚社会 公共权威部门
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部