期刊文献+
共找到173篇文章
< 1 2 9 >
每页显示 20 50 100
初中生课外补习的影响因素研究——基于CEPS的调查数据分析 被引量:23
1
作者 吴翌琳 《教育科学》 CSSCI 北大核心 2016年第5期63-73,共11页
课外补习由于依附于主流教育,因此被称为影子教育(shadow education)。本文通过对全国112所初中进行抽样调查,对现阶段我国初中生课外补习的规模、强度、支出及其影响因素进行了分析与探讨。研究显示:参加课外补习的学生规模庞大。九年... 课外补习由于依附于主流教育,因此被称为影子教育(shadow education)。本文通过对全国112所初中进行抽样调查,对现阶段我国初中生课外补习的规模、强度、支出及其影响因素进行了分析与探讨。研究显示:参加课外补习的学生规模庞大。九年级比七年级课外补习的强度更大。课外补习支出与家庭经济水平呈正比例关系。女性比男性的补习参与几率、强度与支出都高。成绩排名越高,父亲受教育程度越高,学生参加补习的几率、强度与支出越大。 展开更多
关键词 课外补习 补习强度 LOGISTIC回归
下载PDF
创业绩效及其影响因素研究--基于创业调查数据的微观实证 被引量:4
2
作者 吴翌琳 赵舒羽 《调研世界》 CSSCI 北大核心 2017年第11期19-26,共8页
本文基于北京、上海、广州、深圳等21个城市的创业企业和创业者的调查数据,利用多元线性回归、广义可加模型(GAM)、回归样条和多项式回归等多种模型,从个人特征、创业过程和创业环境三方面探究创业绩效的影响因素。研究发现,公司成立年... 本文基于北京、上海、广州、深圳等21个城市的创业企业和创业者的调查数据,利用多元线性回归、广义可加模型(GAM)、回归样条和多项式回归等多种模型,从个人特征、创业过程和创业环境三方面探究创业绩效的影响因素。研究发现,公司成立年限、注册资金规模和地区公共服务水平是对创业绩效影响较为突出的显著变量,此外创业者的受教育程度、户口情况、性别、创业企业类型等因素也对创业绩效产生显著影响。基于实证发现,本文提出加大政府支持力度、提高公共服务质量、加强对农民的创业扶持等措施,以提高广大创业企业的创业绩效。 展开更多
关键词 创业绩效 创业环境 企业利润 资本利润率
下载PDF
资本下乡初期村庄获得发展性投资的影响因素研究——对2000年前后村庄抽样调查数据的再分析 被引量:2
3
作者 李丁 《中国农业大学学报(社会科学版)》 CSSCI 北大核心 2021年第3期43-54,共12页
本文使用2003年中国科学院“农村贫困与发展”项目社会经济调查数据,对1998—2003年被调查村庄吸收外来发展性投资的情况进行了概要描述,并对农村社区是否成功引进发展投资的决定因素进行了初步分析。结果表明,21世纪初期,农村发展性投... 本文使用2003年中国科学院“农村贫困与发展”项目社会经济调查数据,对1998—2003年被调查村庄吸收外来发展性投资的情况进行了概要描述,并对农村社区是否成功引进发展投资的决定因素进行了初步分析。结果表明,21世纪初期,农村发展性投资主要来自政府部门及农村信用社等金融机构,投资具有扶贫性质;基础投资环境(人口条件、土地条件、交通条件、经济发展水平)对吸引外来投资的作用有限,甚至为负;村庄社会政治资源是影响发展型投资获得的重要因素,村庄是否出过县级及以上政府官员、是否有农民专业组织、基层治理环境等对农村是否获得发展投资作用巨大。总结而言,相对于自然环境,社会环境有着更大的影响。在政府主导资本下乡的阶段,这一运作逻辑有利于落后地区获得发展资金,但可能由于对投资环境的考量不足、行政权力与人情关系的渗透使得农村发展投资效率低下,这也制约了农村发展项目的可持续发展,扩大了地区内部不同村庄间的分化。这些关键因素和机制在民间资本逐渐成为下乡资本主体的今天仍然会产生重大影响,值得进一步跟进和研究。 展开更多
关键词 发展性投资 资本下乡 营商环境 社会资本
下载PDF
一种基于管算存分离的内存数据库实现技术
4
作者 张延松 韩瑞琛 +1 位作者 刘专 张宇 《计算机学报》 EI CAS CSCD 北大核心 2023年第4期761-779,共19页
在多核处理器、大内存、非易失内存等新硬件技术的支持下,异构存储与计算平台成为主流的高性能计算平台.传统的数据库引擎采用一体化设计,新兴数据库则采用存算分离和算子下推技术以更好适应新型分布式存储架构.提出了一种新颖的基于管... 在多核处理器、大内存、非易失内存等新硬件技术的支持下,异构存储与计算平台成为主流的高性能计算平台.传统的数据库引擎采用一体化设计,新兴数据库则采用存算分离和算子下推技术以更好适应新型分布式存储架构.提出了一种新颖的基于管算存分离方法的内存数据库实现技术,在存算分离技术的基础上进一步根据数据库模式、数据分布与负载计算特征将数据集划分为元数据集和数值集,将统一的查询引擎分解为元数据管理引擎、计算引擎和存储引擎,将包含语义信息的元数据管理抽象为独立的管理层,将无语义的数值存储和计算抽象为计算存储层,其中计算密集型负载定义为计算层,数据密集型负载设计为存储层,并根据硬件平台的不同分离或合并计算与存储层.内存数据库的实现技术分为几个层次:1)模式优化,实现数据库存储中“数(数值)”与“据(元数据)”的分离,根据数据的内在特性选择不同的存储与计算策略;2)模型优化,采用Fusion OLAP模型,实现在关系存储模型上的高性能多维计算;3)算法优化,通过代理键索引、向量索引支持优化的向量连接、向量聚集算法,提高OLAP性能;4)系统设计优化,通过数据库引擎分层技术实现管理与计算分离、存储与计算分离以及多维计算算子下推到存储层.实验结果表明,管算存分离计算模型可以灵活地支持CPU-GPU异构计算平台、DRAM-PM(Persistent Memory,持久内存)异构存储平台和外部存储平台,采用开源的Arrow内存列存储引擎作为数据库“数”的存储引擎,以及应用多维计算算子下推到Arrow存储引擎技术的OLAP实现技术在SSB基准测试中与存算结合的内存OLAP实现技术性能相当,查询性能优于主流内存数据库Hyper和OmniSciDB,以及基于Arrow存储的GPU数据库PG-Strom. 展开更多
关键词 内存数据库 数据分离 存算分离 管算分离 向量索引
下载PDF
企业家精神对创新影响的均衡性与差异性研究——基于创新调查与财务数据对接的微观证据 被引量:4
5
作者 吴翌琳 《财经问题研究》 CSSCI 北大核心 2019年第4期113-121,共9页
企业家是市场经济中的"关键少数"和特殊人才,是推进创新驱动发展战略的重要力量。本文构建CDM协同创新系统模型,基于创新调查与企业财务数据对接,考察企业家精神对于不同创新活动的系统影响。研究发现,创新受到企业家的普遍重... 企业家是市场经济中的"关键少数"和特殊人才,是推进创新驱动发展战略的重要力量。本文构建CDM协同创新系统模型,基于创新调查与企业财务数据对接,考察企业家精神对于不同创新活动的系统影响。研究发现,创新受到企业家的普遍重视,创新方式趋于多元化,以实现技术创新与非技术创新的优化组合,其中,企业家创新精神促进技术创新与非技术创新的均衡发展,而企业家教育背景及对创新重视程度对创新的影响具有结构性和差异性;企业家创新决策面临人才支撑不协同、知识产权保护不够和创新政策普惠性低等一系列问题制约,抑制了企业家创新精神的实现。 展开更多
关键词 企业家创新精神 协同创新系统 CDM模型
下载PDF
文化遗产领域科学数据复用影响因素研究
6
作者 饶梓欣 许鑫 《信息资源管理学报》 2023年第5期32-43,共12页
探究文化遗产领域科学数据复用的主要影响因素能够为文化遗产领域数据有效利用和管理提供参考。以DataCite中被复用的203个文化遗产科学数据集为研究对象,采用非参数检验、多元线性回归等方法,从数据自身属性、数据提供方、数据仓储三... 探究文化遗产领域科学数据复用的主要影响因素能够为文化遗产领域数据有效利用和管理提供参考。以DataCite中被复用的203个文化遗产科学数据集为研究对象,采用非参数检验、多元线性回归等方法,从数据自身属性、数据提供方、数据仓储三个维度,对文化遗产领域科学数据复用影响因素进行分析。研究发现,在控制时间跨度因素后,许可、类型、摘要长度、格式、出版商、资助方、质量管理是影响文化遗产领域科学数据复用的主要因素,具有正面影响,且影响程度依次递增。结合我国实际情况提出如下建议与启示:建立文化遗产元数据标准,提高数据描述信息的充分性;将数据复用纳入资助要求,推动文化遗产项目数据复用;构建文化遗产科学数据出版体系,完善数据出版中的同行评议;促进文化遗产数据质量管理,充分发挥数据仓储的作用。 展开更多
关键词 数据复用 文化遗产 科学数据 数据质量管理 影响因素
下载PDF
基于链接预测的技术机会识别研究——以隐私保护领域专利数据为例
7
作者 许鑫 李倩 +1 位作者 衣春波 樊亚鑫 《图书馆杂志》 北大核心 2023年第9期103-112,128,共11页
科技竞争时代,技术机会的识别和挖掘为科技研发方针和政策的制定奠定重要基础。本文提出基于链接预测的量化方法,将技术机会识别任务转化为技术元素之间是否能产生共现联系的二分类问题,为技术机会识别提供详细的数据辅助和支撑。获取... 科技竞争时代,技术机会的识别和挖掘为科技研发方针和政策的制定奠定重要基础。本文提出基于链接预测的量化方法,将技术机会识别任务转化为技术元素之间是否能产生共现联系的二分类问题,为技术机会识别提供详细的数据辅助和支撑。获取隐私保护领域的专利数据,构建IPC共现网络并训练图神经网络模型GraphSAGE,得到链接预测分数后分别从强化型、新生型和衰退型链接3个角度识别持续发展的技术机会、突破创新的技术机会以及寻求转型的技术机会,最后基于识别得到的技术机会展开分析并提出建议。 展开更多
关键词 技术机会识别 链接预测 隐私保护 图神经网络
下载PDF
海量数据分析的One-size-fits-all OLAP技术 被引量:30
8
作者 张延松 焦敏 +2 位作者 王占伟 王珊 周烜 《计算机学报》 EI CSCD 北大核心 2011年第10期1936-1946,共11页
传统的OLAP被迅速膨胀的海量数据推动进入了大规模数据分析时代,其主要特点是存储密度大,计算强度大,需要大规模并行存储和处理能力.无论是传统的并行数据库技术还是热点的MapReduce技术都不得不面对海量数据在大规模并行处理环境下的... 传统的OLAP被迅速膨胀的海量数据推动进入了大规模数据分析时代,其主要特点是存储密度大,计算强度大,需要大规模并行存储和处理能力.无论是传统的并行数据库技术还是热点的MapReduce技术都不得不面对海量数据在大规模并行处理环境下的性能和并行处理效率的问题.以星型模型上复杂多表连接为基础的OLAP算法的复杂度和并行处理过程中的数据网络传输代价都成为制约性能的重要因素.通过深入分析OLAP存储模型和查询负载特征,提出了对OLAP查询中最基础的SPJGA-OLAP子集在存储、查询处理、数据分布、网络传输和分布式缓存等方面面向海量数据大规模并行处理框架的优化策略和实现技术.通过对TPC-H和SSB两个工业界和学术界公认的测试标准的分析,评估了技术的可行性.提出了以内存predicate-vector DDTA-JOIN算法为核心的并行内存OLAP架构,以维表上规范化的谓词向量操作替代了多样的连接执行计划,实现以一种查询处理模型同时满足集中式处理和大规模并行OLAP处理的需求,充分利用现代计算机的硬件优势,最小化网络传输和OLAP查询处理代价.实验中分析了在1TB和100TB数据集中数据分布策略的存储代价和传输代价,通过并行OLAP代价模型和实际数据的实验测试验证了技术的可行性和并行处理效率. 展开更多
关键词 OLAP 海量数据分析处理 谓词向量 星型模型
下载PDF
大数据时代的统计教育 被引量:84
9
作者 孟生旺 袁卫 《统计研究》 CSSCI 北大核心 2015年第4期3-7,共5页
2014年11月,美国统计学会适应大数据时代的要求,发布了统计学本科专业指导性教学纲要。而在2013年,我国统计类本科专业刚刚进行了一次较大调整,目前的专业课程设置和教学内容改革还处于探索阶段。美国统计学会发布的这份指导性教学纲要... 2014年11月,美国统计学会适应大数据时代的要求,发布了统计学本科专业指导性教学纲要。而在2013年,我国统计类本科专业刚刚进行了一次较大调整,目前的专业课程设置和教学内容改革还处于探索阶段。美国统计学会发布的这份指导性教学纲要对于推进我国统计类本科专业教育改革具有重要借鉴意义。本文首先概括性地介绍了美国统计学会发布的统计学本科专业指导性教学纲要的核心内容,包括统计专业本科生应该掌握的基本技能和应该修读的主要课程,然后分析了我国统计类本科专业教育存在的问题,并提出了在大数据时代改进我国统计类本科专业教育的几点建议。 展开更多
关键词 统计教育 大数据 课程体系 本科专业
下载PDF
中国人群健康相关生命质量概念框架构建:基于一般人群与疾病患者的质性研究
10
作者 陈丕楠 贺小宁 +3 位作者 谢诗桐 吴晶 赵琨 谢锋 《中国卫生政策研究》 CSCD 北大核心 2024年第6期1-9,共9页
目的:探索中国人群对于健康相关生命质量(Health-related quality of life,HRQoL)定义的理解,构建中国人群HRQoL概念框架,用于指导中国人群HRQoL测量工具研发。方法:从全国31个省市招募中国一般人群与疾病患者样本,通过开展一对一半结... 目的:探索中国人群对于健康相关生命质量(Health-related quality of life,HRQoL)定义的理解,构建中国人群HRQoL概念框架,用于指导中国人群HRQoL测量工具研发。方法:从全国31个省市招募中国一般人群与疾病患者样本,通过开展一对一半结构化质性访谈收集其对HRQoL的看法与理解。基于扎根理论对质性信息进行多层次编码,利用框架法对编码进行梳理、归纳,构建中国HRQoL概念框架。结果:共纳入68名受访者,研究从质性信息中提取1558个一级编码,分析整理为180个二级编码、31个三级编码,最终归纳出6个主题的中国人群HRQoL概念框架。结论:基于中国人群健康观念构建的HRQoL概念框架包含症状、身体功能、情绪、认知、活动、社会功能6个主题,其中尤以胃口/食欲、睡眠和疲乏维度显示出HRQoL概念的中国文化特异性。 展开更多
关键词 健康相关生命质量 概念框架 中国人群 质性研究
下载PDF
大学生积极心理资本与就业压力关系调查分析 被引量:19
11
作者 武传伟 吴翌琳 《调研世界》 CSSCI 2018年第12期19-22,共4页
大学生的综合素质培养和就业问题是社会普遍关注的话题,国家对大学生就业问题同样是高度重视。近年来,大学生就业问题变得越来越复杂,就业压力也随之增加。本文通过问卷调查的方式,对大学生积极心理资本与就业压力关系进行了分析,研究发... 大学生的综合素质培养和就业问题是社会普遍关注的话题,国家对大学生就业问题同样是高度重视。近年来,大学生就业问题变得越来越复杂,就业压力也随之增加。本文通过问卷调查的方式,对大学生积极心理资本与就业压力关系进行了分析,研究发现,积极心理资本是影响大学生就业的一个重要因素,对提高大学生的就业技能、增加就业机会、缓解大学生就业压力具有积极作用。本研究对高校人才培养和大学生就业教育的开展具有重要的实践指导价值。 展开更多
关键词 大学生 积极心理资本 就业压力
下载PDF
内存数据仓库集群技术研究 被引量:2
12
作者 张延松 王珊 周烜 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第5期117-132,共16页
随着硬件的集成度不断提高,多核处理器和大内存成为当前主流的计算平台,内存计算也成为新兴的高性能数据分析平台.内存数据仓库集群技术面向高性能分析计算,是实现大数据实时分析的基础平台.本文概括地介绍了中国人民大学高性能数据库... 随着硬件的集成度不断提高,多核处理器和大内存成为当前主流的计算平台,内存计算也成为新兴的高性能数据分析平台.内存数据仓库集群技术面向高性能分析计算,是实现大数据实时分析的基础平台.本文概括地介绍了中国人民大学高性能数据库团队在内存数据仓库集群技术方面的研究工作,包括:以列分布和列计算服务为中心的ScaMMDB内存数据仓库集群,以水平分片、并行计算为中心的ScaMMDBⅡ和reverse-star schema分布、集群向量计算为特征的MiNT-OLAP Cluster等技术的研究发展过程.分析了内存数据仓库集群技术的关键问题及技术挑战,并针对新的内存数据仓库集群应用需求展望未来技术的发展. 展开更多
关键词 内存数据仓库 集群 向量计算
下载PDF
内存数据库可控的page-color优化技术研究 被引量:1
13
作者 张延松 王占伟 +1 位作者 孙妍 王珊 《计算机研究与发展》 EI CSCD 北大核心 2011年第S3期95-104,共10页
page-color的研究集中在如何通过有效的cache分区技术隔离弱局部性数据与强局部性数据的访问冲突,减少数据处理过程中由弱局部性数据产生的cache污染对强局部性数据的影响.但这些优化技术依赖于特殊的处理器硬件设计、操作系统内核功能... page-color的研究集中在如何通过有效的cache分区技术隔离弱局部性数据与强局部性数据的访问冲突,减少数据处理过程中由弱局部性数据产生的cache污染对强局部性数据的影响.但这些优化技术依赖于特殊的处理器硬件设计、操作系统内核功能的扩展或同时依赖于硬件的特殊设计和操作系统扩展功能的支持.提出了应用软件层上基于page-color的W-order扫描优化技术,不依赖特殊的处理器硬件设计,最小化依赖操作系统的扩展功能.研究的核心思想是通过page-color控制弱局部性数据的页面地址访问顺序,将弱局部性数据与强局部性数据在cache中的冲突域由整个地址空间缩小为指定page-color的地址空间内,从而降低整体的cachemiss,降低数据处理时的延迟.与典型的page-coloring技术相比,不需要扩展操作系统内核功能,具有更好的内存地址空间利用率,能够实现查询内数据集粒度上的cache分区优化.实验中模拟了内存数据库中典型的多表连接算法,通过模拟cache行为模式和在实际查询处理时使用cache监测工具验证了W-order区优化技术的可行性与cache性能.实验结果表明,通过在应用软件层次上对顺序访问操作的控制,能够有效地降低cachemiss,提高内存数据库查询处理性能. 展开更多
关键词 内存数据库 cache污染 page-color W-order扫描
下载PDF
互联网企业广告收入预测研究——基于低频数据的神经网络和时间序列组合模型 被引量:6
14
作者 吴翌琳 南金伶 《统计研究》 CSSCI 北大核心 2020年第5期94-103,共10页
神经网络模型对大样本时间序列的拟合效果优于传统时间序列模型,但对于年度、月度、日度等低频时间序列的预测则难以发挥其优势。鉴于此,本文应用传统时间序列模型和神经网络模型,建立Holtwinters-BP组合模型,利用Holtwinters模型分别... 神经网络模型对大样本时间序列的拟合效果优于传统时间序列模型,但对于年度、月度、日度等低频时间序列的预测则难以发挥其优势。鉴于此,本文应用传统时间序列模型和神经网络模型,建立Holtwinters-BP组合模型,利用Holtwinters模型分别拟合各解释变量序列,利用BP模型拟合解释变量和自变量的非线性关系,基于某社交新闻类APP的日广告收入数据进行互联网企业广告收入预测研究。通过与循环神经网络(RNN)模型、长短期记忆神经网络(LSTM)模型等预测结果的对比发现:Holtwinters-BP组合模型的预测精度和稳定性更高;证明多维变量对于广告收入的显著影响,多变量模型的预测准确性高于单变量模型;构建的Holtwinters-BP组合模型对于低频数据预测有较好的有效性和适用性。 展开更多
关键词 广告收入预测 神经网络模型 Holtwinters模型 组合模型
下载PDF
“数据治国”的三个关键理念--从互联网思维到未来治理图景 被引量:6
15
作者 杜小勇 冯启娜 《学术前沿》 CSSCI 2015年第2期49-61,共13页
大数据因其规模巨大、类型复杂、产生速度快、价值密度低等特点,对现有信息技术构成巨大挑战。运用新理念、新技术、新方法对大数据进行全生命周期的创新管理和应用,是推动国民经济转型和社会管理创新的重要契机,也是提升国家综合竞争... 大数据因其规模巨大、类型复杂、产生速度快、价值密度低等特点,对现有信息技术构成巨大挑战。运用新理念、新技术、新方法对大数据进行全生命周期的创新管理和应用,是推动国民经济转型和社会管理创新的重要契机,也是提升国家综合竞争力的重要趋势。支撑这场大数据革命的底层力量,不仅仅是技术革命,更是涉及领导意识、组织文化和行为方式的思维革命。在国家治理层面,尤其需要形成"数据治国"的治理理念,掌握用数据思考和解决社会问题的新方法,最重要的是树立数据思维、互联网思维和计算思维这三种思维方式。 展开更多
关键词 治理现代化 数据治国 计算思维 技术革命
下载PDF
科学使用服务业数据 促进服务业健康发展——以生产性服务业数据为例
16
作者 吴翌琳 谷彬 《调研世界》 CSSCI 北大核心 2012年第1期45-47,共3页
"十二五"时期是我国服务业大发展的重要时期,国家"十二五"规划提出,要把推动服务业大发展作为产业结构优化升级的战略重点,营造有利于服务业发展的政策和体制环境。但现有服务业研究普遍存在数据使用的偏误,严重影... "十二五"时期是我国服务业大发展的重要时期,国家"十二五"规划提出,要把推动服务业大发展作为产业结构优化升级的战略重点,营造有利于服务业发展的政策和体制环境。但现有服务业研究普遍存在数据使用的偏误,严重影响研究结论的科学性和可信性。鉴于生产性服务业在推动我国产业结构升级与高端化中的重要作用,本文选取生产性服务业为研究范例,指出现有文献在数据选用方面存在的问题,并作出尝试性改进。 展开更多
关键词 核算体系转型 数据选用误区 生产性服务业
下载PDF
多核处理器下事务型数据库性能优化技术综述 被引量:11
17
作者 朱阅岸 周烜 +3 位作者 张延松 周明 牛嘉 王珊 《计算机学报》 EI CSCD 北大核心 2015年第9期1865-1879,共15页
传统数据库的设计假设磁盘为主要存储设备,其性能取决于基于I/O代价模型的优化.然而,当前数据库运行的平台已逐渐转移到由多核处理器、大内存和以闪存为代表的低延迟存储所构成的新型硬件平台上.在大多数情况下,工作数据集能够全部加载... 传统数据库的设计假设磁盘为主要存储设备,其性能取决于基于I/O代价模型的优化.然而,当前数据库运行的平台已逐渐转移到由多核处理器、大内存和以闪存为代表的低延迟存储所构成的新型硬件平台上.在大多数情况下,工作数据集能够全部加载到内存或者闪存等高速存储器中.这样,数据库的性能瓶颈由传统的I/O转移到CPU上.而传统数据库的加锁操作、闩锁竞争、日志管理以及缓冲区管理在设计时均未考虑到多核处理器的使用,因而成为了限制CPU利用率的明显瓶颈.改变传统数据库的优化重点以适应硬件的发展对应用而言是十分必要的.该文针对当前新的应用背景,主要围绕数据库系统中锁管理、日志管理、缓冲区管理以及B树索引等核心模块在多核平台下已有的优化技术进行详细介绍和归纳总结.同时介绍了中国人民大学在数据库系统的多核处理器优化方面所做的一些工作. 展开更多
关键词 数据库系统优化 日志 缓冲区管理 B树
下载PDF
面向多核CPU和GPU平台的数据库星形连接优化 被引量:3
18
作者 刘专 韩瑞琛 +2 位作者 张延松 陈跃国 张宇 《计算机应用》 CSCD 北大核心 2021年第3期611-617,共7页
针对联机分析处理(OLAP)中事实表与多个维表之间的星形连接执行代价较高的问题,提出了一种在先进的多核中央处理器(CPU)和图形处理器(GPU)上的星形连接优化方法。首先,对于多核CPU和GPU平台的星形连接中的物化代价问题,提出了基于向量... 针对联机分析处理(OLAP)中事实表与多个维表之间的星形连接执行代价较高的问题,提出了一种在先进的多核中央处理器(CPU)和图形处理器(GPU)上的星形连接优化方法。首先,对于多核CPU和GPU平台的星形连接中的物化代价问题,提出了基于向量索引的CPU和GPU平台上的向量化星形连接算法;然后,通过面向CPU cache和GPU shared memory大小的向量划分来提出基于向量粒度的星形连接操作,从而优化星形连接中向量索引的物化代价;最后,提出了基于压缩向量的星形连接算法,将定长向量索引压缩为变长的二元向量索引,从而在低选择率时提高cache内向量索引的存储访问效率。实验结果表明,在CPU平台上向量化星形连接算法相对于常规的行式或列式连接性能提升了40%以上,在GPU平台上向量化星形连接算法相对于常规星形连接算法性能提升超过了15%;与当前主流的内存数据库和GPU数据库相比,优化的星形连接算法性能相对于最优内存数据库Hyper性能提升了130%,相对于最优的GPU数据库OmniSci性能提升了80%。可见基于向量索引的向量化星形连接优化技术有效地提高了多表连接性能,与传统优化技术相比,基于向量索引的向量化处理提高了较小cache上的数据存储访问效率,压缩向量进一步提升了向量索引在cache内的访问效率。 展开更多
关键词 联机分析处理 星形连接 向量化查询处理 向量压缩技术 异构计算
下载PDF
新冠肺炎疫情下城市居民数字化生存能力分析——基于上海的调查证据 被引量:7
19
作者 李倩 许鑫 《图书馆杂志》 CSSCI 北大核心 2020年第12期107-116,154,共11页
新冠疫情使得更多民众面临着数字化生存的机会和挑战,从这一角度出发,结合新型数字鸿沟理论,研究数字化生存能力的现状及影响因素,将有助于各方面协同发挥作用,帮助居民更灵活地运用数字技术和网络技能适应生活环境,提高数字化生存能力... 新冠疫情使得更多民众面临着数字化生存的机会和挑战,从这一角度出发,结合新型数字鸿沟理论,研究数字化生存能力的现状及影响因素,将有助于各方面协同发挥作用,帮助居民更灵活地运用数字技术和网络技能适应生活环境,提高数字化生存能力,满足其在数字化时代学习、工作和生活的需要。本研究发现,在上海这个网络基础设施完善的现代化城市,虽然信息通信设备接入方面的鸿沟渐渐消弭,但依然存在着数字不平等的多级阶梯,具体表现为数字化生存能力因个体特征和家庭特征等多方面因素而存在差异。基于此,提出加强数字化治理的同时兼顾数字教育,并鼓励青少年数字反哺等建议。 展开更多
关键词 数字化生存能力 数字鸿沟 新冠肺炎疫情
下载PDF
人文社科数据共享模型的设计与实现——以联盟链技术为例 被引量:34
20
作者 谷俊 许鑫 《情报学报》 CSSCI CSCD 北大核心 2019年第4期354-367,共14页
大数据环境下,人文社科领域的研究逐渐向以数据为驱动的新型研究模式转型,对数据共享的需求愈发明显。针对传统的人文社科数据共享存在的溯源能力较弱、数据用途无法追踪等问题,利用区块链的数据记录机制,选用Hyperledger Fabric区块链... 大数据环境下,人文社科领域的研究逐渐向以数据为驱动的新型研究模式转型,对数据共享的需求愈发明显。针对传统的人文社科数据共享存在的溯源能力较弱、数据用途无法追踪等问题,利用区块链的数据记录机制,选用Hyperledger Fabric区块链框架作为联盟链的基础,并对区块的数据存储方式进行了改写,通过CA认证、预提交、验证反馈、区块打包广播、账本数据库更新等流程的设计,构建了人文社科数据共享联盟链模型,并通过对Dataverse开源数据管理软件的二次开发,设计并实现了人文社科数据共享联盟平台。实践证明,基于区块链的人文社科数据共享模型,不仅可以在技术层面解决传统数据贡献中存在的问题,促进数据共享的发展,而且基于Hyperledger Fabric框架的联盟链机制运行效率也达到了预期的标准。 展开更多
关键词 数据共享 区块链 联盟链 超级账本
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部