期刊文献+
共找到280篇文章
< 1 2 14 >
每页显示 20 50 100
Intel Knights Corner的结点级内存访问优化 被引量:2
1
作者 林新华 李硕 +1 位作者 赵嘉明 松岗聪 《计算机科学》 CSCD 北大核心 2015年第11期37-42,共6页
传统编程优化(Traditional Programming Optimization,TPO)在Intel Knights Corner(KNC)上收效甚微,因此提出内存访问优化(Memory Access Optimization,MAO)。将MAO应用到已经过TPO的程序Diffusion 3D上,发现其性能仍然提高了39.1%。主... 传统编程优化(Traditional Programming Optimization,TPO)在Intel Knights Corner(KNC)上收效甚微,因此提出内存访问优化(Memory Access Optimization,MAO)。将MAO应用到已经过TPO的程序Diffusion 3D上,发现其性能仍然提高了39.1%。主要有2个贡献:1)提出MAO,认为TPO+MAO有助于在KNC上获取最优化性能;2)发现对于stencil代码,基于intrinsic的MAO比基于编译器的MAO更高效。这些发现对于在KNC上优化大规模应用有启发意义。 展开更多
关键词 传统编程优化 INTEL Knights CORNER 内存访问优化 最优化性能
下载PDF
从Intel的企业文化看其用人准则——访Intel中国区企业形象传播事业部公关经理刘婕女士
2
作者 吴晓桃 刘婕 《计算机教育》 2006年第6期65-67,共3页
记者:Intel的企业文化关键词是什么? 刘婕:Intel的企业文化很独特,她的关键词有很多。我在第一时间想到的关键词有下面几个。
关键词 INTEL 企业文化 企业形象 公关 事业 传播 中国
下载PDF
Intel^(■) Math Kernel Library PARDISO* forIntel^(■) Xeon Phi^(TM) Manycore Coprocessor
3
作者 Alexander Kalinkin Anton Anders Roman Anders 《Applied Mathematics》 2015年第8期1276-1281,共6页
The paper describes an efficient direct method to solve an equation Ax = b, where A is a sparse matrix, on the Intel&reg;Xeon PhiTM coprocessor. The main challenge for such a system is how to engage all available ... The paper describes an efficient direct method to solve an equation Ax = b, where A is a sparse matrix, on the Intel&reg;Xeon PhiTM coprocessor. The main challenge for such a system is how to engage all available threads (about 240) and how to reduce OpenMP* synchronization overhead, which is very expensive for hundreds of threads. The method consists of decomposing A into a product of lower-triangular, diagonal, and upper triangular matrices followed by solves of the resulting three subsystems. The main idea is based on the hybrid parallel algorithm used in the Intel&reg;Math Kernel Library Parallel Direct Sparse Solver for Clusters [1]. Our implementation exploits a static scheduling algorithm during the factorization step to reduce OpenMP synchronization overhead. To effectively engage all available threads, a three-level approach of parallelization is used. Furthermore, we demonstrate that our implementation can perform up to 100 times better on factorization step and up to 65 times better in terms of overall performance on the 240 threads of the Intel&reg;Xeon PhiTM coprocessor. 展开更多
关键词 Multifrontal Method Direct Method Sparse Linear System HPC OpenMP* Intel^(■) MKL Intel^(■) Xeon Phi^(TM) Coprocessor
下载PDF
利用Stencil建模及评估Intel IMCI vgather指令 被引量:1
4
作者 林新华 王一超 +3 位作者 秦强 李硕 文敏华 松岡聡 《计算机工程与科学》 CSCD 北大核心 2016年第9期1741-1747,共7页
Intel Xeon Phi协处理器的指令集IMCI引入了硬件实现的vgather指令,旨在帮助512位SIMD寄存器访问非连续内存地址上的数据。然而实验结果显示,vgather很有可能成为应用在Xeon Phi协处理器上关键的性能瓶颈之一。基于以上结论,针对vgathe... Intel Xeon Phi协处理器的指令集IMCI引入了硬件实现的vgather指令,旨在帮助512位SIMD寄存器访问非连续内存地址上的数据。然而实验结果显示,vgather很有可能成为应用在Xeon Phi协处理器上关键的性能瓶颈之一。基于以上结论,针对vgather的性能建模可以帮助用户深入地掌握和理解Xeon Phi协处理器的性能特性。在实验方法上,本文方法与现存的通过程序段内嵌入汇编代码进行数据统计不同,使用PAPI等性能分析工具直接收集硬件计数器的统计结果,作为模型的实验数据。本文的性能模型基于AGI事件次数和根据VPU_DATA_READ次数估算得出的vgather所导致的平均延迟构建而成。该模型能够对Xeon Phi应用代码中由vgather所导致的总延迟进行预测。最终,为了验证模型预测的准确性,将该模型应用在三维7点stencil应用代码上,预测结果显示,vgather耗时占计算总耗时的约40%。再将该结果与利用intrinsics指令去除vgather后的计算耗时进行了对比验证,结果显示模型预测准确。基于上述结论,采用硬件计数器的统计结果在Xeon Phi协处理器上针对vgather构建了性能模型。同时,通过与其他平台的vgather对比,认为该模型也可以应用在同样具备vgather的Intel CPU处理器平台上。 展开更多
关键词 性能建模 vgather XEON PHI 硬件计数器
下载PDF
使用Stencil评估Intel AVX2 Vgather指令
5
作者 林新华 秦强 +2 位作者 李硕 文敏华 松岗聪 《计算机科学》 CSCD 北大核心 2017年第1期20-24,共5页
为了更好地在向量化时读取离散的数据,Intel在Haswell CPU提供了AVX2vgather指令。由于Stencil在设置边界条件时使用了条件判断,因此编译器生成了vgather指令,并降低了Stencil在Haswell上的性能。提出使用peel优化或intrinsic load的方... 为了更好地在向量化时读取离散的数据,Intel在Haswell CPU提供了AVX2vgather指令。由于Stencil在设置边界条件时使用了条件判断,因此编译器生成了vgather指令,并降低了Stencil在Haswell上的性能。提出使用peel优化或intrinsic load的方法来避免vgather指令的生成,并把该方法应用到3个Stencil基准算例、长程Stencil程序3DFD以及混合Stencil应用3DEW上。这些Stencil在Haswell上的性能都获得了1.22X至3.88X不等的提升。通过研究指令的实现,发现vgather指令会被解码成多个微操作(μops),并为每个要读入的元素生成一个μops。由于vgather指令解码时会产生较高的开销,导致vgather指令成为Stencil在Haswell上的性能瓶颈。了解AVX2 vgather指令的实现以及掌握避免生成vgather指令的优化方法,对在Haswell上调优具有良好空间局部性应用的性能有一定的参考价值。 展开更多
关键词 AVX2 vgather指令 STENCIL 性能评估
下载PDF
Schur Complement Computations in Intel^(■) Math Kernel Library PARDISO 被引量:2
6
作者 Alexander Kalinkin Anton Anders Roman Anders 《Applied Mathematics》 2015年第2期304-311,共8页
This paper describes a method of calculating the Schur complement of a sparse positive definite matrix A. The main idea of this approach is to represent matrix A in the form of an elimination tree using a reordering a... This paper describes a method of calculating the Schur complement of a sparse positive definite matrix A. The main idea of this approach is to represent matrix A in the form of an elimination tree using a reordering algorithm like METIS and putting columns/rows for which the Schur complement is needed into the top node of the elimination tree. Any problem with a degenerate part of the initial matrix can be resolved with the help of iterative refinement. The proposed approach is close to the “multifrontal” one which was implemented by Ian Duff and others in 1980s. Schur complement computations described in this paper are available in Intel&reg;Math Kernel Library (Intel&reg;MKL). In this paper we present the algorithm for Schur complement computations, experiments that demonstrate a negligible increase in the number of elements in the factored matrix, and comparison with existing alternatives. 展开更多
关键词 Multifrontal Method Direct Method Sparse Linear System Schur Complement HPC Intel^(■) MKL
下载PDF
Intelligent Server Management Framework over Extensible Messaging and Presence Protocol
7
作者 斯佩峰 宋川 周翔 《China Communications》 SCIE CSCD 2013年第5期128-136,共9页
With the increasing importance of cloud services worldwide, the cloud infrastructure and platform management has become critical for cloud service providers. In this paper, a novel architecture of intelligent server m... With the increasing importance of cloud services worldwide, the cloud infrastructure and platform management has become critical for cloud service providers. In this paper, a novel architecture of intelligent server management framework is proposed. In this framework, the communication layer is based on the Extensible Messaging and Presence Protocol (XMPP), which was developed for instant messaging and has been proven to be highly mature and suitable for mobile and large scalable deployment due to its extensibility and efficiency. The proposed architecture can simplify server management and increase flexibility and scalability when managing hundreds of thousands of servers in the cloud era. 展开更多
关键词 cloud computing server management XMPP federation mobile push intelligent
下载PDF
Intel移动运算争锋
8
《电子与电脑》 2010年第1期30-32,共3页
英特尔公司2009年在32nm与22nm先进制程技术上有良好的进展,持续展现摩尔定律(Moore’s Law)的重要性。英特尔对于创新的坚定承诺将协助带动整个运算和通信产业的进一步增长,特别是在移动运算和无线领域。
关键词 INTEL 运算 移动 英特尔公司 制程技术 摩尔定律 通信产业
下载PDF
Intel建造金融生态系统
9
作者 宁卓人 《中国计算机用户》 2002年第34期45-45,共1页
Intel公司认为,金融行业始终在信息化建设中占有主导地位。由于历史的原因,许多金融行业的企业都选择了非开放性的垂直解决方案。而这些系统。
关键词 Intel公司 银行业 金融生态系统 信息化建设 服务器
下载PDF
Intel Bensley平台下前端总线竞争对访存密集型程序的性能影响分析 被引量:1
10
作者 毛晓炜 陶先平 何万青 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第2期149-158,共10页
对称多处理(symmetric multiprocessor,SMP)机群系统因其优越的性价比和良好的可扩展性,已经成为当今高性能计算的主流结构.其中,单节点采用Intel双路四核平台已经逐渐成为目前高性能计算服务器的主流平台.由于一个CPU的四个核心共享一... 对称多处理(symmetric multiprocessor,SMP)机群系统因其优越的性价比和良好的可扩展性,已经成为当今高性能计算的主流结构.其中,单节点采用Intel双路四核平台已经逐渐成为目前高性能计算服务器的主流平台.由于一个CPU的四个核心共享一根前端总线,而且两根前端总线并不完全独立,前端总线竞争对访存密集型程序的性能有很大的影响.本文针对Intel Bensley双路四核平台特性,给出了前端总线竞争对访存密集型message passing interface(MPI)程序性能影响的计算模型,并编写程序和利用实例验证的该计算模型的有效性. 展开更多
关键词 访存密集型应用 BENSLEY 前端总线 地址总线利用率 数据总线利用率
下载PDF
Protecting artificial intelligence IPs:a survey of watermarking and fingerprinting for machine learning 被引量:2
11
作者 Francesco Regazzoni Paolo Palmieri +2 位作者 Fethulah Smailbegovic Rosario Cammarota Ilia Polian 《CAAI Transactions on Intelligence Technology》 EI 2021年第2期180-191,共12页
Artificial intelligence(AI)algorithms achieve outstanding results in many applicationdomains such as computer vision and natural language processing The performance ofAl models is the outcome of complex and costly mod... Artificial intelligence(AI)algorithms achieve outstanding results in many applicationdomains such as computer vision and natural language processing The performance ofAl models is the outcome of complex and costly model architecture design and trainingprocesses.Hence,it is paramount for model owners to protect their AI models frompiracy-model cloning,illegitimate distribution and use.IP protection mechanisms havebeen applied to Al models,and in particular to deep neural networks,to verify themodel ownership.State-of-the-art AI model ownership protection techniques have beensurveyed.The pros and cons of Al model ownership protection have been reported.The majonity of previous works are focused on watermarking,while more advancedmethods such fingerprinting and attestation are promising but not yet explored indepth.This study has been concluded by discussing possible research directions in thearea. 展开更多
关键词 artificial COMPUTER NETWORKS
下载PDF
面向CFD应用的Intel持久内存性能评估
12
作者 文敏华 陈江 +3 位作者 胡广超 韦建文 王一超 林新华 《计算机工程与科学》 CSCD 北大核心 2022年第9期1550-1556,共7页
在科学计算领域,数据规模随着数值模拟精度要求的提高而快速增长,以DRAM为主存的传统方案由于成本高而难以扩展容量,近年来越来越被关注的持久内存技术有望解决这一问题。持久内存是在DRAM和SSD之间的补充,相比DRAM,持久内存具有容量大... 在科学计算领域,数据规模随着数值模拟精度要求的提高而快速增长,以DRAM为主存的传统方案由于成本高而难以扩展容量,近年来越来越被关注的持久内存技术有望解决这一问题。持久内存是在DRAM和SSD之间的补充,相比DRAM,持久内存具有容量大、性价比高的优点,但是性能也相对较低。为测试持久内存的应用性能,面向科学计算的一个重要领域——计算流体力学(CFD),对Intel持久内存进行性能评估。实验中,持久内存采用了最易于使用的内存模式,源码不需要任何修改,测试程序涵盖内存基准测试和3种常见的CFD算法,实验结果表明,在内存模式下,对不同CFD算法,相比纯DRAM的配置,持久内存的引入会带来一定的性能损失,且该损失随数据规模的增加而增大;另一方面,持久内存的部署使单服务器能支撑超大数据规模的数值模拟。 展开更多
关键词 计算流体力学 持久内存 性能评估
下载PDF
Intel计算机系统服务信息之十
13
作者 潘敬泽 《微计算机信息》 1989年第2期39-42,29,共4页
I^2ICE是目前美国Intel公司向用户提供的系统仿真功能最强的开发工具之一。它可在软件、硬件开发、软硬件联合开发以及生产和维修测试等四个主要阶段发挥重要作用。I^2ICE向用户提供了初级仿真器(如iPDS100,ICE48ICE51,ICE85,ICE86A等)... I^2ICE是目前美国Intel公司向用户提供的系统仿真功能最强的开发工具之一。它可在软件、硬件开发、软硬件联合开发以及生产和维修测试等四个主要阶段发挥重要作用。I^2ICE向用户提供了初级仿真器(如iPDS100,ICE48ICE51,ICE85,ICE86A等)所无法比拟和取代的高级的仿真和调试功能及维修测试手段。它具有仿真8086/8088、80186/80188,80268CPU的功能。本文章主要目的在于向用户介绍如何利用I^2ICE来进行计算机软件的调试和计算机单板的检修。 展开更多
关键词 I^2ICE 软件调试 计算机 检修
下载PDF
激光增材制造316L从单层到多层沉积的热行为模拟与实验研究
14
作者 卢裕尔 孙文磊 +3 位作者 钟荟玄 邹利 黎勇 张团 《热加工工艺》 北大核心 2024年第20期129-139,共11页
基于ABAQUS软件构建激光金属沉积(laser metal deposition,LMD)316L不锈钢增材制造的有限元模型,采用生死单元和双椭球移动热源结合的方式进行数值模拟,研究单道单层LMD过程中的温度场以及不同工艺参数对温度场、不同区域特征点温度梯... 基于ABAQUS软件构建激光金属沉积(laser metal deposition,LMD)316L不锈钢增材制造的有限元模型,采用生死单元和双椭球移动热源结合的方式进行数值模拟,研究单道单层LMD过程中的温度场以及不同工艺参数对温度场、不同区域特征点温度梯度的影响。进一步探究了单道多层LMD过程中熔池的温度变化和各层之间的热循环规律。设计相关实验,验证数值模拟结果。结果表明:降低扫描速度或提高激光功率,熔池作用范围会变大。激光功率对温度梯度影响更大,尤其是纵向温度梯度。随着LMD层数的增加,且由于往复扫描的工艺路径,温度梯度显著增加,因此成形零件容易发生弯曲变形。单道多层薄壁件的整体形貌进一步说明了LMD温度梯度模拟的准确性。 展开更多
关键词 激光金属沉积 数值模拟 温度场 温度梯度
下载PDF
基于深度学习的用气趋势预测与管网气量调配算法——以中国石油西南油气田公司为例 被引量:2
15
作者 吴玙欣 周钦宇 +4 位作者 杨云杰 邓启志 赵咏 谭卓 邓觅 《天然气技术与经济》 2024年第1期76-80,共5页
生产实时数据是油气生产的重要资产,通过监测实时数据,管理人员可以及时掌握油气田的生产运行状况,目前数据使用主要集中在数据监测、设备联锁、支撑报表自动生成等应用。为了提升已有数据价值、支撑调度管理,对某气矿已采集天然气开发... 生产实时数据是油气生产的重要资产,通过监测实时数据,管理人员可以及时掌握油气田的生产运行状况,目前数据使用主要集中在数据监测、设备联锁、支撑报表自动生成等应用。为了提升已有数据价值、支撑调度管理,对某气矿已采集天然气开发生产实时数据再利用,通过深度学习进行用户用气量趋势预测,并研究出一种管网气量调配的算法,实现了管网输气调配方案的自动生成。研究结果表明:①通过对历史数据的处理,可以对异常值进行分析和过滤,从而获取能够使用分析的数据,并能生成参数的正常运行区间,对有效数据提取、指导工艺参数运行范围具有重要意义;②通过神经网络进行用户用气量小时趋势的预测,能较好地捕获未来一段时间内的用气量变化趋势,从而实现对需求量变化的提前感知;③通过构建最少调整次数和最接近标定产能两种基于管网汇总气量的井口产量调整算法,实现了气井生产管网调配方案的自动计算,减少了人工计算分析管网气量调配的工作量。 展开更多
关键词 数据处理 趋势预测 气量调配 实时数据 深度学习
下载PDF
基于IPEX-LLM的本地轻量化课程教学智能辅助系统
16
作者 张嘉睿 张豈明 +4 位作者 毕枫林 张琰彬 王伟 任而今 张海立 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期162-172,共11页
提出并实现了一个本地轻量化课程教学智能辅助系统.该系统利用IPEX-LLM(Intel PyTorch extention for large language model)加速库,在计算资源受限的设备上高效部署并运行经过QLoRA(quantum-logic optimized resource allocation)框架... 提出并实现了一个本地轻量化课程教学智能辅助系统.该系统利用IPEX-LLM(Intel PyTorch extention for large language model)加速库,在计算资源受限的设备上高效部署并运行经过QLoRA(quantum-logic optimized resource allocation)框架微调的大语言模型,并结合增强检索技术,实现了智能问答、智能出题、教学大纲生成、教学演示文档生成等4个主要功能模块的课程灵活定制,在帮助教师提高教学备课和授课的质量与效率、保护数据隐私的同时,支撑学生个性化学习并提供实时反馈.在性能实验中,以集成优化后的Chatglm3-6B模型为例,该系统处理64-token输出任务时仅需4.08 s,验证了其在资源受限环境下快速推理的能力.在实践案例分析中,通过与原生Chatgml-6B和ChatGPT4.0在功能实现上的对比,进一步表明了该系统具备优越的准确性和实用性. 展开更多
关键词 智能辅助 计算资源受限 IPEX-LLM 微调 增强检索
下载PDF
基于扩张状态观测器的自动泊车路径跟踪控制
17
作者 朱茂飞 王博飞 +2 位作者 谷曼 牛润新 刘前 《合肥学院学报(综合版)》 2024年第2期123-129,共7页
为了消除外界干扰和转向系统运动学模型的不确定性的影响,建立了自动垂直泊车系统的车辆运动学模型,设计了线性扩张状态观测器,该观测器可将系统外界干扰和模型不确定性看作总的扰动量进行观测和补偿,而不需要建立被拉对象的精确数学模... 为了消除外界干扰和转向系统运动学模型的不确定性的影响,建立了自动垂直泊车系统的车辆运动学模型,设计了线性扩张状态观测器,该观测器可将系统外界干扰和模型不确定性看作总的扰动量进行观测和补偿,而不需要建立被拉对象的精确数学模型。在此基础上,将扩张状态观测器的值作为滑模控制器的补偿量,用于削弱干扰和不确定对控制器的影响,提高路径跟踪的精度。设定适当的扰动,通过Matlab/Simulink软件仿真,与没有观测器的传统滑模控制相比,验证了该系统跟踪效果的有效性。实车试验结果表明,该路径跟踪控制器能够精确控制车辆完成垂直泊车任务,提出的方法在变速及不确定扰动的泊车情况下具有较好的跟踪控制效果。 展开更多
关键词 自动泊车 路径跟踪 扩张状态观测器 滑模控制
下载PDF
基于仿生视觉骨干的级联蒸馏输电线路目标检测模型
18
作者 臧积业 曲朝阳 +3 位作者 董运昌 宋思琦 李鹏程 李泠聪 《高电压技术》 EI CAS CSCD 北大核心 2024年第8期3757-3768,共12页
针对输电线路无人机智能巡检中多个小目标缺陷检测精度低且复杂环境下缺乏鲁棒性等问题,提出基于仿生视觉骨干的级联蒸馏输电线路目标检测模型。首先,设计2个共用骨干网络的高效模块构建级联蒸馏结构:动态锚框蒸馏模块和动态锚框提纯模... 针对输电线路无人机智能巡检中多个小目标缺陷检测精度低且复杂环境下缺乏鲁棒性等问题,提出基于仿生视觉骨干的级联蒸馏输电线路目标检测模型。首先,设计2个共用骨干网络的高效模块构建级联蒸馏结构:动态锚框蒸馏模块和动态锚框提纯模块,前者负责粗略寻找可能存在目标的区域,后者负责细化该区域,从而提出一种新的渐进式目标检测方法,解决输电线路中受遮挡目标的漏检问题。其次,构建仿生特征提取骨干网络,通过模仿生物感受野充分聚合上下文信息,提升骨干网络对线路中尺度较小目标的特征提取能力。然后,设计周边视觉模块,利用人类独有的视觉机制控制局部信息的交互强度,克服输电线路中复杂多变的背景对模型的干扰。最后,构建生成了输电线路目标的数据集,并通过仿真实验验证了模型的泛化性和鲁棒性。 展开更多
关键词 电力巡检 周边视觉注意力机制 高阶空间交互 视觉变压器 级联蒸馏架构
下载PDF
“电力电子技术”多层次系统化教学模式
19
作者 李旻运 蔡志端 许虹怡 《电气电子教学学报》 2024年第2期176-179,共4页
通过对“电力电子技术”课程分析,针对传统项目式教学模式中存在的教学案例孤立、碎片化、系统性不强等问题,在结合工程项目的基础上提出了一种多层次系统化教学模式。主要阐述了该教学模式的教学理念及其实施过程,该教学模式使整个学... 通过对“电力电子技术”课程分析,针对传统项目式教学模式中存在的教学案例孤立、碎片化、系统性不强等问题,在结合工程项目的基础上提出了一种多层次系统化教学模式。主要阐述了该教学模式的教学理念及其实施过程,该教学模式使整个学习过程呈现层层递进、由易到难、由理论到实际、螺旋式上升等特征,对推动课程教学质量、提高学生学习效果和提升学生专业综合素养具有重要意义。 展开更多
关键词 整流电路 教学模式 充电桩 知识应用
下载PDF
市政广场灯光环境设计思路研究
20
作者 欧阳培彬 《灯与照明》 2024年第3期89-93,共5页
结合实际案例,探讨了市政广场灯光环境的设计思路,旨在通过科学规划与布局、照度计算与调整等方法,展现灯光环境的多样性、互动性及具象化特征;详细阐述了灯光环境在市政广场中的语言表现,如焦点与角度的选择、层次与流变的处理,以及空... 结合实际案例,探讨了市政广场灯光环境的设计思路,旨在通过科学规划与布局、照度计算与调整等方法,展现灯光环境的多样性、互动性及具象化特征;详细阐述了灯光环境在市政广场中的语言表现,如焦点与角度的选择、层次与流变的处理,以及空间与感知的塑造;提出了市政广场灯光环境设计策略,即绿色可持续发展、光影效果的艺术运用、节能环保及智能化管理。结果表明:科学合理的灯光环境设计能够提升市政广场的夜间景观质量,增强市民与游客的参与感和体验度,促进城市可持续发展。 展开更多
关键词 市政广场 灯光环境设计 光影效果 可持续发展 智能化管理
下载PDF
上一页 1 2 14 下一页 到第
使用帮助 返回顶部