期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
三峡水库运行后汉口—九江河段水位变化特征及成因
1
作者 章广越 谈广鸣 +3 位作者 张为 李明 尹志 李清韬 《水科学进展》 EI CAS CSCD 北大核心 2024年第1期85-97,共13页
大型水库的修建引起坝下游的水位调整,进而对河势、航运、防洪及生态等产生显著影响。为探究汉口—九江河段水位变化特征及成因,采用M-K分析法分析1988—2022年汉口、黄石港和九江站的水位变化趋势,并使用基于距平残差的水位变幅分析方... 大型水库的修建引起坝下游的水位调整,进而对河势、航运、防洪及生态等产生显著影响。为探究汉口—九江河段水位变化特征及成因,采用M-K分析法分析1988—2022年汉口、黄石港和九江站的水位变化趋势,并使用基于距平残差的水位变幅分析方法和一维水动力模型,分析河道冲淤、下游水位和阻力变化对不同特征流量下水位变化的影响。研究结果表明:①三峡成库前,除九江站枯水位呈显著性下降趋势,各级流量下的水位均没有显著性变化趋势。②三峡成库后,九江站的水位变化趋势与建库前相同;汉口站、黄石港站在12000 m^(3)/s和20000 m^(3)/s下的水位呈显著性下降趋势,12000 m^(3)/s时降幅分别为0.072、0.045 m/a,20000 m^(3)/s时降幅分别为0.048、0.027 m/a;水位变化的临界转换流量约为30000 m^(3)/s,在该流量附近水位未出现明显变化;当流量大于30000 m^(3)/s时,水位呈非显著性上升趋势,45000 m^(3)/s下的升幅分别为0.037、0.049 m/a。③临界转换流量以下水位下降的主导作用为河道冲刷,临界流量附近的水位未出现明显变化源于阻力增大作用接近抵消了河道冲刷的影响,临界转换流量以上的水位上升源于阻力增大作用更加明显,个别年份的洪水位上升显著源于下游水位顶托作用明显。 展开更多
关键词 水位变化 水位—流量关系 河道阻力 M-K分析法 汉口—九江河段 三峡水库
下载PDF
淹没刚性植被明渠紊流沿程流动特性差异
2
作者 陈月君 赵连军 +3 位作者 王瑶 朱子春 谈广鸣 王明阳 《水科学进展》 EI CAS CSCD 北大核心 2024年第2期256-264,共9页
淹没刚性植被通过改变水流结构,造成时均流速、紊动强度、雷诺应力等水力参数垂线分布不均匀和沿程差异化。采用声学多普勒测速仪(ADV)测量3种淹没度(3.0、4.0、5.0)下的流速,结合统计学方法,系统分析植被段内及其上、下游过渡段流速和... 淹没刚性植被通过改变水流结构,造成时均流速、紊动强度、雷诺应力等水力参数垂线分布不均匀和沿程差异化。采用声学多普勒测速仪(ADV)测量3种淹没度(3.0、4.0、5.0)下的流速,结合统计学方法,系统分析植被段内及其上、下游过渡段流速和紊动特性差异。结果表明:植被显著增强了水流紊动,且紊动特性取值与淹没度正相关;植被段内流速差异在低淹没度下的植被层内和高淹没度下的自由流动层内更加显著,而紊动特性沿程增强,且垂线分布具有相似性,最大值点位于冠层顶部附近;当淹没度满足KH涡的形成和发展条件时,随淹没度的增大,植被段内紊动特性垂线分布出现转折点(临近此点梯度急剧减小并趋于0)的断面数量增多,经验证,在充分发展的紊流区此点可作为KH涡的上边界点。 展开更多
关键词 刚性植被 淹没度 时均流速 紊动特性 声学多普勒测速仪
下载PDF
HPC+AI驱动的第一性原理科学智能计算平台
3
作者 刘涛 赵曈 +1 位作者 谭光明 贾伟乐 《数据与计算发展前沿》 CSCD 2023年第3期13-28,共16页
[目的]科学智能(AI for Science)方法正在深刻地改变当前科学计算的格局。其融合了物理模型、人工智能与高性能计算,针对传统科学计算中的高维问题,通过数据拟合的方式实现成量级的增加高精度科学计算问题的时间和空间尺度,正在推动一... [目的]科学智能(AI for Science)方法正在深刻地改变当前科学计算的格局。其融合了物理模型、人工智能与高性能计算,针对传统科学计算中的高维问题,通过数据拟合的方式实现成量级的增加高精度科学计算问题的时间和空间尺度,正在推动一场科研范式的变革。[方法]本文针对第一性原理精度的分子动力学,提出一种HPC+AI驱动的科学智能计算平台,针对科学智能在工作流上带来的变化与挑战,从科学数据的生成与数据集制备、构型空间探索与训练样本标注、科学智能模型的高效训练及大规模高效推理等四个方面阐述构建科学智能计算平台的关键技术与流程。[结果]本文所提出的计算平台在整合科学智能计算工作流的基础上,针对HPC+AI驱动的第一性原理精度分子动力学这一典型应用,提出了基于卡尔曼滤波的主动学习策略;改进了拟二阶AI模型训练方法,实现训练时间从天到分钟级的加速;利用五阶多项式AI模型压缩技术实现在同等硬件条件下模型推理的体系规模提高1个数量级,到解时间提高3-9倍。[结论]通过上述工作的整合,形成一套可用于第一性原理精度分子动力学计算的科学智能计算平台。[局限与展望]科学智能计算方法与工作流仍处于蓬勃发展阶段,在高精度数据、更通用AI模型和高效的计算方法等方面仍面临巨大的挑战,也将成为本文工作在未来的重要探索方向。 展开更多
关键词 科学智能 第一性原理计算 分子动力学 主动学习 卡尔曼滤波 模型压缩
下载PDF
基于Godunov格式的流域地表径流二维数值模拟 被引量:19
4
作者 张大伟 权锦 +1 位作者 马建明 向立云 《水利学报》 EI CSCD 北大核心 2018年第7期787-794,802,共9页
采用完整二维浅水方程组模拟地表径流运动时会遇到干湿转化处理的难题,为解决该问题,本文采用坡面流为均匀覆盖流域地表的片状薄层水流的概念开发完成了一套新的基于Godunov格式的地表径流二维水动力模型。模型中,采用三角形网格离散计... 采用完整二维浅水方程组模拟地表径流运动时会遇到干湿转化处理的难题,为解决该问题,本文采用坡面流为均匀覆盖流域地表的片状薄层水流的概念开发完成了一套新的基于Godunov格式的地表径流二维水动力模型。模型中,采用三角形网格离散计算区域,修正的Roe格式计算界面通量,底坡项直接积分求解,对高度非线性的摩阻项进行半隐式处理。本模型的最大优势是干湿处理变得异常简洁,单元水面和地形均无需任何特殊处理。通过4个经典算例验证了该模型具有良好的精度和稳定性。最后将模型用于解家湾流域S曲线的计算和实测场次降雨径流过程的模拟,所得计算结果合理、可靠,表明本文模型具备模拟流域地表径流运动的能力,可为小流域汇流计算提供一种新的解决方案。 展开更多
关键词 地表径流 二维数值模拟 浅水方程 非结构网格 Godunov格式
下载PDF
基于水库-河道耦合关系的水库水沙联合调度模型研究与应用 被引量:12
5
作者 谈广鸣 郜国明 +1 位作者 王远见 李新杰 《水利学报》 EI CSCD 北大核心 2018年第7期795-802,共8页
为使多沙河流水库既能实现防洪、发电和生态等综合效益,同时又能兼顾下游河道维持一定过流能力的目标,运用动态规划方法构建了基于水库-河道耦合关系的水库多目标优化调度数学模型,集成了水库减淤效益、发电效益、下游河道河床演变3个... 为使多沙河流水库既能实现防洪、发电和生态等综合效益,同时又能兼顾下游河道维持一定过流能力的目标,运用动态规划方法构建了基于水库-河道耦合关系的水库多目标优化调度数学模型,集成了水库减淤效益、发电效益、下游河道河床演变3个计算子模块。其中下游河道河床演变计算子模块是整个数学模型的核心模块,它的年度计算结果既作为水库调度寻优的判别条件,又通过实时反馈更新了下一年度水库优化调度计算的边界条件。将该模型应用到黄河小浪底水库水沙联合调度的研究中,结果表明,在维持下游河道4000 m3/s左右的中水河槽的基础上,构建的模型能充分权衡下游防洪、库区减淤、电站发电之间的关系,实现了水库综合效益的优化。该结论为研究多沙河流水库水沙联合优化调度提供了新的思路和理论依据。 展开更多
关键词 水沙调控 优化调度 耦合模型 泥沙运动 多目标决策
下载PDF
河湖岸线和内河洲滩资源高效利用与保护中的关键科学技术问题与预期成果展望 被引量:16
6
作者 谈广鸣 姚仕明 黎礼刚 《工程科学与技术》 EI CAS CSCD 北大核心 2019年第3期1-8,共8页
河湖岸线和内河洲滩既是自然界中陆生与水生系统之间重要的过渡地带,也是维系河流、湖泊系统生态健康的关键区域,又是沿岸经济社会发展的重要基础依托。在动态演化中河湖岸线和洲滩的保护与利用之间矛盾突出:岸线抢用与无序利用、占而... 河湖岸线和内河洲滩既是自然界中陆生与水生系统之间重要的过渡地带,也是维系河流、湖泊系统生态健康的关键区域,又是沿岸经济社会发展的重要基础依托。在动态演化中河湖岸线和洲滩的保护与利用之间矛盾突出:岸线抢用与无序利用、占而不用与深水浅用、河道侵占与正常行洪、自然演变与河势控制、刚性护岸与物质连通等,尤其是不合理开发利用的累积效应对防洪、供水、航运和生态环境等的影响严重,甚至难以修复。随着协同推进生态优先和绿色发展理念的提出,研究河湖岸线和内河洲滩资源高效利用与保护关键技术,是当前的迫切需求和发展趋势。国家重点研发计划项目"河湖岸线和内河洲滩资源高效利用与保护关键技术研究"以提出中国河湖岸线分类与功能影响评估理论方法、协调生态环境保护–经济发展二元需求的河湖岸滩保护与利用模式,研发河湖水域及岸线动态监管与功能评估技术,构建河湖岸线动态监管模式与服务平台,为建设生态岸线、平安岸线提供科技支撑为总目标,项目将采取多学科交叉、多手段结合、多方法综合的技术路线,从基础理论、关键技术和示范应用3个层次开展研究。通过项目研究,预计将提出3种中国河湖保护岸线分类、确定和功能评估理论等新方法,研发建立4套河湖水域及岸线地物态监管技术与功能评估体系、协调生态环境保护和经济发展的河湖岸线与洲滩保护与利用技术及其评价指标体系等新技术体系,构建1个满足4级"河湖长制"管理需求的河湖岸线动态监管服务平台,在城市江滩、农村滩区、三角洲河网区、高原城市湖泊、重要水源地等5种代表性河湖库开展示范。成果还将推动河流湖泊动力学、河床演变学、水生态学、水利规划学等学科进步,促进水利与互联网的深度融合,为河湖岸线和内河洲滩资源高效利用与保护及河湖水域岸线科学管理提供有力技术支撑,具有显著的社会经济与生态环境效益。 展开更多
关键词 河湖岸线 高效利用 保护
下载PDF
基于WSS的动态可重构光网络 被引量:6
7
作者 元国军 肖鹏 +6 位作者 姜涛 王展 杨帆 曹政 张佩珩 谭光明 孙凝晖 《高技术通讯》 EI CAS 北大核心 2019年第2期99-109,共11页
数据中心负载通信特征多种多样,可重构网络可以实现逻辑连接关系的动态变换以匹配不同的应用通信特征,是提高互连网络资源利用率、降低系统能耗、提高灵活性的有效方法之一。传统的电域互连技术很难实现物理拓扑的动态切换,本文基于新... 数据中心负载通信特征多种多样,可重构网络可以实现逻辑连接关系的动态变换以匹配不同的应用通信特征,是提高互连网络资源利用率、降低系统能耗、提高灵活性的有效方法之一。传统的电域互连技术很难实现物理拓扑的动态切换,本文基于新兴的光波长选择开关(WSS)技术提出了一种动态可重构光电混合网络结构,在不改变物理连接关系的条件下通过软件配置WSS实现拓扑连接的动态重构和互连带宽的最优调整;基于Misra&Gries算法和Greedy算法提出了面向可重构光网络的快速配置算法,可在满足光器件物理约束的条件下快速求解出典型拓扑对应的光波长配置参数。本文给出了多种物理拓扑的重构过程,1 024个节点的仿真结果显示,合适的拓扑重构对网络带宽的提升超过60%。 展开更多
关键词 数据中心 光电混合网络 可重构网络 波长选择开关(WSS)
下载PDF
水资源利用与排污控制的非合作博弈方法 被引量:2
8
作者 付湘 谈广鸣 +1 位作者 黄莎 刘双郡 《水利学报》 EI CSCD 北大核心 2022年第1期78-85,共8页
为在水环境保护优先的前提下保障水资源持续利用,通过分析水资源经济利用主体与水环境保护主体的目标冲突,建立水资源利用与排污控制的讨价还价博弈模型与主从博弈模型,提出水资源利用与排污控制互馈决策的协调方法,并对比分析均衡解与... 为在水环境保护优先的前提下保障水资源持续利用,通过分析水资源经济利用主体与水环境保护主体的目标冲突,建立水资源利用与排污控制的讨价还价博弈模型与主从博弈模型,提出水资源利用与排污控制互馈决策的协调方法,并对比分析均衡解与非劣解的内涵与关系。以洞庭湖四口河系地区为研究区域,结果表明:讨价还价博弈和主从博弈方法的均衡解均在多目标优化方法的非劣解前沿上,讨价还价博弈的均衡解范围远小于非劣解范围;主从博弈得到了唯一的均衡解,比讨价还价博弈的均衡解更有效地控制了污染物排放量。研究为水资源利用与水环境保护冲突管理提供了新的协调方法。 展开更多
关键词 经济效益 排污总量 讨价还价博弈 主从博弈 非劣解 均衡解
下载PDF
儿童注意缺陷多动障碍与语言发育障碍发生率的相关性研究 被引量:1
9
作者 谭光明 王旭辉 +4 位作者 徐舒曼 罗鑫刚 黄双苗 邱亿腾 彭文斌 《国际医药卫生导报》 2020年第14期1989-1991,共3页
目的探讨儿童注意缺陷多动障碍(ADHD)与儿童语言发育障碍发生率之间的关系。方法采用病例对照研究的方法,抽取2018年4月至2019年3月来本院就诊的儿童273名分成试验组(ADHD患儿组,n=40)和对照组(非ADHD儿童组,n=233);比较两组儿童的语言... 目的探讨儿童注意缺陷多动障碍(ADHD)与儿童语言发育障碍发生率之间的关系。方法采用病例对照研究的方法,抽取2018年4月至2019年3月来本院就诊的儿童273名分成试验组(ADHD患儿组,n=40)和对照组(非ADHD儿童组,n=233);比较两组儿童的语言发育障碍发生率,分析儿童ADHD与儿童语言发育障碍发生率的相关性。结果两组ADHD发生率比较,差异无统计学意义(χ2=0.203,P=0.616);对儿童语言发育障碍影响因素进行logistic回归分析显示,ADHD不是影响儿童语言发育障碍的独立因素(OR=0.920,P=0.325)。结论儿童注意缺陷多动障碍与儿童语言发育障碍发生率不具有统计学相关性。 展开更多
关键词 儿童语言发育障碍 儿童注意缺陷多动障碍 病例对照研究 相关性
下载PDF
PRF: a process-RAM-feedback performance model to reveal bottlenecks and propose optimizations
10
作者 谢震 tan guangming +1 位作者 Liu Weifeng Sun Ninghui 《High Technology Letters》 EI CAS 2020年第3期285-298,共14页
Performance models provide insightful perspectives to predict performance and to propose optimization guidance.Although there has been much researches,pinpointing bottlenecks of various memory access patterns and reac... Performance models provide insightful perspectives to predict performance and to propose optimization guidance.Although there has been much researches,pinpointing bottlenecks of various memory access patterns and reaching high accurate prediction of both regular and irregular programs on various hardware configurations are still not trivial.This work proposes a novel model called process-RAM-feedback(PRF)to quantify the overhead of computation and data transmission time on general-purpose multi-core processors.The PRF model predicts the cost of instruction for singlecore by a directed acyclic graph(DAG)and the transmission time of memory access between each memory hierarchy through a newly designed cache simulator.By using performance modeling and feedback optimization method,this paper uses PRF model to analyze and optimize convolution,sparse matrix-vector multiplication and sn-sweep as case study for covering with typical regular kernel to irregular and data dependence.Through the PRF model,it obtains optimization guidance with various sparsity structures,algorithm designs,and instruction sets support on different data sizes. 展开更多
关键词 performance model feedback optimization CONVOLUTION sparse matrix-vector multiplication sn-sweep
下载PDF
分布式深度学习训练网络综述 被引量:9
11
作者 朱泓睿 元国军 +5 位作者 姚成吉 谭光明 王展 户忠哲 张晓扬 安学军 《计算机研究与发展》 EI CSCD 北大核心 2021年第1期98-115,共18页
近年来深度学习在图像、语音、自然语言处理等诸多领域得到广泛应用,但随着人们对深度学习的训练速度和数据处理能力的需求不断提升,传统的基于单机的训练过程愈发难以满足要求,分布式的深度学习训练方法成为持续提升算力的有效途径.其... 近年来深度学习在图像、语音、自然语言处理等诸多领域得到广泛应用,但随着人们对深度学习的训练速度和数据处理能力的需求不断提升,传统的基于单机的训练过程愈发难以满足要求,分布式的深度学习训练方法成为持续提升算力的有效途径.其中训练过程中节点间网络的通信性能至关重要,直接影响训练性能.分析了分布式深度学习中的性能瓶颈,在此基础上对目前常用的网络性能优化方案进行综述,详细阐述了目前最新的超大规模分布式训练的体系结构、优化方法、训练环境和最有效的优化方法,最后对分布式训练仍然存在的困难进行了总结,对其未来研究方向进行了展望. 展开更多
关键词 分布式计算 深度学习 通信网络 性能优化 集合通信 集群网络
下载PDF
基于PPR模型的稀疏矩阵向量乘及卷积性能优化研究 被引量:3
12
作者 谢震 谭光明 孙凝晖 《计算机研究与发展》 EI CSCD 北大核心 2021年第3期445-457,共13页
稀疏矩阵向量乘和卷积作为高性能计算的两大计算核心,是非规则和规则访存的典型代表.目前已经做了许多针对性的优化工作,但是对于大量运行着不同指令集和拥有不同计算和访存性能的机器,仍然无法判定在特定的体系结构下导致性能效率无法... 稀疏矩阵向量乘和卷积作为高性能计算的两大计算核心,是非规则和规则访存的典型代表.目前已经做了许多针对性的优化工作,但是对于大量运行着不同指令集和拥有不同计算和访存性能的机器,仍然无法判定在特定的体系结构下导致性能效率无法被完全释放的主要原因及性能瓶颈,同时也很难准确预测出程序在特定机器上可达到的最佳性能.通过使用性能模型方法,建模程序在真实机器上的运行细节,可以得出更加精确的性能预测,并且根据模型输出的反馈信息提出针对性的优化指导.提出了PPR(probability-process-ram)模型,并在一个通用处理器上建模程序内指令执行和数据传输开销,其中包括使用模型预测各种指令数量及内存层次之间的数据传输大小去分析程序各个阶段的性能瓶颈,并且根据模型反馈的信息提出优化方案以及优化后的性能期望.最终使用PPR建模和优化2个计算核心,同时也比较了与常用的Roofline和ECM模型的区别. 展开更多
关键词 性能模型 反馈优化 稀疏矩阵向量乘 卷积 cache模拟器
下载PDF
三峡水库运行后宜昌-城陵矶河段冲刷重心下移与时空演变 被引量:2
13
作者 王华琳 郑珊 +1 位作者 谈广鸣 李凌云 《水利学报》 EI CSCD 北大核心 2021年第12期1470-1481,共12页
三峡大坝下游河道的冲刷发展影响着长江中下游的防洪、航运及区域经济发展。本文以宜昌至城陵矶河段约400 km长河段为研究对象,基于2002—2018年河道的来水来沙、泥沙粒径和横断面形态观测资料,计算并分析河道垂向冲淤、横向摆动、平滩... 三峡大坝下游河道的冲刷发展影响着长江中下游的防洪、航运及区域经济发展。本文以宜昌至城陵矶河段约400 km长河段为研究对象,基于2002—2018年河道的来水来沙、泥沙粒径和横断面形态观测资料,计算并分析河道垂向冲淤、横向摆动、平滩面积、平滩水深和冲淤量的变化,根据河道平面形态将研究河段划分为32个子河段,对子河段平均平滩面积和平滩水深的变化速率进行分级,引入空间聚类分析方法,对冲刷强度等级最高的河段在时空尺度上分布进行聚类分析,研究河道冲刷重心的时空迁移规律。结果表明,三峡水库运用后下游河道经历了蓄水初期冲刷较强(2003—2007)、175 m正常蓄水运用后冲刷减弱(2008—2012)和上游梯级水库运用后冲刷增强(2013—2018)的三个阶段;空间上,宜昌至枝城及上荆江河段普遍冲刷,以弯曲型为主的下荆江河道以冲为主,但冲淤交替频繁,同时冲淤强度具有随时间衰减的特点;冲刷重心具有向下游迁移的趋势,在三峡水库蓄水初期冲刷重心向下迁移较快,之后减缓,上游梯级水库运用后,冲刷重心下移速率明显加快,之后再次减缓,2003—2018年冲刷重心平均下移速率约7.5 km/a。 展开更多
关键词 三峡大坝 宜昌至城陵矶河道 冲刷重心 空间聚类 时空演变
下载PDF
不同矩阵分解方法对海洋数据同化的影响 被引量:2
14
作者 管志斌 肖俊敏 +3 位作者 季统凯 洪学海 谭光明 马岩 《计算机科学与探索》 CSCD 北大核心 2019年第1期147-157,共11页
在海洋数据同化领域,集合最优插值方法中,矩阵求逆过程所使用的奇异值分解(singular value decomposition,SVD)十分耗时。对集合最优插值中逆矩阵的求逆过程进行优化,分别使用LU分解、Choleskey分解、QR分解来替代SVD分解。首先,通过LU... 在海洋数据同化领域,集合最优插值方法中,矩阵求逆过程所使用的奇异值分解(singular value decomposition,SVD)十分耗时。对集合最优插值中逆矩阵的求逆过程进行优化,分别使用LU分解、Choleskey分解、QR分解来替代SVD分解。首先,通过LU分解(Choleskey分解或QR分解)得到相应的三角矩阵(或正交矩阵);然后,利用分解后的矩阵来实现相关逆矩阵的计算。由于LU分解、Choleskey分解、QR分解的算法复杂度都远小于SVD分解,因此改进后的同化程序能得到大幅度的性能提升。数值结果表明,所采用的三种矩阵分解方法相比于SVD分解,都能将集合最优插值的计算效率提升至少两倍以上。值得一提的是,在四种矩阵分解中Choleskey分解使得整个同化程序的性能达到了最优。 展开更多
关键词 海洋数据同化 集合最优插值(EnOI) 矩阵求逆 矩阵分解 Choleskey分解
下载PDF
面向模拟智能的计算系统
15
作者 谭光明 贾伟乐 +3 位作者 王展 元国军 邵恩 孙凝晖 《中国科学院院刊》 CSCD 北大核心 2024年第1期17-26,共10页
科学研究中的计算机模拟称为科学模拟(scientific simulation),文章从其狭义和广义层面出发,把科学模拟分为数值计算(numerical computation)、模拟智能(simulation intelligence)和科学大脑(science brain)3个阶段,并描述了各阶段的特... 科学研究中的计算机模拟称为科学模拟(scientific simulation),文章从其狭义和广义层面出发,把科学模拟分为数值计算(numerical computation)、模拟智能(simulation intelligence)和科学大脑(science brain)3个阶段,并描述了各阶段的特征。目前,科学模拟正在进入模拟智能阶段,即在科学大数据和人工智能的驱动下,科学模拟正从传统的数值计算逐步转向与人工智能相融合的模拟方式。文章针对支撑模拟智能阶段的计算系统展开讨论,阐述了其设计指导思想、基本方法和关键技术等问题。 展开更多
关键词 科学模拟 模拟智能 人工智能 计算系统 Z级计算
原文传递
围炉对谈:性能优化的个性与共性
16
作者 莫则尧 王龙 +8 位作者 刘杰 谭光明 刘伟峰 喻之斌 翟季冬 杨海龙 徐小文 黄烁 刘洁 《计算物理》 CSCD 北大核心 2024年第1期3-8,共6页
2022年12月12日,第八届高性能计算中间件技术研讨会(HPCMid22)成功召开。HPCMid(会议网址:http://www.caep-scns.ac.cn/HPCMid.php)每年举办一次,面向科学与工程计算数值模拟应用在当前及下一代超级计算机上面临的挑战,围绕高性能计算... 2022年12月12日,第八届高性能计算中间件技术研讨会(HPCMid22)成功召开。HPCMid(会议网址:http://www.caep-scns.ac.cn/HPCMid.php)每年举办一次,面向科学与工程计算数值模拟应用在当前及下一代超级计算机上面临的挑战,围绕高性能计算中间件关键技术,邀请相关学者报告最新研究进展并探讨未来发展趋势。第八届研讨会以“适配新型体系结构的性能优化技术”为主题,聚焦后摩尔时代新型体系结构为科学与工程计算带来的机遇与挑战,探讨新型体系结构下可移植性能优化技术的发展趋势。本届研讨会的专家座谈(Panel Session)环节由莫则尧研究员和徐小文研究员共同主持,邀请了王龙、刘杰、谭光明、刘伟峰、喻之斌5位来自高校、科研院所、企业的专家围绕“性能优化:个性vs共性”这一主题开展了深入的讨论与交流,翟季冬、杨海龙等多位专家也参与了讨论。专家们针对性能优化技术的研究现状与发展趋势、面临的问题与挑战以及人才培养等方面发表了许多有启发性的观点。《计算物理》编辑部特将本次讨论整理后发表,以飨读者。限于篇幅,略有删节。 展开更多
关键词 高性能计算 超级计算机 体系结构 中间件技术 性能优化 专家座谈 人才培养
原文传递
A case study of 3D RTM-TTI algorithm on multicore and many-core platforms
17
作者 张秀霞 tan guangming +1 位作者 Chen Mingyu Yao Erlin 《High Technology Letters》 EI CAS 2017年第2期185-190,共6页
3D reverse time migration in tiled transversly isotropic(3D RTM-TTI) is the most precise model for complex seismic imaging.However,vast computing time of 3D RTM-TTI prevents it from being widely used,which is addresse... 3D reverse time migration in tiled transversly isotropic(3D RTM-TTI) is the most precise model for complex seismic imaging.However,vast computing time of 3D RTM-TTI prevents it from being widely used,which is addressed by providing parallel solutions for 3D RTM-TTI on multicores and many-cores.After data parallelism and memory optimization,the hot spot function of 3D RTMTTI gains 35.99 X speedup on two Intel Xeon CPUs,89.75 X speedup on one Intel Xeon Phi,89.92 X speedup on one NVIDIA K20 GPU compared with serial CPU baseline.This study makes RTM-TTI practical in industry.Since the computation pattern in RTM is stencil,the approaches also benefit a wide range of stencil-based applications. 展开更多
关键词 3D RTM-TTI Intel Xeon Phi NVIDIA K20 GPU stencil computing manycore MULTICORE seismic imaging
下载PDF
A heuristic clustering algorithm based on high density-connected partitions
18
作者 苑鲁峰 Yao Erlin tan guangming 《High Technology Letters》 EI CAS 2018年第2期149-155,共7页
Clustering data with varying densities and complicated structures is important,while many existing clustering algorithms face difficulties for this problem. The reason is that varying densities and complicated structu... Clustering data with varying densities and complicated structures is important,while many existing clustering algorithms face difficulties for this problem. The reason is that varying densities and complicated structure make single algorithms perform badly for different parts of data. More intensive parts are assumed to have more information probably,an algorithm clustering from high density part is proposed,which begins from a tiny distance to find the highest density-connected partition and form corresponding super cores,then distance is iteratively increased by a global heuristic method to cluster parts with different densities. Mean of silhouette coefficient indicates the cluster performance. Denoising function is implemented to eliminate influence of noise and outliers. Many challenging experiments indicate that the algorithm has good performance on data with widely varying densities and extremely complex structures. It decides the optimal number of clusters automatically.Background knowledge is not needed and parameters tuning is easy. It is robust against noise and outliers. 展开更多
关键词 聚类算法 变密度 启发式 分区 连接 复杂结构 显示算法 降噪功能
下载PDF
Single-particle 3D reconstruction on specialized stream architecture and comparison with GPGPUs
19
作者 段勃 Wang Wendi +1 位作者 tan guangming Meng Dan 《High Technology Letters》 EI CAS 2014年第4期333-345,共13页
The wide acceptance and data deluge in medical imaging processing require faster and more efficient systems to be built.Due to the advances in heterogeneous architectures recently,there has been a resurgence in the fi... The wide acceptance and data deluge in medical imaging processing require faster and more efficient systems to be built.Due to the advances in heterogeneous architectures recently,there has been a resurgence in the first research aimed at FPGA-based as well as GPGPU-based accelerator design.This paper quantitatively analyzes the workload,computational intensity and memory performance of a single-particle 3D reconstruction application,called EMAN,and parallelizes it on CUDA GPGPU architectures and decouples the memory operations from the computing flow and orchestrates the thread-data mapping to reduce the overhead of off-chip memory operations.Then it exploits the trend towards FPGA-based accelerator design,which is achieved by offloading computingintensive kernels to dedicated hardware modules.Furthermore,a customized memory subsystem is also designed to facilitate the decoupling and optimization of computing dominated data access patterns.This paper evaluates the proposed accelerator design strategies by comparing it with a parallelized program on a 4-cores CPU.The CUDA version on a GTX480 shows a speedup of about 6 times.The performance of the stream architecture implemented on a Xilinx Virtex LX330 FPGA is justified by the reported speedup of 2.54 times.Meanwhile,measured in terms of power efficiency,the FPGA-based accelerator outperforms a 4-cores CPU and a GTX480 by 7.3 times and 3.4 times,respectively. 展开更多
关键词 单粒子 架构 三维重建 FPGA 外存储器 设计策略 计算强度 数据访问模式
下载PDF
小浪底水库排沙指标及2015年应用分析 被引量:4
20
作者 郜国明 谈广鸣 +2 位作者 李涛 王婷 任智慧 《应用基础与工程科学学报》 EI CSCD 北大核心 2019年第2期275-283,共9页
小浪底水库异重流的调度在历年黄河调水调沙过程中举足轻重,在分析小浪底水库2004~2014年黄河汛前调水调沙期间实测资料基础上,对影响水库排沙的壅水指标进行了研究,结合其物理意义组合出多个影响调度的无量纲化参数,采用多元非线性拟... 小浪底水库异重流的调度在历年黄河调水调沙过程中举足轻重,在分析小浪底水库2004~2014年黄河汛前调水调沙期间实测资料基础上,对影响水库排沙的壅水指标进行了研究,结合其物理意义组合出多个影响调度的无量纲化参数,采用多元非线性拟合方法提出了小浪底水库调水调沙期异重流排沙比的预测方法,并预测了2015年排沙比接近0,与实测值接近.采用水量平衡的计算方法,估计了2015年异重流形成、运行过程中所需的浑水体积,进一步验证了预测结果.研究成果既丰富了河流泥沙成果,又可为多沙河流水库规划、设计服务,具有重要的应用价值和推广价值. 展开更多
关键词 回水长度 壅水指标 浑水体积 异重流排沙 小浪底水库
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部