期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于深度学习的口腔全景片牙齿自动分割方法
1
作者 寇大治 《数据与计算发展前沿》 CSCD 2024年第3期162-172,共11页
【目的】从口腔全景片中准确分割每颗独立的牙齿对于口腔医学数字化中的疾病诊断和治疗至关重要,然而由于口腔全景片中存在重叠的解剖结构、模糊的边界和伪影,导致单个牙齿的精确分割成为一项具有挑战性的任务。【方法】为了解决这个问... 【目的】从口腔全景片中准确分割每颗独立的牙齿对于口腔医学数字化中的疾病诊断和治疗至关重要,然而由于口腔全景片中存在重叠的解剖结构、模糊的边界和伪影,导致单个牙齿的精确分割成为一项具有挑战性的任务。【方法】为了解决这个问题,本文提出一种基于深度学习的方法,用于从口腔全景片中准确、自动地分割每颗独立的牙齿。所提出的方法结合了多个深度神经网络,并利用牙齿形态图和多尺度形态引导注意力机制(MMAM)来精确分割每个牙齿。【结果】在真实临床场景中收集的测试数据集上评估了这一方法的分割性能,并与目前先进的方法进行了比较。结果表明,本文提出的方法在单个牙齿上的分割结果为平均Dice系数94.65%,平均Jaccard系数90.29%,平均召回率94.06%,平均精确度95.62%,与其他方法相比获得了更准确的分割性能。【结论】基于深度学习的口腔全景片自动分割方法可以很好地应用于口腔医学数字化自动病理诊断之中。 展开更多
关键词 人工智能 深度学习 口腔全景片 深度神经网络 牙齿分割
下载PDF
nPME对GROMACS软件并行计算性能的影响分析 被引量:1
2
作者 寇大治 左光宏 《计算机应用与软件》 CSCD 北大核心 2014年第10期13-15,40,共4页
在分子动力学并行计算的过程中,正确地处理好并行规模与PME(Particle-Mesh Ewald)方法的任务分配,对于提高分子动力学的并行效率具有非常重要的影响。以常用的分子动力学软件Gromacs[1-3]为例,利用上海超级计算中心"魔方"超... 在分子动力学并行计算的过程中,正确地处理好并行规模与PME(Particle-Mesh Ewald)方法的任务分配,对于提高分子动力学的并行效率具有非常重要的影响。以常用的分子动力学软件Gromacs[1-3]为例,利用上海超级计算中心"魔方"超级计算平台,就不同并行规模与不同PME任务分配方式下的计算性能进行测试。发现并行能在一定的范围内显著的提高Gromacs的计算效率,但是当并行规模超过一定值后,计算效率反而下降。另一方面,当并行规模较小时,不设置PME专属节点的计算效率较高;但当并行规模较大时,合理的设置PME专属节点,能显著地提高计算的效率。这一结果能对从事分子动力学模拟的研究人员合理分配并行资源提供帮助。 展开更多
关键词 并行计算 分子动力学 GROMACS PME
下载PDF
自洽场理论研究嵌段聚合物的并行算法实现 被引量:1
3
作者 寇大治 梁好均 《计算机工程与科学》 CSCD 北大核心 2012年第8期108-113,共6页
自洽场理论的数值计算方法在聚合物热力学的研究中得到了广泛的应用,尤其应用在嵌段共聚物微相分离形态的预测和描述方面[1~6]。该理论方法灵活性较强,参数空间的调整范围较大,能应用的计算体系也变化多样,难以建立固定的既有软件包,... 自洽场理论的数值计算方法在聚合物热力学的研究中得到了广泛的应用,尤其应用在嵌段共聚物微相分离形态的预测和描述方面[1~6]。该理论方法灵活性较强,参数空间的调整范围较大,能应用的计算体系也变化多样,难以建立固定的既有软件包,现有文献也鲜见针对该理论算法并行化的研究。本文就该理论在嵌段共聚物自组装问题上的数值计算的并行算法实现进行了研究和讨论,给出了算法性能的理论分析,并进行了实验测试。测试结果显示,本文提出的并行算法可获得良好的并行加速比,并行效率较高。该算法的提出有助于推动包括针对聚合物在内的软物质理论的研究工作。 展开更多
关键词 自洽场理论 嵌段共聚物 自组装 并行算法实现
下载PDF
基于应用的全局资源优化调度方法 被引量:1
4
作者 寇大治 沈瑜 唐小勇 《计算机应用》 CSCD 北大核心 2019年第S02期156-159,共4页
在国家高性能计算环境中,为了更好地实现对分布在不同地域超级计算机资源的调度管理,针对计算资源忙闲不均等问题,提出通过研究典型应用作业的运行特征,开发多中心任务的调度系统,以解决国家高性能计算环境统一调度的关键技术问题。首... 在国家高性能计算环境中,为了更好地实现对分布在不同地域超级计算机资源的调度管理,针对计算资源忙闲不均等问题,提出通过研究典型应用作业的运行特征,开发多中心任务的调度系统,以解决国家高性能计算环境统一调度的关键技术问题。首先收集了若干超级计算中心的应用运行历史情况;然后研究了高性能计算系统的历史任务数据,建立应用运行历史数据库;最后将用户应用对资源的需求和典型应用的资源使用特征分析相结合,建立一种可精确描述应用特征的框架。研究了基于多中心应用特征的任务调度方法,开发了基于应用的全局资源优化调度系统,为国家高性能计算环境服务化运营和稳定运行提供了有力的技术支撑,有效地提高了国家高性能计算环境的可靠性、可用性和可维护性。 展开更多
关键词 超级计算 高性能计算系统 历史数据库 应用特征 调度方法
下载PDF
应用感知的算力优化调度方法 被引量:1
5
作者 寇大治 韦建文 唐小勇 《数据与计算发展前沿》 CSCD 2022年第5期3-10,共8页
【目的】在“东数西算”工程的大背景下,为了更好地实现对分布在不同地域超级计算机资源的调度管理,针对计算资源忙闲不均等问题,提出通过研究典型应用作业的运行特征,开发多中心任务的调度系统,以解决国家高性能计算环境统一调度的关... 【目的】在“东数西算”工程的大背景下,为了更好地实现对分布在不同地域超级计算机资源的调度管理,针对计算资源忙闲不均等问题,提出通过研究典型应用作业的运行特征,开发多中心任务的调度系统,以解决国家高性能计算环境统一调度的关键技术问题。【方法】首先收集了若干超级计算中心的应用运行历史情况,建立了应用运行历史数据库;其次将用户应用对资源的需求和典型应用的资源使用特征分析相结合,通过机器学习的方法,建立了一种可精确描述应用特征的框架;然后实现了跨集群高性能计算应用的容器方式迁移;最后研究了基于多中心应用特征的任务调度方法,开发了基于应用感知的全局资源优化调度系统。【结果】该系统为国家高性能计算环境服务化运营和稳定运行提供了有力的技术支撑。【结论】基于应用感知的算力优化调度方法可望有效提高“东数西算”的可靠性、可用性和可维护性。 展开更多
关键词 高性能计算系统 历史数据库 应用特征 算力调度方法
下载PDF
有限元网格积分算法在MIC众核平台上的并行实现
6
作者 寇大治 孔大力 《计算机科学》 CSCD 北大核心 2015年第11期56-58,62,共4页
基于英特尔集成众核(Many Integrated Core,MIC)架构,将有限元网格积分算法在至强融核(Xeon Phi)协处理器做了移植和性能分析。该应用全面测试了有限元分析的核心计算过程在MIC上的加速效果,实现了卸载模式(offload)[1]下利用OpenMP在MI... 基于英特尔集成众核(Many Integrated Core,MIC)架构,将有限元网格积分算法在至强融核(Xeon Phi)协处理器做了移植和性能分析。该应用全面测试了有限元分析的核心计算过程在MIC上的加速效果,实现了卸载模式(offload)[1]下利用OpenMP在MIC上的线程并行化。计算性能测试结果显示集成众核平台可以有效地加速有限元网格积分算法:1)一块被充分利用的MIC设备卡(3115A)的计算能力超过两路16核Intel XeonTM E5-2670CPU;2)MIC并发的物理线程可能由于公共缓存访问存在竞争而降低程序的扩展性。测试结果还显示了在多CPU多MIC平台上进一步移植完整的MPI并行有限元模拟软件的可行性。这项工作有助于推动与有限元网格相关的科学和工程高性能计算的研究。 展开更多
关键词 集成众核 卸载模式 并行 多线程 有限元
下载PDF
随机波动率下的亚式期权定价问题在GPU集群上的实现
7
作者 徐磊 徐莹 +3 位作者 姜广鑫 梁义娟 寇大治 徐承龙 《计算机应用与软件》 CSCD 北大核心 2012年第11期79-82,共4页
期权定价作为计算金融领域的核心问题之一,越来越受到关注。随着期权交易的规模和交易量的迅速增长,当前的期权定价平台越来越受到挑战,在尽可能短的时间内对期权进行定价变得越来越困难。传统的计算平台通常使用基于CPU的计算集群,而... 期权定价作为计算金融领域的核心问题之一,越来越受到关注。随着期权交易的规模和交易量的迅速增长,当前的期权定价平台越来越受到挑战,在尽可能短的时间内对期权进行定价变得越来越困难。传统的计算平台通常使用基于CPU的计算集群,而图形处理器(GPU)具有更高的浮点性能和访存带宽,在价格与功耗方面也优于CPU。尝试使用GPU集群来对具有随机波动率的亚式期权进行定价,同时使用带控制变量的Monte Carlo方法,减小模拟的方差。最终的测试结果表明GPU集群较CPU集群具有更多的优势,适合应用于期权定价领域。 展开更多
关键词 GPU集群 CUDA 亚式期权 随机波动 蒙特卡洛 MPI
下载PDF
高性能计算中的亚式期权蒙特卡罗加速方法 被引量:1
8
作者 姜广鑫 徐承龙 +1 位作者 寇大治 徐磊 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第5期792-798,共7页
研究蒙特卡罗控制变量方法在CPU(central processing unit)集群和GPU(graphic processing unit)计算环境中的实现问题.以离散取样的随机波动率下的算术平均亚式期权为例,选取合适的控制变量,分别研究了在CPU集群和GPU计算中算法与硬件... 研究蒙特卡罗控制变量方法在CPU(central processing unit)集群和GPU(graphic processing unit)计算环境中的实现问题.以离散取样的随机波动率下的算术平均亚式期权为例,选取合适的控制变量,分别研究了在CPU集群和GPU计算中算法与硬件并行加速两者的运算效率,并讨论了模型参数的变化对计算结果的影响.数值试验表明采用算法与硬件加速相结合的方法可以极大提高计算效率、缩短运算时间. 展开更多
关键词 蒙特卡罗方法 随机波动率 控制变量 CPU(central processing unit)集群计算
下载PDF
波江座α的快速自转多方球模型
9
作者 孔大力 王涛 +1 位作者 寇大治 刘敏 《天文学进展》 CSCD 北大核心 2013年第2期213-222,共10页
波江座α是一颗具有代表性并被比较充分观测的快速自转恒星。以该星为例,建立了一种可以利用有限的观测数据有效反演此类恒星椭球形状及其内部结构的并行数值方法。求解此问题的经典近似方法 (一般)只对慢速旋转的恒星有效,需要对旋转... 波江座α是一颗具有代表性并被比较充分观测的快速自转恒星。以该星为例,建立了一种可以利用有限的观测数据有效反演此类恒星椭球形状及其内部结构的并行数值方法。求解此问题的经典近似方法 (一般)只对慢速旋转的恒星有效,需要对旋转角速度作小扰动假设;而该方法为严格数值求解恒星的旋转多方球模型,对快速旋转的情形仍然保持有效。该方法采用的大规模并行有限元方法,对超级计算设备的性能与计算方法实现的效率都有很高的需求。计算表明,如果有限元网格包含数千万单元水平,则经过充分内存优化的代码在上海超级计算中心曙光5000A超级计算机上运行需要不少于1024核的资源。 展开更多
关键词 并行计算 有限元方法 多方球 快速自转恒星 波江座α
下载PDF
高性能计算系统的可用性检测
10
作者 寇大治 《科研信息化技术与应用》 2013年第4期76-81,共6页
本文针对高性能计算机系统在启动/重新启动之后的可用性和健康度的检测方面提出了一套检测标准,这一标准流程自系统启动/重新启动开始,至系统所提供的相关高性能计算应用服务完备为止,包括一系列标准行为以及相应的检测模块。据此设计... 本文针对高性能计算机系统在启动/重新启动之后的可用性和健康度的检测方面提出了一套检测标准,这一标准流程自系统启动/重新启动开始,至系统所提供的相关高性能计算应用服务完备为止,包括一系列标准行为以及相应的检测模块。据此设计实现了一套针对曙光5000A超级计算机的检测系统并取得了良好的效果。 展开更多
关键词 高性能计算系统 集群系统 可用性检测
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部