期刊文献+
共找到33,617篇文章
< 1 2 250 >
每页显示 20 50 100
基于多绘制管线的大规模并行体绘制性能优化技术
1
作者 王华维 刘若妍 +1 位作者 艾志玮 曹轶 《计算机工程》 CAS CSCD 北大核心 2024年第8期207-215,共9页
针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担... 针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担体绘制任务,从而引起了采样数据并行通信的可扩展性瓶颈。为充分利用国产自主CPU高性能计算机来高效完成体绘制任务,针对大规模并行体绘制提出一种基于多绘制管线的性能优化技术,通过多管线、多进程的两级并行模式来降低单条管线的并行规模。在大规模并行体绘制中,该技术将绘制目标图像划分成多个子区域,绘制进程则相应分组,每个进程组独立执行一条绘制管线,以完成图像相应子区域的绘制,最后再收集所有的图像子区域,形成完整图像并输出。实验结果表明,优化后的体绘制算法在国产自主CPU高性能计算机上可以扩展到万核规模,并能有效完成体绘制任务。 展开更多
关键词 体绘制 多管线 两级并行 并行可扩展性 性能优化
下载PDF
异构系统并行计算软件性能测评分析与实证研究
2
作者 顾蓓蓓 邱霁岩 迟学斌 《数据与计算发展前沿》 CSCD 2024年第3期116-126,共11页
【目的】“并行计算软件性能测评”一直是超算领域重要的研究方向。在异构系统上对计算软件实际性能进行真实测评和分析,可以有效促进对异构系统计算软件生态的良性发展。【方法】本文首先通过调研文献对国内外并行计算软件性能测评方... 【目的】“并行计算软件性能测评”一直是超算领域重要的研究方向。在异构系统上对计算软件实际性能进行真实测评和分析,可以有效促进对异构系统计算软件生态的良性发展。【方法】本文首先通过调研文献对国内外并行计算软件性能测评方法进行研究分析,归纳总结出业界对并行计算软件性能测评的研究划分的3个重要阶段;通过并行计算矩阵乘积Cannon算法对软件的真实性能进行实证分析,并对运行时间和效率等重要指标进行多维度的实验分析。【结果】在同一节点下,不是使用越多的加速卡越能降低该并行程序的运行时间;不同规模矩阵在不使用加速卡和使用单个加速卡两种情况下,程序的并行效率均没有因为节点的增多而发生明显的变化。【结论】在异构系统计算软件中只关注并行效率不能如实反映该软件性能的真实水平。除节点间并行效率因素外,节点内部加速也成为反映并行计算软件真实水平的一项重要测评指标。 展开更多
关键词 异构系统 并行软件 性能测评 并行效率
下载PDF
深度神经网络模型任务切分及并行优化方法
3
作者 巨涛 刘帅 +1 位作者 王志强 李林娟 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第9期2739-2752,共14页
为解决传统手工切分神经网络模型计算任务并行化方法面临的并行化难度大、训练耗时长、设备利用率低等问题,提出了一种基于深度神经网络(DNN)模型特性感知的任务切分及并行优化方法。结合硬件计算环境,对模型计算特性进行动态分析,获取... 为解决传统手工切分神经网络模型计算任务并行化方法面临的并行化难度大、训练耗时长、设备利用率低等问题,提出了一种基于深度神经网络(DNN)模型特性感知的任务切分及并行优化方法。结合硬件计算环境,对模型计算特性进行动态分析,获取模型内部相关性和各类参数属性,构建原始计算任务有向无环图(DAG);利用增强反链,构建DAG节点间可分区聚类的拓扑关系,将原始DAG转换为易于切分的反链DAG;通过拓扑排序生成反链DAG状态序列,并使用动态规划将状态序列切分为不同执行阶段,分析最佳分割点进行模型切分,实现模型分区与各GPU间动态匹配;对批量进行微处理,通过引入流水线并行实现多迭代密集训练,提高GPU利用率,减少训练耗时。实验结果表明:与已有模型切分方法相比,在CIFAR-10数据集上,所提模型切分及并行优化方法可实现各GPU间训练任务负载均衡,在保证模型训练精度的同时,4 GPU加速比达到3.4,8 GPU加速比为3.76。 展开更多
关键词 深度神经网络模型并行 模型切分 流水线并行 反链 并行优化
下载PDF
大规模协同虚拟环境下并行层次兴趣匹配算法
4
作者 郦丽华 《齐齐哈尔大学学报(自然科学版)》 2024年第2期51-55,83,共6页
大规模协同虚拟环境运行过程中易产生大量冗余通信数据,影响虚拟现实技术性能的发挥。为了提升虚拟环境运行效率,提出并行层次兴趣匹配算法。创建协同虚拟环境概念模型,分解处理订阅区域信息,引入树结构理论搭建兴趣管理树,将订阅区域... 大规模协同虚拟环境运行过程中易产生大量冗余通信数据,影响虚拟现实技术性能的发挥。为了提升虚拟环境运行效率,提出并行层次兴趣匹配算法。创建协同虚拟环境概念模型,分解处理订阅区域信息,引入树结构理论搭建兴趣管理树,将订阅区域映射到兴趣管理树节点上,形成层次化结构,结合LSQR并行算法,实现更新区域与订阅区域的快速匹配。实验结果表明,提出算法获得的兴趣匹配消耗时间最小值为0.36 s,兴趣匹配成功指数最大值为0.94,充分证实了提出算法兴趣匹配性能较好。 展开更多
关键词 协同虚拟环境 兴趣匹配 多层次并行 大规模 并行算法 仿真场景
下载PDF
基于混合有限元法的油浸式变压器稳态流-热耦合场并行计算方法 被引量:2
5
作者 刘刚 靳立鹏 +2 位作者 胡万君 刘云鹏 武卫革 《高电压技术》 EI CAS CSCD 北大核心 2024年第5期2259-2269,共11页
针对油浸式变压器2维流-热耦合仿真计算效率低的问题,提出了基于混合有限元法的并行计算方法。首先,在Visual Studio 2019中采用C++语言实现无量纲最小二乘有限元法以及迎风有限元法的串行计算方法。然后,基于图形处理器(graphic proces... 针对油浸式变压器2维流-热耦合仿真计算效率低的问题,提出了基于混合有限元法的并行计算方法。首先,在Visual Studio 2019中采用C++语言实现无量纲最小二乘有限元法以及迎风有限元法的串行计算方法。然后,基于图形处理器(graphic processing unit,GPU)实现流体场的并行计算,针对单分区分匝模型对比分析了不同GPU卡在不同网格条件下的并行计算效率,分析结果表明数据规模越大,GPU卡流处理器越多并行效果越好。其次,基于Intel MKL(Intel math kernel library)函数库结合共享存储并行编程(open multi-processing,OpenMP)实现了2维温度场的并行计算,并对比分析了不同网格数量对并行效率的影响。最后,在此基础上提出了根据不同仿真条件的混合并行计算方法,并应用到大型油浸式变压器绕组模型的2维温升热点分析中。结果表明,相较于串行程序,混合有限元并行计算方法的加速比达到了69.5,实验测试结果进一步验证了并行计算结果的准确性,研究成果为大型油浸式变压器流-热耦合问题的快速计算奠定了基础。 展开更多
关键词 变压器绕组 混合有限元 热点 并行计算 加速比
下载PDF
基于粗细量化并行与TDC混合的CMOS图像传感器列级ADC设计方法 被引量:1
6
作者 郭仲杰 苏昌勖 +3 位作者 许睿明 程新齐 余宁梅 李晨 《电子学报》 EI CAS CSCD 北大核心 2024年第2期486-499,共14页
针对传统单斜式模数转换器(Analog-to-Digital Converter,ADC)和串行两步式ADC在面向大面阵CMOS(Complementary Metal Oxide Semiconductor)图像传感器读出过程中的速度瓶颈问题,本文提出了一种用于高速CMOS图像传感器的全并行ADC设计方... 针对传统单斜式模数转换器(Analog-to-Digital Converter,ADC)和串行两步式ADC在面向大面阵CMOS(Complementary Metal Oxide Semiconductor)图像传感器读出过程中的速度瓶颈问题,本文提出了一种用于高速CMOS图像传感器的全并行ADC设计方法.该方法基于时间共享和时间压缩思想,将细量化时间提前到粗量化时间段内,解决了传统方法的时间冗余问题;同时采用插入式时间差值TDC(Time-to-Digital Converter),实现了全局低频时钟下的快速转换机制.本文基于55-nm 1P4M CMOS工艺对所提方法完成了详细电路设计和全面测试验证,在模拟电压3.3 V,数字电压1.2 V,时钟频率250 MHz,输入电压1.2~2.7 V的情况下,将行时间压缩至825 ns,ADC的微分非线性和积分非线性分别为+0.6/-0.6LSB和+1.6/-1.2LSB,信噪失真比(Signal-to-Noise-and-DistortionRatio,SNDR)为68.271 dB,有效位数(Effective Numbers Of Bits,ENOB)达到11.0489 bit,列不一致性低于0.05%.相比现有的先进ADC,本文提出的方法在保证低功耗、高精度的同时,ADC转换速率提高了87.1%以上,为高速高精度CMOS图像传感器的读出与量化提供了一定的理论支撑. 展开更多
关键词 CMOS图像传感器 并行ADC 单斜式ADC 两步式 并行 时间数字转换器
下载PDF
BELLHOP3D模型的多核并行及性能评估
7
作者 蓝强 马树青 +2 位作者 朴胜春 肖汶斌 王勇献 《声学技术》 CSCD 北大核心 2024年第4期468-473,共6页
通过三维射线模型BELLHOP3D能够计算海洋中的三维声场,在声呐性能预报以及海洋环境参数反演等应用中具有重要意义。然而随着计算海域范围的增大以及计算网格点分辨率的提高,水声传播对计算的需求也逐渐增大。文章面向天河2号超级计算平... 通过三维射线模型BELLHOP3D能够计算海洋中的三维声场,在声呐性能预报以及海洋环境参数反演等应用中具有重要意义。然而随着计算海域范围的增大以及计算网格点分辨率的提高,水声传播对计算的需求也逐渐增大。文章面向天河2号超级计算平台的多核体系结构,针对BELLHOP3D计算特征,充分挖掘其中的并行性,采用OpenMP多核并行技术,实现BELLHOP3D的多核并行。最后,通过Munk波导算例以及三维楔形海底算例对射线模型的并行计算效率进行了测试,当计算节点中的24个计算核心全部用于计算时,两个算例的并行计算效率分别达到了83.3%和87.5%。 展开更多
关键词 BELLHOP3D 声呐性能预报 天河2号 OpenMP多核并行 并行效率
下载PDF
提升PD效率的粒子对方法及信息传递接口并行方法
8
作者 韩康 张媛 +2 位作者 王超 叶礼裕 郭春雨 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2024年第8期1451-1459,共9页
为了避免近场动力方法中粒子间物理信息重复求解消耗的计算成本和占据的额外内存,克服近场动力学低效率计算过程对其工程应用的制约,本文提出一种提升PD计算效率的粒子对方法并建立了该方法的信息传递接口并行方法。利用粒子对方法的信... 为了避免近场动力方法中粒子间物理信息重复求解消耗的计算成本和占据的额外内存,克服近场动力学低效率计算过程对其工程应用的制约,本文提出一种提升PD计算效率的粒子对方法并建立了该方法的信息传递接口并行方法。利用粒子对方法的信息传递接口并行策略并分析其计算效率的优越性,通过大型的工程应用实例给出了本文方法的工程实用性。研究结果表明:粒子对方法的应用不仅提升了计算效率,也优化了邻域粒子信息储存数组占据的内存和计算时间,粒子对方法可与信息传递接口并行编程相结合,能够进一步提升其计算效率,并且在较多线程并行时,计算效率高于OpenMP并行方法,而在实际计算中,加速效果也会受到不同线程间的通信任务影响。 展开更多
关键词 粒子对方法 近场动力学 计算效率 信息传递接口并行 工程应用 数值计算 并行计算 粒子搜索
下载PDF
面向国产异构DCU平台的大规模并行矩量法研究
9
作者 贾瑞鹏 林中朝 +2 位作者 左胜 张玉 杨美红 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2024年第2期76-83,共8页
面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配... 面向国产异构众核处理器超级计算机发展趋势,实现了基于CPU+DCU国产异构并行系统的大规模并行高阶矩量法。在同构并行矩量法负载均衡策略的基础上,提出了一种“MPI+openMP+DCU”的高效异构并行编程框架,解决了计算任务与计算能力不匹配的问题,实现了矩量法异构并行计算过程的负载均衡。采用细粒度任务划分策略与异步通信技术,对深度计算处理器计算过程进行了流水线优化设计,实现了计算与通信重叠,提升了矩量法异构协同计算的效率。通过与有限元法的仿真结果对比,验证了CPU+DCU异构并行矩量法的准确性。基于国产深度计算处理器异构平台的可扩展性分析结果表明,与单纯CPU计算相比,所实现的CPU+DCU异构协同计算方法能够获得5.5~7.0倍的加速效果,且在国家超级计算西安中心能够实现全系统运行,并行规模从360节点扩展到3 600节点(共1 036 800个处理器核心),并行效率可以达到约73.5%。 展开更多
关键词 高阶矩量法 国产异构并行系统 深度计算处理器 异构协同并行计算
下载PDF
基于互信息和融合加权的并行深度森林算法 被引量:1
10
作者 毛伊敏 李文豪 《计算机应用研究》 CSCD 北大核心 2024年第2期473-481,共9页
针对大数据环境下并行深度森林算法中存在不相关及冗余特征过多、多粒度扫描不平衡、分类性能不足以及并行化效率低等问题,提出了基于互信息和融合加权的并行深度森林算法(parallel deep forest algorithm based on mutual information ... 针对大数据环境下并行深度森林算法中存在不相关及冗余特征过多、多粒度扫描不平衡、分类性能不足以及并行化效率低等问题,提出了基于互信息和融合加权的并行深度森林算法(parallel deep forest algorithm based on mutual information and mixed weighting,PDF-MIMW)。首先,在特征降维阶段提出了基于互信息的特征提取策略(feature extraction strategy based on mutual information,FE-MI),结合特征重要性、交互性和冗余性度量过滤原始特征,剔除过多的不相关和冗余特征;接着,在多粒度扫描阶段提出了基于填充的改进多粒度扫描策略(improved multi-granularity scanning strategy based on padding,IMGS-P),对精简后的特征进行填充并对窗口扫描后的子序列进行随机采样,保证多粒度扫描的平衡;其次,在级联森林构建阶段提出了并行子森林构建策略(sub-forest construction strategy based on mixed weighting,SFC-MW),结合Spark框架并行构建加权子森林,提升模型的分类性能;最后,在类向量合并阶段提出基于混合粒子群算法的负载均衡策略(load balancing strategy based on hybrid particle swarm optimization algorithm,LB-HPSO),优化Spark框架中任务节点的负载分配,降低类向量合并时的等待时长,提高模型的并行化效率。实验表明,PDF-MIMW算法的分类效果更佳,同时在大数据环境下的训练效率更高。 展开更多
关键词 Spark框架 并行深度森林 互信息 负载均衡
下载PDF
M-APSK鉴相算法与并行载波同步方法 被引量:1
11
作者 郇浩 任科学 《通信学报》 EI CSCD 北大核心 2024年第3期104-116,共13页
为实现M进制幅相调制(M-APSK)体制下高阶调制信号的相位精细校正,将DVB-S2标准推荐的16APSK和32APSK的Q次方无数据辅助鉴相算法进行了扩展,以应用于64APSK、128APSK和256APSK等高阶调制。针对高阶调制的有效鉴相星座点占比较低时环路工... 为实现M进制幅相调制(M-APSK)体制下高阶调制信号的相位精细校正,将DVB-S2标准推荐的16APSK和32APSK的Q次方无数据辅助鉴相算法进行了扩展,以应用于64APSK、128APSK和256APSK等高阶调制。针对高阶调制的有效鉴相星座点占比较低时环路工作不稳定的问题提出了改进算法,通过对功率归一化后接收符号的幅值进行阈值判决,仅在高于阈值时进行鉴相,低于阈值时则不改变滤波器状态和相位补偿值,以提高星座点的鉴相有效性和可靠性,从而降低入锁门限。针对高速数传的符号速率非常高,而处理器的工作时钟频率相对较低的问题,提出了一种适用于M-APSK的并行载波同步方法,可以满足接收机工作时钟处理需要。相对于传统固定编码调制(CCM)的载波同步环路,该并行方法还可应用于可变编码调制(VCM)体制的频率跟踪。 展开更多
关键词 M进制幅相调制 鉴相 并行 载波同步
下载PDF
扩展帝国竞争算法求解分布式不相关并行机车间调度问题
12
作者 李立山 陶翼飞 +2 位作者 何毅 周国诚 王镜捷 《计算机应用研究》 CSCD 北大核心 2024年第9期2758-2765,共8页
针对考虑加工约束的分布式不相关并行机车间调度问题,以总运输成本、工厂间并行机齐停评价函数和工件种类平均切换次数均衡评价函数为优化目标,提出一种扩展帝国竞争算法进行求解。该算法在原始帝国竞争算法的基础上,增加了适于工厂分... 针对考虑加工约束的分布式不相关并行机车间调度问题,以总运输成本、工厂间并行机齐停评价函数和工件种类平均切换次数均衡评价函数为优化目标,提出一种扩展帝国竞争算法进行求解。该算法在原始帝国竞争算法的基础上,增加了适于工厂分配的初始化工厂-工件序列群;根据传统帝国竞争算法容易陷入局部最优的缺点,将较劣序列同化分为了外部同化机制和内部同化机制,采用局部和全局相结合的搜索方式实现扩展帝国竞争算法的智能搜索行为;采用部分匹配交叉和单点变异更新工厂-工件序列群,保证工厂-工件序列的多样性。最后设计3个不同规模12个算例,通过仿真实验验证所提算法的有效性,同时对比相关领域研究成果验证了该算法在求解分布式多目标不相关并行机调度问题方面的优越性。 展开更多
关键词 扩展帝国竞争算法 分布式不相关并行机车间调度问题 总运输成本 工厂间并行机齐停评价函数 工厂间工件种类平均切换次数均衡评价函数
下载PDF
基于并行融合深度残差收缩网络的有源配电网故障诊断
13
作者 冯骥 杨国华 +4 位作者 史磊 潘欢 陆宇翔 张元曦 李祯 《综合智慧能源》 CAS 2024年第6期8-15,共8页
针对含分布式电源的配电网故障呈现方式多样化以及故障诊断易受分布式电源类型、输出功率等非线性因素影响等问题,提出一种基于并行融合深度残差收缩网络(P-FDRSN)的故障诊断模型。首先,构建具有故障识别支路和故障定位支路的并行网络... 针对含分布式电源的配电网故障呈现方式多样化以及故障诊断易受分布式电源类型、输出功率等非线性因素影响等问题,提出一种基于并行融合深度残差收缩网络(P-FDRSN)的故障诊断模型。首先,构建具有故障识别支路和故障定位支路的并行网络结构——P-FDRSN,在残差模块中引入收缩机制,减少网络中噪声或冗余信息的影响,提高网络对噪声的鲁棒性;其次,将故障录波信号波形幅值变化转换为灰度图和时频图,送入深度残差收缩网络进行深度特征提取并在汇聚层中将获取的特征进行融合,以增强故障录波信号的特征学习能力。仿真结果表明:在不同分布式电源类型和不同输出功率下,模型故障定位与识别精度均能保持在98.75%和97.25%以上,即使在噪声干扰的情况下,诊断准确率仍可保持在96.75%以上,模型具有较高的精度和较好的自适应性。 展开更多
关键词 有源配电网 分布式电源 故障诊断 并行网络结构 并行融合深度残差收缩网络
下载PDF
基于异构系统的多级并行稀疏张量向量乘算法
14
作者 陈玥丹 肖国庆 +3 位作者 阳王东 金纪勇 龙军 李肯立 《计算机学报》 EI CSCD 北大核心 2024年第2期441-455,共15页
张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,... 张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,SpTV)是张量分解中最基础、耗时最多的运算之一.为加速大数据和人工智能相关应用的运行效率,本文提出了基于CPU-GPU异构结构的多级并行SpTV加速算法.首先,为了将SpTV运算映射到混合、多级并行的分布式CPU-GPU异构多/众核构架,本文设计了一种多维并行SpTV划分方法,采用面向节点级并行的N-1维张量划分和面向GPU线程级并行的矩阵划分,充分利用计算节点间和节点内的多级并行计算能力.其次,设计了一种基于稀疏张量纤维的压缩存储格式,压缩稀疏张量的内存占用,优化SpTV运算的计算和访存模式.最后,提出了基于多流并行的异构高效SpTV算法,进一步设计了稀疏张量的细粒度划分方法、多流并行运行机制和基于张量块排序的多流并行优化技术,实现了SpTV运算中通信开销和计算开销的相互重叠与隐藏.实验结果表明,与相关工作aeSpTV相比,所提出的SpTV算法在所有测试数据集上最高能够获得3.28倍的加速比. 展开更多
关键词 CPU-GPU 异构并行计算 多级并行 稀疏张量 张量运算
下载PDF
基于HDF5的多层次结构并行IO算法
15
作者 马文鹏 翟环欣 +1 位作者 李瑞莹 袁武 《信阳师范学院学报(自然科学版)》 CAS 2024年第4期433-441,共9页
针对大规模数据输入输出的应用场景,提出了一种基于层次存储格式HDF5(Hierarchical Data Format 5)的多层次并行IO(Input/Output)方案。该并行IO方案分为节点间和节点内两层:节点间以节点为单位IO数据并允许节点内部协同或独立工作,根... 针对大规模数据输入输出的应用场景,提出了一种基于层次存储格式HDF5(Hierarchical Data Format 5)的多层次并行IO(Input/Output)方案。该并行IO方案分为节点间和节点内两层:节点间以节点为单位IO数据并允许节点内部协同或独立工作,根据节点内部的工作方式分别提出了多层次并行IO算法和多层次哨兵并行IO算法,以有效提升IO效率并避免输出文件冗余。考虑异构计算和纯CPU计算两个典型应用场景,分别在曙光平台和Intel平台进行最大核数为4096、最大数据量为256G的多组实验。结果表明,多层次并行IO算法IO效率提高了1.97~25.87倍,多层次哨兵并行IO算法IO效率提高了6.53~9.36倍,且输出文件数量减少到多区并行IO算法的1/4和1/32。 展开更多
关键词 层次存储格式 大规模并行计算 并行IO 数据存储
下载PDF
基于相对熵和余弦相似度的并行SVM算法
16
作者 毛伊敏 郭斌斌 +1 位作者 易见兵 陈志刚 《计算机集成制造系统》 EI CSCD 北大核心 2024年第9期3183-3198,共16页
针对大数据环境下并行支持向量机(SVM)算法存在子集分布偏差大,并行效率低以及过滤非支持向量不准确等问题,提出了基于相对熵和余弦相似度的并行SVM算法(RC-PSVM)。该算法首先提出基于相对熵的数据划分策略(DPRE),平衡当前子集和原始数... 针对大数据环境下并行支持向量机(SVM)算法存在子集分布偏差大,并行效率低以及过滤非支持向量不准确等问题,提出了基于相对熵和余弦相似度的并行SVM算法(RC-PSVM)。该算法首先提出基于相对熵的数据划分策略(DPRE),平衡当前子集和原始数据集的相对熵,划分样本到适合的子集,降低子集分布偏差;然后提出基于余弦相似度的冗余层级检测策略(CS-RLDS),计算相邻层局部SVM之间法向量的余弦相似度,比较设定的阈值与相似度,识别并停止冗余层级,提高了并行效率;最后提出非支持向量过滤策略(NSVF),结合样本到多个局部支持向量模型决策边界的距离,计算支持向量相似度来识别非支持向量,解决了过滤非支持向量不准确的问题。实验表明,RC-PSVM算法的分类效果更佳,且在大数据下的运行效率更高。 展开更多
关键词 大数据 MAPREDUCE框架 并行支持向量机 相对熵 余弦相似度
下载PDF
离散时间的完全服务并行优化轮询排队系统特性分析
17
作者 保利勇 丁新昱 +2 位作者 丁洪伟 官铮 葛俊阳 《电子学报》 EI CAS CSCD 北大核心 2024年第3期838-848,共11页
轮询是一种依次有序服务的系统资源动态调度机制.针对服务器在站点间查询、服务和转移过程中的流水线作业方式导致了系统整体服务效率较低的问题,本文提出了完全服务的并行优化轮询系统.首先,构建了系统的单服务器多队列排队模型和相应... 轮询是一种依次有序服务的系统资源动态调度机制.针对服务器在站点间查询、服务和转移过程中的流水线作业方式导致了系统整体服务效率较低的问题,本文提出了完全服务的并行优化轮询系统.首先,构建了系统的单服务器多队列排队模型和相应的系统状态方程,并精确解析出系统特性参数的完整数学解析表达式.此外,还提出了一种系统状态稳定性的判定方法,对不同负载状态下的系统稳定性进行了定量分析.计算机仿真的统计分析结果与理论计算值相一致.最后,系统性能分析表明,在保持周期性、无冲突服务的基础上,系统的队长、时延特性和稳定状态下负载能力均得到了较大的提高. 展开更多
关键词 轮询 并行优化调度 完全服务 队长特性 时延特性 系统稳定性
下载PDF
任意起伏地形下重力异常三维正演及并行计算
18
作者 戴世坤 朱德祥 +4 位作者 张莹 李昆 陈轻蕊 凌嘉宣 田红军 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2024年第2期768-780,共13页
为了进一步提高空间-波数域三维重力异常正演算法的适用范围和计算效率,本文采用任意傅里叶变换算法实现了空间-波数域三维重力异常正演,且在NVIDIA CUDA平台上进行CPU-GPU并行加速.任意傅里叶变换算法的基本思想是将二维傅里叶变换转... 为了进一步提高空间-波数域三维重力异常正演算法的适用范围和计算效率,本文采用任意傅里叶变换算法实现了空间-波数域三维重力异常正演,且在NVIDIA CUDA平台上进行CPU-GPU并行加速.任意傅里叶变换算法的基本思想是将二维傅里叶变换转化为两个一维傅里叶变换,一维傅里叶变换积分离散为多个单元积分累加和,离散单元中原函数采用二次插值形函数拟合,求出单元积分的解析表达式.相比现有的傅里叶变换算法,新方法具有采样灵活、积分精度高、计算速度快和傅里叶变换的截断效应小等优势.利用空间-波数域算法的高度并行性,采用CPU并行求解常微分方程,GPU并行计算任意傅里叶变换,实现了CPU-GPU并行加速方案,进一步提升了本文算法效率.利用常密度模型,对比数值解和解析解,结果表明本文算法正确;利用变密度模型对比了任意傅里叶变换算法与高斯快速傅里叶变换算法的计算效率与精度,在相近的数值精度下,本文算法波数选取少,效率高;测试CPU-GPU并行效果,结果表明相比CPU串行算法,CPU-GPU并行算法的计算效率大大提升,千万数量级节点数模型正演仅耗时数秒.最后利用实际地形数据进行三维重力异常场数值模拟,证明了新方法的高效性与实用性,对实现大规模复杂条件下重力异常精细化反演成像与综合解释有重要意义. 展开更多
关键词 空间-波数域 任意傅里叶变换 三维重力异常正演 CPU-GPU并行
下载PDF
通过包络面重构的大规模粒子并行绘制算法
19
作者 王华维 艾志玮 曹轶 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第5期219-227,共9页
针对大规模粒子高表现可视化需求,提出基于包络面重构的大规模粒子并行绘制算法。该算法以连续曲面的形式表示,绘制大规模粒子的团簇表面及其物理量分布。对算法进行了分布式并行化,从而可以通过大规模并行来处理亿以上规模的粒子数据... 针对大规模粒子高表现可视化需求,提出基于包络面重构的大规模粒子并行绘制算法。该算法以连续曲面的形式表示,绘制大规模粒子的团簇表面及其物理量分布。对算法进行了分布式并行化,从而可以通过大规模并行来处理亿以上规模的粒子数据。在算法实现上,还解决了并行计算时的块间裂缝问题,并提出了快速查找邻域粒子的方法,同时,基于可见性对粒子数据进行剔除,提高了绘制效率。由此,可以通过带光照效果的光滑曲面来高表现展示大规模粒子数据中的团簇结构及其物理量分布。实验结果表明,该算法在512核上可在5 s内完成上亿粒子的绘制,并行效率可达60%。该算法已成功应用到大规模并行非平衡分子动力学模拟等实际模拟应用中。 展开更多
关键词 粒子可视化 包络面 距离场 分布式并行 可见性剔除
下载PDF
微酸性电解水-超声波并行联合处理对鲜切生菜表面大肠杆菌杀菌效果的影响
20
作者 高晴 刘培红 +2 位作者 冉苒 范江平 和劲松 《食品科学》 EI CAS CSCD 北大核心 2024年第11期210-216,共7页
为探明微酸性电解水(slightly acidic electrolyzed water,SAEW)与超声波(ultrasonic,US)并行联合处理对鲜切生菜表面大肠杆菌(Escherichia coli)的杀菌效应,本研究在不同料液比(1∶5、1∶10、1∶15(g/mL))和不同温度(25、35、45℃)条... 为探明微酸性电解水(slightly acidic electrolyzed water,SAEW)与超声波(ultrasonic,US)并行联合处理对鲜切生菜表面大肠杆菌(Escherichia coli)的杀菌效应,本研究在不同料液比(1∶5、1∶10、1∶15(g/mL))和不同温度(25、35、45℃)条件下采用SAEW-US并行联合处理鲜切生菜,并用平板计数法测定生菜表面E.coli菌落数,对菌落数的变化情况进行协同效应分析及动力学分析。采用流式细胞术和双层培养计数法对处理后的E.coli进行亚致死损伤检测。结果表明,SAEW-US并行联合处理的杀灭E.coli效力高于SAEW单一作用时的杀灭E.coli效力,随着处理时间的延长、溶剂用量的增加和温度的提高,杀灭E.coli效果显著增强。SAEW-US并行联合处理对于杀灭E.coli具有“1+1>2”的协同效应,且杀菌过程遵循一级动力学模型。SAEW-US并行联合处理比单独SAEW处理杀灭E.coli效果强,并且能降低E.coli亚致死损伤数量。综上可知,SAEW-US并行联合处理鲜切生菜表面E.coli存在协同效应,相关结果可为鲜食农产品的杀菌提供理论依据。 展开更多
关键词 微酸性电解水 超声波 并行联合处理 大肠杆菌杀菌动力学 协同效应
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部