介绍了一种基于XPE的嵌入式DVR系统的设计与实现方法。该系统采用英特尔凌动处理器作为硬件平台,采用Win-dows XP Embedded with SP2作为软件平台,能有效克服目前嵌入式DVR处理性能有限而PC式DVR配机繁琐与兼容性问题及不稳定因素。详...介绍了一种基于XPE的嵌入式DVR系统的设计与实现方法。该系统采用英特尔凌动处理器作为硬件平台,采用Win-dows XP Embedded with SP2作为软件平台,能有效克服目前嵌入式DVR处理性能有限而PC式DVR配机繁琐与兼容性问题及不稳定因素。详细介绍了XPE操作系统的开发过程以及FBWF写保护功能的原理和实现方法。基于该方案设计的嵌入式DVR系统经过实际测试,达到了预期的设计效果。展开更多
分子动力学(MD)模拟是研究硅纳米薄膜热力学性质的主要方法,但存在数据处理量大、计算密集、原子间作用模型复杂等问题,限制了MD模拟的深入应用。针对晶硅分子动力学模拟算法中数据访问不连续和大量分支判断造成并行资源浪费、线程等待...分子动力学(MD)模拟是研究硅纳米薄膜热力学性质的主要方法,但存在数据处理量大、计算密集、原子间作用模型复杂等问题,限制了MD模拟的深入应用。针对晶硅分子动力学模拟算法中数据访问不连续和大量分支判断造成并行资源浪费、线程等待等问题,结合Nvidia Tesla V100 GPU硬件体系结构特点,对晶硅MD模拟算法进行设计。通过全局内存的合并访存、循环展开、原子操作等优化方法,利用GPU强大并行计算和浮点运算能力,减少显存访问及算法执行过程中的分支冲突和判断指令,提升算法整体计算性能。测试结果表明,优化后的晶硅MD模拟算法的计算速度相比于优化前提升了1.69~1.97倍,相比于国际上主流的GPU加速MD模拟软件HOOMDblue和LAMMPS分别提升了3.20~3.47倍和17.40~38.04倍,具有较好的模拟加速效果。展开更多
文摘介绍了一种基于XPE的嵌入式DVR系统的设计与实现方法。该系统采用英特尔凌动处理器作为硬件平台,采用Win-dows XP Embedded with SP2作为软件平台,能有效克服目前嵌入式DVR处理性能有限而PC式DVR配机繁琐与兼容性问题及不稳定因素。详细介绍了XPE操作系统的开发过程以及FBWF写保护功能的原理和实现方法。基于该方案设计的嵌入式DVR系统经过实际测试,达到了预期的设计效果。
文摘分子动力学(MD)模拟是研究硅纳米薄膜热力学性质的主要方法,但存在数据处理量大、计算密集、原子间作用模型复杂等问题,限制了MD模拟的深入应用。针对晶硅分子动力学模拟算法中数据访问不连续和大量分支判断造成并行资源浪费、线程等待等问题,结合Nvidia Tesla V100 GPU硬件体系结构特点,对晶硅MD模拟算法进行设计。通过全局内存的合并访存、循环展开、原子操作等优化方法,利用GPU强大并行计算和浮点运算能力,减少显存访问及算法执行过程中的分支冲突和判断指令,提升算法整体计算性能。测试结果表明,优化后的晶硅MD模拟算法的计算速度相比于优化前提升了1.69~1.97倍,相比于国际上主流的GPU加速MD模拟软件HOOMDblue和LAMMPS分别提升了3.20~3.47倍和17.40~38.04倍,具有较好的模拟加速效果。