期刊文献+
共找到690篇文章
< 1 2 35 >
每页显示 20 50 100
Ultra-Fast Next Generation Human Genome Sequencing Data Processing Using DRAGEN<sup>TM</sup>Bio-IT Processor for Precision Medicine 被引量:3
1
作者 Amit Goyal Hyuk Jung Kwon +5 位作者 Kichan Lee Reena Garg Seon Young Yun Yoon Hee Kim Sunghoon Lee Min Seob Lee 《Open Journal of Genetics》 2017年第1期9-19,共11页
Slow speed of the Next-Generation sequencing data analysis, compared to the latest high throughput sequencers such as HiSeq X system, using the current industry standard genome analysis pipeline, has been the major fa... Slow speed of the Next-Generation sequencing data analysis, compared to the latest high throughput sequencers such as HiSeq X system, using the current industry standard genome analysis pipeline, has been the major factor of data backlog which limits the real-time use of genomic data for precision medicine. This study demonstrates the DRAGEN Bio-IT Processor as a potential candidate to remove the “Big Data Bottleneck”. DRAGENTM accomplished the variant calling, for ~40× coverage WGS data in as low as ~30 minutes using a single command, achieving the over 50-fold data analysis speed while maintaining the similar or better variant calling accuracy than the standard GATK Best Practices workflow. This systematic comparison provides the faster and efficient NGS data analysis alternative to NGS-based healthcare industries and research institutes to meet the requirement for precision medicine based healthcare. 展开更多
关键词 NGS data Analysis BWA-GATK DRAGEN Bio-IT processor Genomics INDEL Mapping
下载PDF
基于ARM处理器的温室大棚智能监控系统设计
2
作者 孙启昌 胡国强 《工业仪表与自动化装置》 2024年第3期9-14,共6页
为了实现温室大棚的智能监测与控制,设计基于ARM处理器的温室大棚智能监控系统。系统分为三个部分:数据采集及设备控制终端、智能网关终端、Android手机客户端,数据采集及设备控制终端以ARM微处理为核心,通过传感器、算法、Wi-Fi等技术... 为了实现温室大棚的智能监测与控制,设计基于ARM处理器的温室大棚智能监控系统。系统分为三个部分:数据采集及设备控制终端、智能网关终端、Android手机客户端,数据采集及设备控制终端以ARM微处理为核心,通过传感器、算法、Wi-Fi等技术,实现温室大棚数据采集、数据处理、数据传输及执行设备的智能控制,智能网关终端实现多个温室大棚数据从内网发送至公网,Android手机客户端实现数据的接收与发送。经测试验证,系统能够实现温室大棚的智能监控。 展开更多
关键词 ARM处理器 数据采集 智能网关 算法 手机客户端
下载PDF
嵌入式处理器自定义指令迭代识别方法仿真
3
作者 王前莉 李颖 《计算机仿真》 2024年第8期276-280,共5页
嵌入式系统中的硬件资源是有限的,并且自定义指令和原始指令之间可能存在冲突,导致指令代码识别精准度降低、运行功耗较高。为此,提出嵌入式处理器自定义指令迭代低功耗识别方法。对嵌入式处理器的指令代码展开可视化处理,将指令图像输... 嵌入式系统中的硬件资源是有限的,并且自定义指令和原始指令之间可能存在冲突,导致指令代码识别精准度降低、运行功耗较高。为此,提出嵌入式处理器自定义指令迭代低功耗识别方法。对嵌入式处理器的指令代码展开可视化处理,将指令图像输入卷积神经网络中,检测指令代码中存在的恶意代码,采用开源编译器将代码转变为控制数据流图,枚举并选择子图,通过代码转换完成嵌入式处理器自定义指令识别。仿真结果表明,所提方法的恶意代码检测精度高、代码识别准确率高,始终保持在70%以上,平均能耗仅为89J。 展开更多
关键词 嵌入式处理器 恶意代码检测 自定义指令 控制数据流图 指令识别
下载PDF
数据确权的槌定之路:论证数据确权必要性
4
作者 赵艳娜 陈娜 《科技创业月刊》 2024年第5期165-169,共5页
数据作为一项新型财产已经被我国《民法典》确认为民事权益客体,大数据时代背景下数据价值日益凸显,数据交易渐趋普遍,数据是否应当确权引起了社会和学术界的广泛探讨,却没有体现在法律法规上。数据确权是数据立法需要解决的关键问题,... 数据作为一项新型财产已经被我国《民法典》确认为民事权益客体,大数据时代背景下数据价值日益凸显,数据交易渐趋普遍,数据是否应当确权引起了社会和学术界的广泛探讨,却没有体现在法律法规上。数据确权是数据立法需要解决的关键问题,对数据确权的首要前提是剖析数据确权的缺位引发的问题,继而论证确权的必要性。作为数据相关权利之一的数据财产权对数据处理者而言具有重要意义,合法化并合理化该项权利是立法者不容忽视的。数据确权是当前立法界亟待加速推动解决的重要议题,明确数据权属有利于助力数字经济快速发展。 展开更多
关键词 数据确权 数据财产权 数据处理者 数据流通
下载PDF
基于PCIE的多嵌入式人工智能处理器低延迟数据交换技术
5
作者 魏璇 温凯林 +3 位作者 李斌 刘淑涛 褚洁 蔡觉平 《电子科技》 2024年第5期32-37,46,共7页
针对多嵌入式人工智能(Artificial Intelligence,AI)处理器板卡之间的任务调度和数据交换冲突以及提高多板卡堆叠扩展时的可靠性和运行效率问题,文中提出了一种虫洞交换结构多嵌入式人工智能处理器高速数据交换技术和数据帧结构的解决... 针对多嵌入式人工智能(Artificial Intelligence,AI)处理器板卡之间的任务调度和数据交换冲突以及提高多板卡堆叠扩展时的可靠性和运行效率问题,文中提出了一种虫洞交换结构多嵌入式人工智能处理器高速数据交换技术和数据帧结构的解决方法。该方法基于PCIE(PCI Express)高速数据接口,将数据以数据单元的形式进行信息传递,并设计多重权重决策算法避免数据传输中的冲突,实现任务的并发多线程处理。搭建FPGA(Field Programmable Gate Array)平台进行设计和测试,结果表明PCIE的传输带宽利用效率达到了85%以上,数据交换延迟小于20μs,系统中断任务响应平均最大延迟时间为8.775μs。该技术适用于多处理器协同的高速交换电路,可扩展至混合PCIE和RapidIO交换电路结构。 展开更多
关键词 嵌入式人工智能处理器 数据交换 外围组件互连快速 PCI Express 交换开关 虫洞技术 数据仲裁 多重权重决策
下载PDF
人工智能时代公共数据处理者权责配置探讨
6
作者 张冬梅 《科技与法律(中英文)》 CSSCI 2024年第5期37-45,共9页
人工智能时代的公共数据不仅释放了经济和社会价值,而且成为推动社会治理现代化、促进数字经济高质量发展和实现国家治理体系与治理能力现代化的关键力量。公共数据处理者的权责配置应当与人工智能发展水平相适应。当前公共数据的数据... 人工智能时代的公共数据不仅释放了经济和社会价值,而且成为推动社会治理现代化、促进数字经济高质量发展和实现国家治理体系与治理能力现代化的关键力量。公共数据处理者的权责配置应当与人工智能发展水平相适应。当前公共数据的数据处理者权责不够清晰和周延,限制了公共数据开放和利用的进一步发展。根据权责对等原则,在处理公共数据时,应当赋予不同主体以不同的职责和权限。为此提出公共数据处理者权责配置思路是从数据确权到数据管理运营权的确立,构建公共数据处理者管理、运营、开发的权责体系,并在此基础上明确公共数据处理者责任主体范围、建立多维风险防范措施、平衡数据开放与个人信息及隐私保护、强化数据开放和获取的公平性等公共数据处理者权责配置具体措施。 展开更多
关键词 人工智能 公共数据 数据处理 权责配置
下载PDF
输电线路在线监测数据处理系统的设计与实现
7
作者 史文迪 华雪莹 +1 位作者 姚为方 徐鹏 《自动化仪表》 CAS 2024年第11期58-63,共6页
为了解决输电线路在线监测数据处理能力不足的问题,对输电线路在线监测数据处理系统的设计与实现开展研究。该系统硬件由分布式光传感监测模块、数据采集模块、数据处理模块和结果输出模块四部分组成。在软件设计部分:首先给出了检测参... 为了解决输电线路在线监测数据处理能力不足的问题,对输电线路在线监测数据处理系统的设计与实现开展研究。该系统硬件由分布式光传感监测模块、数据采集模块、数据处理模块和结果输出模块四部分组成。在软件设计部分:首先给出了检测参数;然后结合参数,设计了数据采集算法和数据处理分析算法,获取了可信度更高的优化数据;最后从覆冰、舞动、雷击三个角度分析监测数据,以评估输电线路实时风险。各模块分工明确,共同组成输电线路分布式光传感在线监测数据处理系统。试验结果表明:使用该系统对输电线路监测数据进行处理后,日较差误差不超过3℃、加速度波形和位移波形与实际波形之间的误差不超过0.5 m/s^(2),可准确获取跳闸时间;获取的故障点雷电流为100%正确。该系统能够精准监测覆冰区域、输电线路舞动情况和雷击情况,对覆冰、舞动、雷击的监测能力均较强,具有较好的工作性能。 展开更多
关键词 输电线路 分布式光传感技术 光纤 数据采集 数据处理器 覆冰监测 舞动监测 雷击监测
下载PDF
浮点数字信号处理器Data-RAM的RTL模型设计
8
作者 胡正伟 仲顺安 陈禾 《北京理工大学学报》 EI CAS CSCD 北大核心 2007年第1期68-72,共5页
提出了一种双精度浮点数字信号处理器Data-RAM的RTL模型设计方法.分析了Data-RAM的结构和访问机制,采用自顶向下的方法和VHDL语言,实现了Data-RAM的RTL模型设计并验证了其功能的正确性.该模型支持3地址独立进行数据存取,支持字节、半字... 提出了一种双精度浮点数字信号处理器Data-RAM的RTL模型设计方法.分析了Data-RAM的结构和访问机制,采用自顶向下的方法和VHDL语言,实现了Data-RAM的RTL模型设计并验证了其功能的正确性.该模型支持3地址独立进行数据存取,支持字节、半字、字的读写访问和双字的读访问.在访问地址不冲突的前提下,最大可以在同一时钟周期进行2次64 bit的读操作和1次32 bit读写操作.Data-RAM的RTL模型设计为门级和物理级的性能设计提供了参考. 展开更多
关键词 数字信号处理器 data-RAM RTL模型
下载PDF
面向FT-M7002平台拉普拉斯算法的优化实现
9
作者 郭子涵 范明亮 +1 位作者 李靖 商建东 《计算机应用与软件》 北大核心 2024年第10期276-281,361,共7页
为了充分发挥国产FT高性能处理器的平台优势,针对其对拉普拉斯算法进行并行优化,在数据迁移的基础上使用DMA数据传输机制解决数组矩阵转置、数据访问不连续以及数据传输存在时间间隙的问题,提高了程序性能,充分发掘了程序的数据级和指... 为了充分发挥国产FT高性能处理器的平台优势,针对其对拉普拉斯算法进行并行优化,在数据迁移的基础上使用DMA数据传输机制解决数组矩阵转置、数据访问不连续以及数据传输存在时间间隙的问题,提高了程序性能,充分发掘了程序的数据级和指令级并行性。实验结果表明,优化后的向量化并行算法较优化前,获得了2.02~2.55倍的加速效果。相较于TMS320C6678处理器,FT优化之后的算法可达到其1.48~2.56倍的效果。 展开更多
关键词 高性能处理器 拉普拉斯算法 并行优化 DMA数据传输
下载PDF
x86处理器向量条件访存指令安全脆弱性分析
10
作者 李丹萍 朱子元 +1 位作者 史岗 孟丹 《计算机学报》 EI CAS CSCD 北大核心 2024年第3期525-543,共19页
单指令多数据流(Single Instruction stream,Multiple Data streams,SIMD)是一种利用数据级并行提高处理器性能的技术,旨在利用多个处理器并行执行同一条指令增加数据处理的吞吐量.随着大数据、人工智能等技术的兴起,人们对数据并行化... 单指令多数据流(Single Instruction stream,Multiple Data streams,SIMD)是一种利用数据级并行提高处理器性能的技术,旨在利用多个处理器并行执行同一条指令增加数据处理的吞吐量.随着大数据、人工智能等技术的兴起,人们对数据并行化处理的需求不断提高,这使得SIMD技术愈发重要.为了支持SIMD技术,Intel和AMD等x86处理器厂商从1996年开始在其处理器中陆续引入了MMX(MultiMedia Extensions)、SSE(Streaming SIMD Extensions)、AVX(Advanced Vector eXtensions)等SIMD指令集扩展.通过调用SIMD指令,程序员能够无需理解SIMD技术的硬件层实现细节就方便地使用它的功能.然而,随着熔断、幽灵等处理器硬件漏洞的发现,人们逐渐认识到并行优化技术是一柄双刃剑,它在提高性能的同时也能带来安全风险.本文聚焦于x86 SIMD指令集扩展中的VMASKMOV指令,对它的安全脆弱性进行了分析.本文的主要贡献如下:(1)利用时间戳计数器等技术对VMASKMOV指令进行了微架构逆向工程,首次发现VMASKMOV指令与内存页管理和CPU Fill Buffer等安全风险的相关性;(2)披露了一个新的处理器漏洞EvilMask,它广泛存在于Intel和AMD处理器上,并提出了3个EvilMask攻击原语:VMASKMOVL+Time(MAP)、VMASKMOVS+Time(XD)和VMASKMOVL+MDS,可用于实施去地址空间布局随机化攻击和进程数据窃取攻击;(3)给出了2个EvilMask概念验证示例(Proof-of-Concept,PoC)验证了EvilMask对真实世界的信息安全危害;(4)讨论了针对EvilMask的防御方案,指出最根本的解决方法是在硬件层面上重新实现VMASKMOV指令,并给出了初步的实现方案. 展开更多
关键词 处理器安全 单指令多数据流(SIMD) 微体系结构侧信道攻击 VMASKMOV指令 地址空间布局随机化(ASLR)
下载PDF
基于阵列处理器的HEVC数据流图可重构实现
11
作者 胡传瞻 蒋林 +3 位作者 朱筠 谢晓燕 杨坤 崔馨月 《计算机应用与软件》 北大核心 2024年第3期240-245,257,共7页
提出一种基于阵列处理器的HEVC算法数据流图可重构实现方法。基于动态重构机制完成不同的划分方式、算法间的灵活切换,采用深度优先贪婪对数据流图划分后子任务时域流水的并行方式对HEVC中典型编码算法的数据流图重新划分后设计合理映... 提出一种基于阵列处理器的HEVC算法数据流图可重构实现方法。基于动态重构机制完成不同的划分方式、算法间的灵活切换,采用深度优先贪婪对数据流图划分后子任务时域流水的并行方式对HEVC中典型编码算法的数据流图重新划分后设计合理映射方案,以Sobel算子值为重构依据在阵列处理器上进行帧内预测算法验证。实验结果表明,与块间流水方案实现相比加速比可达14.97,各算法资源利用率及计算速度均有提升,与帧内预测模式选择快速算法相比每个时钟周期可多处理7.1个像素。 展开更多
关键词 数据流图 HEVC 深度优先贪婪 可重构阵列处理器
下载PDF
基于高密度计算的多核处理器电力芯片低功耗设计系统
12
作者 匡晓云 黄开天 杨祎巍 《电子设计工程》 2024年第7期6-9,15,共5页
多核处理器电力芯片是目前多种系统的重要组成部分,设计低功耗电力芯片,能够更好地保证系统正常运行。目前设计的电力芯片低功耗系统运行速度较慢,功耗难以达到用户要求,为此该文应用高密度计算设计了一种多核处理器电力芯片低功耗系统... 多核处理器电力芯片是目前多种系统的重要组成部分,设计低功耗电力芯片,能够更好地保证系统正常运行。目前设计的电力芯片低功耗系统运行速度较慢,功耗难以达到用户要求,为此该文应用高密度计算设计了一种多核处理器电力芯片低功耗系统。兼容系统多核处理器与层次化AHB总线,探索处理器电力芯片的整体结构,集中处理存储数据信息,不断调整系统算法参数,通过高密度分析引入矩阵进行数据解析,确保运行过程的安全性。在分析处理器调度性能的基础上,利用高密度处理对数据进行层次化处理,避免数据冗余造成的系统运行故障。实验结果表明,引入所设计系统后电力芯片功耗减少了60%,加速比达到3.992,可以有效提高电力芯片运行性能。 展开更多
关键词 高密度计算 多核处理器 电力芯片 低功耗设计 存储数据
下载PDF
论衍生数据的知识产权保护模式 被引量:14
13
作者 陶乾 李衍泽 《大连理工大学学报(社会科学版)》 CSSCI 北大核心 2023年第4期94-101,共8页
数字经济时代,衍生数据蕴藏着巨大商业价值。就其法律保护问题,国内外主要存在赋权模式和行为规制模式两种观点。衍生数据具备财产属性,属于我国《民法典》所保护的权益。若仅以《反不正当竞争法》下的行为规制模式对其提供保护,无法对... 数字经济时代,衍生数据蕴藏着巨大商业价值。就其法律保护问题,国内外主要存在赋权模式和行为规制模式两种观点。衍生数据具备财产属性,属于我国《民法典》所保护的权益。若仅以《反不正当竞争法》下的行为规制模式对其提供保护,无法对衍生数据的利用和权利限制进行全面的制度安排,亦无法有效平衡各方主体利益。相比之下,赋权模式是激励数据生产和投资的重要保障。基于衍生数据的形成机理及对其进行保护所遵循的价值理念,将其置于知识产权制度体系下具有正当性。根据人类在数据生成过程中的参与程度,可以将衍生数据区分为有创作性投入的衍生数据和无创作性投入的衍生数据,前者用著作权保护模式,后者用邻接权保护模式。数据赋权可供选择的路径之一是在知识产权制度体系内创设一项数据处理者权,用以保护衍生数据生产者运用人工智能、数据挖掘等技术所产出的数据产品。为了平衡多方利益,还应当通过增设合理使用情形、设定期限等方式,对数据处理者权加以适当限制。 展开更多
关键词 衍生数据 知识产权 数据产权 邻接权 数据处理者
下载PDF
处理器值预测技术研究
14
作者 黄立波 杨凌 +5 位作者 杨乾明 马胜 王永文 隋兵才 沈立 徐炜遐 《电子学报》 EI CAS CSCD 北大核心 2023年第12期3591-3618,共28页
当今的处理器性能与存储器带宽和延迟严重失衡的问题限制了计算系统的整体性能,而存储器的性能对制程工艺不敏感,在后摩尔时代下很难再通过集成电路制造工艺的迭代获得处理器性能收益,因此人们更多地想通过体系结构的创新获得更高性能... 当今的处理器性能与存储器带宽和延迟严重失衡的问题限制了计算系统的整体性能,而存储器的性能对制程工艺不敏感,在后摩尔时代下很难再通过集成电路制造工艺的迭代获得处理器性能收益,因此人们更多地想通过体系结构的创新获得更高性能的计算系统.处理器值预测技术是一种能在无需改变存储系统情况下有效缓解存储墙问题的解决方案,其通过预测性地打破数据真相关进而让更多的指令可以在乱序处理器中并行执行,而无需等待由于访存等操作造成的长周期指令执行.近年来,值预测在各个方面都有了实质性的进步,但现如今还没有商用处理器使用这一技术,这主要是由于值预测技术的使用还面临许多挑战:现有的处理器的流水线架构不能直接使用值预测技术;值预测所需的预测值传递机制需要额外的硬件资源开销;值预测器巨大的存储开销让其很难在片上实现;由于值预测错误时的性能惩罚大,因此预测准确率较低的值预测器会降低处理器性能.针对这些问题,本文以值预测技术为中心,围绕值预测技术相关的流水线架构、值预测器结构和错误恢复机制三个方面分别详细论述了国内外研究成果以及其对于各个问题挑战的解决策略.最后,本文对当今的处理器值预测技术进行了总结并对未来的研究方向进行了展望. 展开更多
关键词 值预测 数据依赖 处理器 流水线 存储墙 超标量
下载PDF
Web Data Aggregation in MOLAP:Approach,Language,and Implementation
15
作者 朱焱 唐慧佳 马永强 《Journal of Southwest Jiaotong University(English Edition)》 2007年第3期179-186,共8页
This paper investigates the Web data aggregation issues in multidimensional on-line analytical processing (MOLAP) and presents a rule-driven aggregation approach. The core of the approach is defining aggregate rules... This paper investigates the Web data aggregation issues in multidimensional on-line analytical processing (MOLAP) and presents a rule-driven aggregation approach. The core of the approach is defining aggregate rules. To define the rules for reading warehouse data and computing aggregates, a rule definition language - array aggregation language (AAL) is developed. This language treats an array as a function from indexes to values and provides syntax and semantics based on monads. External functions can be called in aggregation rules to specify array reading, writing, and aggregating. Based on the features of AAL, array operations are unified as function operations, which can be easily expressed and automatically evaluated. To implement the aggregation approach, a processor for computing aggregates over the base cube and for materializing them in the data warehouse is built, and the component structure and working principle of the aggregation processor are introduced. 展开更多
关键词 Web data aggregation Aggregation language MOLAP Aggregation processor
下载PDF
基于数据平面可编程的负载均衡算法 被引量:2
16
作者 张一凡 韩卫占 周云 《吉林大学学报(信息科学版)》 CAS 2023年第6期1099-1105,共7页
针对目前网络数据平面存在僵化现象,导致网络中数据流不均衡的问题,提出了一种基于数据平面可编程的负载均衡算法。首先通过带内网络遥测(INT:In-band Network Telemetry)技术获取网络实时状态信息,然后利用提出的BD-ECMP(Bandwidth and... 针对目前网络数据平面存在僵化现象,导致网络中数据流不均衡的问题,提出了一种基于数据平面可编程的负载均衡算法。首先通过带内网络遥测(INT:In-band Network Telemetry)技术获取网络实时状态信息,然后利用提出的BD-ECMP(Bandwidth and Delay Equal-Cost Multi-Path Routing)算法选择数据流的最佳传输路径。采用编程协议无关的包处理器(P4:Programming Protocol-Independent Packet Processors)语言对SDN网络数据平面的数据流进行优化处理,从而实现网络负载均衡。仿真实验结果表明,与传统ECMP算法相比,BD-ECMP算法在平均流完成时间、网络吞吐量及网络丢包率等方面具有明显优势。 展开更多
关键词 计算机网络 软件定义网络 负载均衡 数据平面 协议无关的包处理器
下载PDF
The Design and Implementation of a Distributed Data Acquisition、Monitoring & Processing System (DDAMAP)
17
作者 Guoshun Zhou Hua Shen HuiQi Yan 《软件工程师》 2011年第2期123-127,共5页
This report presents the design and implementation of a Distributed Data Acquisition、 Monitoring and Processing System (DDAMAP)。It is assumed that operations of a factory are organized into two-levels: client machin... This report presents the design and implementation of a Distributed Data Acquisition、 Monitoring and Processing System (DDAMAP)。It is assumed that operations of a factory are organized into two-levels: client machines at plant-level collect real-time raw data from sensors and measurement instrumentations and transfer them to a central processor over the Ethernets, and the central processor handles tasks of real-time data processing and monitoring. This system utilizes the computation power of Intel T2300 dual-core processor and parallel computations supported by multi-threading techniques. Our experiments show that these techniques can significantly improve the system performance and are viable solutions to real-time high-speed data processing. 展开更多
关键词 软件 数据处理 传感器 仪表
下载PDF
面向国产异构平台的OpenMP Offload共享内存访存优化
18
作者 王鑫 李嘉楠 +2 位作者 韩林 赵荣彩 周强伟 《计算机工程与应用》 CSCD 北大核心 2023年第10期75-85,共11页
国产异构处理器DCU(deep computing unit)上的本地数据共享(local data share,LDS)是一种低延迟、高带宽的显式寻址内存。国产异构系统的OpenMP未提供LDS访问的编程接口,导致未有效地利用LDS硬件实现数据的高效访存。针对此问题,研究了... 国产异构处理器DCU(deep computing unit)上的本地数据共享(local data share,LDS)是一种低延迟、高带宽的显式寻址内存。国产异构系统的OpenMP未提供LDS访问的编程接口,导致未有效地利用LDS硬件实现数据的高效访存。针对此问题,研究了面向DCU平台的OpenMP Offload执行模式和LDS的分配方法,以及特定于LDS访存的指令结构,实现了LDS访存的手动支持。另外针对于OpenMP Offload的不同执行模式,在此优化方法的基础上实现了LDS访存的自动化,形成了一套面向国产异构平台的高效访存策略。实验采用polybench标准测试集进行测试,利用手动和自动优化方法在单线程模式下平均加速比可达2.60,利用手动优化方法在多线程non-SPMD模式下平均加速比达1.38,利用自动优化方法在多线程SPMD模式下平均加速比达1.11。实验结果表明LDS访存的自动和手动支持有助于提高OpenMP异构程序运行速度。 展开更多
关键词 国产处理器DCU 本地数据共享(LDS) OpenMP Offlaod SPMD non-SPMD
下载PDF
北京三号A/B卫星数传智能处理器在轨处理关键技术及应用 被引量:1
19
作者 王元乐 张建华 +8 位作者 杨玉辰 方火能 李潇然 韩婷 朱红 袁素春 韩宇 赵魏 刘聪聪 《航天器工程》 CSCD 北大核心 2023年第3期138-144,共7页
针对北京三号A/B卫星高速数据处理和传输需求,采用全路由总线互联架构,全新设计了第五代数传基带处理设备智能处理器,给出了相关功能、指标和特点;重点介绍了智能处理器中软件定义功能的高性能异构计算单元、高性能遥感影像在轨处理技... 针对北京三号A/B卫星高速数据处理和传输需求,采用全路由总线互联架构,全新设计了第五代数传基带处理设备智能处理器,给出了相关功能、指标和特点;重点介绍了智能处理器中软件定义功能的高性能异构计算单元、高性能遥感影像在轨处理技术、数传任务自主管理技术等在轨处理关键技术;最后,给出了智能处理器试验验证和应用情况,其具备硬件平台通用、软件定义功能,大幅提升了常规数传能力,创新实践了多种智能数传功能,通过北京三号A/B卫星成功在轨验证及应用,智能处理器可作为成熟产品应用于后续空间高速数传任务。 展开更多
关键词 智能化 高速数传 智能数传 智能处理器 在轨处理
下载PDF
面向国产高性能众核处理器的编程模型
20
作者 陈虎 周鹏灵 《计算机应用》 CSCD 北大核心 2023年第11期3517-3526,共10页
在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一... 在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一方面基于消息队列机制开发国产高性能众核处理器的线程级并行机制;另一方面基于单指令多数据流(SIMD)编程模型开发从核上的数据级并行性。首先,对国产高性能众核处理器体系结构进行抽象;其次,设计模型的消息队列机制,并为程序员提供一套异构并行编程接口,如系统参数接口、从核线程控制接口、消息队列接口、SIMD抽象接口;最后,在上述基础上形成全新的高性能计算软件开发模型和方法,方便用户开发基于国产高性能众核处理器的并行计算软件。性能传输测试结果表明,在国产众核处理器上,当启动核数较少时,所提模型的传输带宽普遍达到了峰值直接内存访问(DMA)带宽的90%;当启动的核数较多时,消息队列模型的传输带宽普遍达到了峰值DMA带宽的70%。在矩阵乘法实验中,与系统原语传输矩阵并计算的性能相比,所提模型的性能达到前者的90%;在口令猜测系统中,所提模型的代码性能与直接使用最底层的接口开发的代码性能基本持平。所提通用编程模型和支撑框架使高性能计算(HPC)软件开发更简易,并且具有更好的可移植性,可为促进国产自主HPC软件研发提供帮助。 展开更多
关键词 国产众核处理器 单指令多数据流 并行编程模型 SW26010 消息队列模型
下载PDF
上一页 1 2 35 下一页 到第
使用帮助 返回顶部