期刊文献+
共找到718篇文章
< 1 2 36 >
每页显示 20 50 100
Ultra-Fast Next Generation Human Genome Sequencing Data Processing Using DRAGEN<sup>TM</sup>Bio-IT Processor for Precision Medicine 被引量:3
1
作者 Amit Goyal Hyuk Jung Kwon +5 位作者 Kichan Lee Reena Garg Seon Young Yun Yoon Hee Kim Sunghoon Lee Min Seob Lee 《Open Journal of Genetics》 2017年第1期9-19,共11页
Slow speed of the Next-Generation sequencing data analysis, compared to the latest high throughput sequencers such as HiSeq X system, using the current industry standard genome analysis pipeline, has been the major fa... Slow speed of the Next-Generation sequencing data analysis, compared to the latest high throughput sequencers such as HiSeq X system, using the current industry standard genome analysis pipeline, has been the major factor of data backlog which limits the real-time use of genomic data for precision medicine. This study demonstrates the DRAGEN Bio-IT Processor as a potential candidate to remove the “Big Data Bottleneck”. DRAGENTM accomplished the variant calling, for ~40× coverage WGS data in as low as ~30 minutes using a single command, achieving the over 50-fold data analysis speed while maintaining the similar or better variant calling accuracy than the standard GATK Best Practices workflow. This systematic comparison provides the faster and efficient NGS data analysis alternative to NGS-based healthcare industries and research institutes to meet the requirement for precision medicine based healthcare. 展开更多
关键词 NGS data Analysis BWA-GATK DRAGEN Bio-IT processor Genomics INDEL Mapping
下载PDF
基于ARM处理器的温室大棚智能监控系统设计
2
作者 孙启昌 胡国强 《工业仪表与自动化装置》 2024年第3期9-14,共6页
为了实现温室大棚的智能监测与控制,设计基于ARM处理器的温室大棚智能监控系统。系统分为三个部分:数据采集及设备控制终端、智能网关终端、Android手机客户端,数据采集及设备控制终端以ARM微处理为核心,通过传感器、算法、Wi-Fi等技术... 为了实现温室大棚的智能监测与控制,设计基于ARM处理器的温室大棚智能监控系统。系统分为三个部分:数据采集及设备控制终端、智能网关终端、Android手机客户端,数据采集及设备控制终端以ARM微处理为核心,通过传感器、算法、Wi-Fi等技术,实现温室大棚数据采集、数据处理、数据传输及执行设备的智能控制,智能网关终端实现多个温室大棚数据从内网发送至公网,Android手机客户端实现数据的接收与发送。经测试验证,系统能够实现温室大棚的智能监控。 展开更多
关键词 ARM处理器 数据采集 智能网关 算法 手机客户端
下载PDF
基于PCIE的多嵌入式人工智能处理器低延迟数据交换技术
3
作者 魏璇 温凯林 +3 位作者 李斌 刘淑涛 褚洁 蔡觉平 《电子科技》 2024年第5期32-37,46,共7页
针对多嵌入式人工智能(Artificial Intelligence,AI)处理器板卡之间的任务调度和数据交换冲突以及提高多板卡堆叠扩展时的可靠性和运行效率问题,文中提出了一种虫洞交换结构多嵌入式人工智能处理器高速数据交换技术和数据帧结构的解决... 针对多嵌入式人工智能(Artificial Intelligence,AI)处理器板卡之间的任务调度和数据交换冲突以及提高多板卡堆叠扩展时的可靠性和运行效率问题,文中提出了一种虫洞交换结构多嵌入式人工智能处理器高速数据交换技术和数据帧结构的解决方法。该方法基于PCIE(PCI Express)高速数据接口,将数据以数据单元的形式进行信息传递,并设计多重权重决策算法避免数据传输中的冲突,实现任务的并发多线程处理。搭建FPGA(Field Programmable Gate Array)平台进行设计和测试,结果表明PCIE的传输带宽利用效率达到了85%以上,数据交换延迟小于20μs,系统中断任务响应平均最大延迟时间为8.775μs。该技术适用于多处理器协同的高速交换电路,可扩展至混合PCIE和RapidIO交换电路结构。 展开更多
关键词 嵌入式人工智能处理器 数据交换 外围组件互连快速 PCI Express 交换开关 虫洞技术 数据仲裁 多重权重决策
下载PDF
x86处理器向量条件访存指令安全脆弱性分析
4
作者 李丹萍 朱子元 +1 位作者 史岗 孟丹 《计算机学报》 EI CAS CSCD 北大核心 2024年第3期525-543,共19页
单指令多数据流(Single Instruction stream,Multiple Data streams,SIMD)是一种利用数据级并行提高处理器性能的技术,旨在利用多个处理器并行执行同一条指令增加数据处理的吞吐量.随着大数据、人工智能等技术的兴起,人们对数据并行化... 单指令多数据流(Single Instruction stream,Multiple Data streams,SIMD)是一种利用数据级并行提高处理器性能的技术,旨在利用多个处理器并行执行同一条指令增加数据处理的吞吐量.随着大数据、人工智能等技术的兴起,人们对数据并行化处理的需求不断提高,这使得SIMD技术愈发重要.为了支持SIMD技术,Intel和AMD等x86处理器厂商从1996年开始在其处理器中陆续引入了MMX(MultiMedia Extensions)、SSE(Streaming SIMD Extensions)、AVX(Advanced Vector eXtensions)等SIMD指令集扩展.通过调用SIMD指令,程序员能够无需理解SIMD技术的硬件层实现细节就方便地使用它的功能.然而,随着熔断、幽灵等处理器硬件漏洞的发现,人们逐渐认识到并行优化技术是一柄双刃剑,它在提高性能的同时也能带来安全风险.本文聚焦于x86 SIMD指令集扩展中的VMASKMOV指令,对它的安全脆弱性进行了分析.本文的主要贡献如下:(1)利用时间戳计数器等技术对VMASKMOV指令进行了微架构逆向工程,首次发现VMASKMOV指令与内存页管理和CPU Fill Buffer等安全风险的相关性;(2)披露了一个新的处理器漏洞EvilMask,它广泛存在于Intel和AMD处理器上,并提出了3个EvilMask攻击原语:VMASKMOVL+Time(MAP)、VMASKMOVS+Time(XD)和VMASKMOVL+MDS,可用于实施去地址空间布局随机化攻击和进程数据窃取攻击;(3)给出了2个EvilMask概念验证示例(Proof-of-Concept,PoC)验证了EvilMask对真实世界的信息安全危害;(4)讨论了针对EvilMask的防御方案,指出最根本的解决方法是在硬件层面上重新实现VMASKMOV指令,并给出了初步的实现方案. 展开更多
关键词 处理器安全 单指令多数据流(SIMD) 微体系结构侧信道攻击 VMASKMOV指令 地址空间布局随机化(ASLR)
下载PDF
数据确权的槌定之路:论证数据确权必要性
5
作者 赵艳娜 陈娜 《科技创业月刊》 2024年第5期165-169,共5页
数据作为一项新型财产已经被我国《民法典》确认为民事权益客体,大数据时代背景下数据价值日益凸显,数据交易渐趋普遍,数据是否应当确权引起了社会和学术界的广泛探讨,却没有体现在法律法规上。数据确权是数据立法需要解决的关键问题,... 数据作为一项新型财产已经被我国《民法典》确认为民事权益客体,大数据时代背景下数据价值日益凸显,数据交易渐趋普遍,数据是否应当确权引起了社会和学术界的广泛探讨,却没有体现在法律法规上。数据确权是数据立法需要解决的关键问题,对数据确权的首要前提是剖析数据确权的缺位引发的问题,继而论证确权的必要性。作为数据相关权利之一的数据财产权对数据处理者而言具有重要意义,合法化并合理化该项权利是立法者不容忽视的。数据确权是当前立法界亟待加速推动解决的重要议题,明确数据权属有利于助力数字经济快速发展。 展开更多
关键词 数据确权 数据财产权 数据处理者 数据流通
下载PDF
浮点数字信号处理器Data-RAM的RTL模型设计
6
作者 胡正伟 仲顺安 陈禾 《北京理工大学学报》 EI CAS CSCD 北大核心 2007年第1期68-72,共5页
提出了一种双精度浮点数字信号处理器Data-RAM的RTL模型设计方法.分析了Data-RAM的结构和访问机制,采用自顶向下的方法和VHDL语言,实现了Data-RAM的RTL模型设计并验证了其功能的正确性.该模型支持3地址独立进行数据存取,支持字节、半字... 提出了一种双精度浮点数字信号处理器Data-RAM的RTL模型设计方法.分析了Data-RAM的结构和访问机制,采用自顶向下的方法和VHDL语言,实现了Data-RAM的RTL模型设计并验证了其功能的正确性.该模型支持3地址独立进行数据存取,支持字节、半字、字的读写访问和双字的读访问.在访问地址不冲突的前提下,最大可以在同一时钟周期进行2次64 bit的读操作和1次32 bit读写操作.Data-RAM的RTL模型设计为门级和物理级的性能设计提供了参考. 展开更多
关键词 数字信号处理器 data-RAM RTL模型
下载PDF
基于阵列处理器的HEVC数据流图可重构实现
7
作者 胡传瞻 蒋林 +3 位作者 朱筠 谢晓燕 杨坤 崔馨月 《计算机应用与软件》 北大核心 2024年第3期240-245,257,共7页
提出一种基于阵列处理器的HEVC算法数据流图可重构实现方法。基于动态重构机制完成不同的划分方式、算法间的灵活切换,采用深度优先贪婪对数据流图划分后子任务时域流水的并行方式对HEVC中典型编码算法的数据流图重新划分后设计合理映... 提出一种基于阵列处理器的HEVC算法数据流图可重构实现方法。基于动态重构机制完成不同的划分方式、算法间的灵活切换,采用深度优先贪婪对数据流图划分后子任务时域流水的并行方式对HEVC中典型编码算法的数据流图重新划分后设计合理映射方案,以Sobel算子值为重构依据在阵列处理器上进行帧内预测算法验证。实验结果表明,与块间流水方案实现相比加速比可达14.97,各算法资源利用率及计算速度均有提升,与帧内预测模式选择快速算法相比每个时钟周期可多处理7.1个像素。 展开更多
关键词 数据流图 HEVC 深度优先贪婪 可重构阵列处理器
下载PDF
基于高密度计算的多核处理器电力芯片低功耗设计系统
8
作者 匡晓云 黄开天 杨祎巍 《电子设计工程》 2024年第7期6-9,15,共5页
多核处理器电力芯片是目前多种系统的重要组成部分,设计低功耗电力芯片,能够更好地保证系统正常运行。目前设计的电力芯片低功耗系统运行速度较慢,功耗难以达到用户要求,为此该文应用高密度计算设计了一种多核处理器电力芯片低功耗系统... 多核处理器电力芯片是目前多种系统的重要组成部分,设计低功耗电力芯片,能够更好地保证系统正常运行。目前设计的电力芯片低功耗系统运行速度较慢,功耗难以达到用户要求,为此该文应用高密度计算设计了一种多核处理器电力芯片低功耗系统。兼容系统多核处理器与层次化AHB总线,探索处理器电力芯片的整体结构,集中处理存储数据信息,不断调整系统算法参数,通过高密度分析引入矩阵进行数据解析,确保运行过程的安全性。在分析处理器调度性能的基础上,利用高密度处理对数据进行层次化处理,避免数据冗余造成的系统运行故障。实验结果表明,引入所设计系统后电力芯片功耗减少了60%,加速比达到3.992,可以有效提高电力芯片运行性能。 展开更多
关键词 高密度计算 多核处理器 电力芯片 低功耗设计 存储数据
下载PDF
Development of practical postprocessor for 5-axis machine tool with non-orthogonal rotary axes 被引量:13
9
作者 JUNG Hyoun-Chul HWANG Jong-Dae +1 位作者 PARK Ki-Beom JUNG Yoon-Gyo 《Journal of Central South University》 SCIE EI CAS 2011年第1期159-164,共6页
In order to develop a practical postprocessor for 5-axis machine tool,the general equations of numerically controlled(NC) data for 5-axis configurations with non-orthogonal rotary axes were exactly expressed by the in... In order to develop a practical postprocessor for 5-axis machine tool,the general equations of numerically controlled(NC) data for 5-axis configurations with non-orthogonal rotary axes were exactly expressed by the inverse kinematics,and a windows-based postprocessor written with Visual Basic was developed according to the proposed algorithm.The developed postprocessor is a general system suitable for all kinds of 5-axis machines with orthogonal and non-orthogonal rotary axes.Through implementation of the developed postprocessor and verification by a cutting simulation and machining experiment,the effectiveness of the proposed algorithm is confirmed.Compatibility is improved by allowing exchange of data formats such as rotational total center position(RTCP) controlled NC data,vector post NC data,and program object file(POF) cutter location(CL) data,and convenience is increased by adding the function of work-piece origin offset.Consequently,a practical post-processor for 5-axis machining is developed. 展开更多
关键词 旋转轴 非正交 后处理 机床 数据交换格式 RTCP协议 5轴加工 配置数据
下载PDF
PhiBench 2.0: characterizing data analytics workloads on Intel Knights Landing
10
作者 解壁伟 Zhan Jianfeng +1 位作者 Wang Lei Zhang Lixin 《High Technology Letters》 EI CAS 2019年第2期121-128,共8页
With high computational capacity, e.g. many-core and wide floating point SIMD units, Intel Xeon Phi shows promising prospect to accelerate high-performance computing(HPC) applications. But the application of Intel Xeo... With high computational capacity, e.g. many-core and wide floating point SIMD units, Intel Xeon Phi shows promising prospect to accelerate high-performance computing(HPC) applications. But the application of Intel Xeon Phi on data analytics workloads in data center is still an open question. Phibench 2.0 is built for the latest generation of Intel Xeon Phi(KNL, Knights Landing), based on the prior work PhiBench(also named BigDataBench-Phi), which is designed for the former generation of Intel Xeon Phi(KNC, Knights Corner). Workloads of PhiBench 2.0 are delicately chosen based on BigdataBench 4.0 and PhiBench 1.0. Other than that, these workloads are well optimized on KNL, and run on real-world datasets to evaluate their performance and scalability. Further, the microarchitecture-level characteristics including CPI, cache behavior, vectorization intensity, and branch prediction efficiency are analyzed and the impact of affinity and scheduling policy on performance are investigated. It is believed that the observations would help other researchers working on Intel Xeon Phi and data analytics workloads. 展开更多
关键词 INTEL XEON PHI data analytics WORKLOADS characterization Knights Landing(KNL) many core x86 processorS
下载PDF
Web Data Aggregation in MOLAP:Approach,Language,and Implementation
11
作者 朱焱 唐慧佳 马永强 《Journal of Southwest Jiaotong University(English Edition)》 2007年第3期179-186,共8页
This paper investigates the Web data aggregation issues in multidimensional on-line analytical processing (MOLAP) and presents a rule-driven aggregation approach. The core of the approach is defining aggregate rules... This paper investigates the Web data aggregation issues in multidimensional on-line analytical processing (MOLAP) and presents a rule-driven aggregation approach. The core of the approach is defining aggregate rules. To define the rules for reading warehouse data and computing aggregates, a rule definition language - array aggregation language (AAL) is developed. This language treats an array as a function from indexes to values and provides syntax and semantics based on monads. External functions can be called in aggregation rules to specify array reading, writing, and aggregating. Based on the features of AAL, array operations are unified as function operations, which can be easily expressed and automatically evaluated. To implement the aggregation approach, a processor for computing aggregates over the base cube and for materializing them in the data warehouse is built, and the component structure and working principle of the aggregation processor are introduced. 展开更多
关键词 Web data aggregation Aggregation language MOLAP Aggregation processor
下载PDF
Exploring the Approaches to Data Flow Computing
12
作者 Mohammad B.Khan Abdul R.Khan Hasan Alkahtani 《Computers, Materials & Continua》 SCIE EI 2022年第5期2333-2346,共14页
Architectures based on the data flow computing model provide an alternative to the conventional Von-Neumann architecture that are widelyused for general purpose computing.Processors based on the data flow architecture... Architectures based on the data flow computing model provide an alternative to the conventional Von-Neumann architecture that are widelyused for general purpose computing.Processors based on the data flow architecture employ fine-grain data-driven parallelism.These architectures have thepotential to exploit the inherent parallelism in compute intensive applicationslike signal processing,image and video processing and so on and can thusachieve faster throughputs and higher power efficiency.In this paper,severaldata flow computing architectures are explored,and their main architecturalfeatures are studied.Furthermore,a classification of the processors is presented based on whether they employ either the data flow execution modelexclusively or in combination with the control flow model and are accordinglygrouped as exclusive data flow or hybrid architectures.The hybrid categoryis further subdivided as conjoint or accelerator-style architectures dependingon how they deploy and separate the data flow and control flow executionmodel within their execution blocks.Lastly,a brief comparison and discussionof their advantages and drawbacks is also considered.From this study weconclude that although the data flow architectures are seen to have maturedsignificantly,issues like data-structure handling and lack of efficient placementand scheduling algorithms have prevented these from becoming commerciallyviable. 展开更多
关键词 processor architecture data flow architectures Von-Neumann model control flow architectures
下载PDF
论衍生数据的知识产权保护模式 被引量:11
13
作者 陶乾 李衍泽 《大连理工大学学报(社会科学版)》 北大核心 2023年第4期94-101,共8页
数字经济时代,衍生数据蕴藏着巨大商业价值。就其法律保护问题,国内外主要存在赋权模式和行为规制模式两种观点。衍生数据具备财产属性,属于我国《民法典》所保护的权益。若仅以《反不正当竞争法》下的行为规制模式对其提供保护,无法对... 数字经济时代,衍生数据蕴藏着巨大商业价值。就其法律保护问题,国内外主要存在赋权模式和行为规制模式两种观点。衍生数据具备财产属性,属于我国《民法典》所保护的权益。若仅以《反不正当竞争法》下的行为规制模式对其提供保护,无法对衍生数据的利用和权利限制进行全面的制度安排,亦无法有效平衡各方主体利益。相比之下,赋权模式是激励数据生产和投资的重要保障。基于衍生数据的形成机理及对其进行保护所遵循的价值理念,将其置于知识产权制度体系下具有正当性。根据人类在数据生成过程中的参与程度,可以将衍生数据区分为有创作性投入的衍生数据和无创作性投入的衍生数据,前者用著作权保护模式,后者用邻接权保护模式。数据赋权可供选择的路径之一是在知识产权制度体系内创设一项数据处理者权,用以保护衍生数据生产者运用人工智能、数据挖掘等技术所产出的数据产品。为了平衡多方利益,还应当通过增设合理使用情形、设定期限等方式,对数据处理者权加以适当限制。 展开更多
关键词 衍生数据 知识产权 数据产权 邻接权 数据处理者
下载PDF
处理器值预测技术研究
14
作者 黄立波 杨凌 +5 位作者 杨乾明 马胜 王永文 隋兵才 沈立 徐炜遐 《电子学报》 EI CAS CSCD 北大核心 2023年第12期3591-3618,共28页
当今的处理器性能与存储器带宽和延迟严重失衡的问题限制了计算系统的整体性能,而存储器的性能对制程工艺不敏感,在后摩尔时代下很难再通过集成电路制造工艺的迭代获得处理器性能收益,因此人们更多地想通过体系结构的创新获得更高性能... 当今的处理器性能与存储器带宽和延迟严重失衡的问题限制了计算系统的整体性能,而存储器的性能对制程工艺不敏感,在后摩尔时代下很难再通过集成电路制造工艺的迭代获得处理器性能收益,因此人们更多地想通过体系结构的创新获得更高性能的计算系统.处理器值预测技术是一种能在无需改变存储系统情况下有效缓解存储墙问题的解决方案,其通过预测性地打破数据真相关进而让更多的指令可以在乱序处理器中并行执行,而无需等待由于访存等操作造成的长周期指令执行.近年来,值预测在各个方面都有了实质性的进步,但现如今还没有商用处理器使用这一技术,这主要是由于值预测技术的使用还面临许多挑战:现有的处理器的流水线架构不能直接使用值预测技术;值预测所需的预测值传递机制需要额外的硬件资源开销;值预测器巨大的存储开销让其很难在片上实现;由于值预测错误时的性能惩罚大,因此预测准确率较低的值预测器会降低处理器性能.针对这些问题,本文以值预测技术为中心,围绕值预测技术相关的流水线架构、值预测器结构和错误恢复机制三个方面分别详细论述了国内外研究成果以及其对于各个问题挑战的解决策略.最后,本文对当今的处理器值预测技术进行了总结并对未来的研究方向进行了展望. 展开更多
关键词 值预测 数据依赖 处理器 流水线 存储墙 超标量
下载PDF
The Design and Implementation of a Distributed Data Acquisition、Monitoring & Processing System (DDAMAP)
15
作者 Guoshun Zhou Hua Shen HuiQi Yan 《软件工程师》 2011年第2期123-127,共5页
This report presents the design and implementation of a Distributed Data Acquisition、 Monitoring and Processing System (DDAMAP)。It is assumed that operations of a factory are organized into two-levels: client machin... This report presents the design and implementation of a Distributed Data Acquisition、 Monitoring and Processing System (DDAMAP)。It is assumed that operations of a factory are organized into two-levels: client machines at plant-level collect real-time raw data from sensors and measurement instrumentations and transfer them to a central processor over the Ethernets, and the central processor handles tasks of real-time data processing and monitoring. This system utilizes the computation power of Intel T2300 dual-core processor and parallel computations supported by multi-threading techniques. Our experiments show that these techniques can significantly improve the system performance and are viable solutions to real-time high-speed data processing. 展开更多
关键词 软件 数据处理 传感器 仪表
下载PDF
基于数据平面可编程的负载均衡算法
16
作者 张一凡 韩卫占 周云 《吉林大学学报(信息科学版)》 CAS 2023年第6期1099-1105,共7页
针对目前网络数据平面存在僵化现象,导致网络中数据流不均衡的问题,提出了一种基于数据平面可编程的负载均衡算法。首先通过带内网络遥测(INT:In-band Network Telemetry)技术获取网络实时状态信息,然后利用提出的BD-ECMP(Bandwidth and... 针对目前网络数据平面存在僵化现象,导致网络中数据流不均衡的问题,提出了一种基于数据平面可编程的负载均衡算法。首先通过带内网络遥测(INT:In-band Network Telemetry)技术获取网络实时状态信息,然后利用提出的BD-ECMP(Bandwidth and Delay Equal-Cost Multi-Path Routing)算法选择数据流的最佳传输路径。采用编程协议无关的包处理器(P4:Programming Protocol-Independent Packet Processors)语言对SDN网络数据平面的数据流进行优化处理,从而实现网络负载均衡。仿真实验结果表明,与传统ECMP算法相比,BD-ECMP算法在平均流完成时间、网络吞吐量及网络丢包率等方面具有明显优势。 展开更多
关键词 计算机网络 软件定义网络 负载均衡 数据平面 协议无关的包处理器
下载PDF
面向国产异构平台的OpenMP Offload共享内存访存优化
17
作者 王鑫 李嘉楠 +2 位作者 韩林 赵荣彩 周强伟 《计算机工程与应用》 CSCD 北大核心 2023年第10期75-85,共11页
国产异构处理器DCU(deep computing unit)上的本地数据共享(local data share,LDS)是一种低延迟、高带宽的显式寻址内存。国产异构系统的OpenMP未提供LDS访问的编程接口,导致未有效地利用LDS硬件实现数据的高效访存。针对此问题,研究了... 国产异构处理器DCU(deep computing unit)上的本地数据共享(local data share,LDS)是一种低延迟、高带宽的显式寻址内存。国产异构系统的OpenMP未提供LDS访问的编程接口,导致未有效地利用LDS硬件实现数据的高效访存。针对此问题,研究了面向DCU平台的OpenMP Offload执行模式和LDS的分配方法,以及特定于LDS访存的指令结构,实现了LDS访存的手动支持。另外针对于OpenMP Offload的不同执行模式,在此优化方法的基础上实现了LDS访存的自动化,形成了一套面向国产异构平台的高效访存策略。实验采用polybench标准测试集进行测试,利用手动和自动优化方法在单线程模式下平均加速比可达2.60,利用手动优化方法在多线程non-SPMD模式下平均加速比达1.38,利用自动优化方法在多线程SPMD模式下平均加速比达1.11。实验结果表明LDS访存的自动和手动支持有助于提高OpenMP异构程序运行速度。 展开更多
关键词 国产处理器DCU 本地数据共享(LDS) OpenMP Offlaod SPMD non-SPMD
下载PDF
面向国产高性能众核处理器的编程模型
18
作者 陈虎 周鹏灵 《计算机应用》 CSCD 北大核心 2023年第11期3517-3526,共10页
在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一... 在国产高性能众核处理器上编程时,需要直接使用最底层的接口开发软件,这使编程和调试非常困难;并且各自平台的高性能软件编程模型较为基础,计算软件不能通用,造成了重复性开发。针对以上问题,实现了通用编程模型以及所对应的支撑库:一方面基于消息队列机制开发国产高性能众核处理器的线程级并行机制;另一方面基于单指令多数据流(SIMD)编程模型开发从核上的数据级并行性。首先,对国产高性能众核处理器体系结构进行抽象;其次,设计模型的消息队列机制,并为程序员提供一套异构并行编程接口,如系统参数接口、从核线程控制接口、消息队列接口、SIMD抽象接口;最后,在上述基础上形成全新的高性能计算软件开发模型和方法,方便用户开发基于国产高性能众核处理器的并行计算软件。性能传输测试结果表明,在国产众核处理器上,当启动核数较少时,所提模型的传输带宽普遍达到了峰值直接内存访问(DMA)带宽的90%;当启动的核数较多时,消息队列模型的传输带宽普遍达到了峰值DMA带宽的70%。在矩阵乘法实验中,与系统原语传输矩阵并计算的性能相比,所提模型的性能达到前者的90%;在口令猜测系统中,所提模型的代码性能与直接使用最底层的接口开发的代码性能基本持平。所提通用编程模型和支撑框架使高性能计算(HPC)软件开发更简易,并且具有更好的可移植性,可为促进国产自主HPC软件研发提供帮助。 展开更多
关键词 国产众核处理器 单指令多数据流 并行编程模型 SW26010 消息队列模型
下载PDF
北京三号A/B卫星数传智能处理器在轨处理关键技术及应用 被引量:1
19
作者 王元乐 张建华 +8 位作者 杨玉辰 方火能 李潇然 韩婷 朱红 袁素春 韩宇 赵魏 刘聪聪 《航天器工程》 CSCD 北大核心 2023年第3期138-144,共7页
针对北京三号A/B卫星高速数据处理和传输需求,采用全路由总线互联架构,全新设计了第五代数传基带处理设备智能处理器,给出了相关功能、指标和特点;重点介绍了智能处理器中软件定义功能的高性能异构计算单元、高性能遥感影像在轨处理技... 针对北京三号A/B卫星高速数据处理和传输需求,采用全路由总线互联架构,全新设计了第五代数传基带处理设备智能处理器,给出了相关功能、指标和特点;重点介绍了智能处理器中软件定义功能的高性能异构计算单元、高性能遥感影像在轨处理技术、数传任务自主管理技术等在轨处理关键技术;最后,给出了智能处理器试验验证和应用情况,其具备硬件平台通用、软件定义功能,大幅提升了常规数传能力,创新实践了多种智能数传功能,通过北京三号A/B卫星成功在轨验证及应用,智能处理器可作为成熟产品应用于后续空间高速数传任务。 展开更多
关键词 智能化 高速数传 智能数传 智能处理器 在轨处理
下载PDF
基于RISC-V的数据安全指令 被引量:2
20
作者 刘阳 汪丹 +1 位作者 方林伟 王利明 《计算机系统应用》 2023年第1期392-398,共7页
RISC-V是基于精简指令集原理建立的免费开放指令集架构,具有完全开源、架构简单、易于移植、模块化设计等特点.随着网络高速发展,安全风险无处不在,利用RISC-V的可扩展特性是一种非常有效地提升RISC-V设备安全的方式.因此,本文针对RISC-... RISC-V是基于精简指令集原理建立的免费开放指令集架构,具有完全开源、架构简单、易于移植、模块化设计等特点.随着网络高速发展,安全风险无处不在,利用RISC-V的可扩展特性是一种非常有效地提升RISC-V设备安全的方式.因此,本文针对RISC-V自定义指令的安全能力,结合可信计算、流密码技术,设计了简单高效的RISC-V自定义指令,实现基于可信基的数据安全存储功能,并依托GNU编译工具链实现对自定义指令的编译支持,在模拟器上测试应用程序对自定义指令的调用执行.该指令充分结合可信计算与流密码的安全特性,可实现较强的安全性. 展开更多
关键词 RISC-V 自定义指令 数据安全存储 可信计算 密码技术 处理器 云存储 隐私保护
下载PDF
上一页 1 2 36 下一页 到第
使用帮助 返回顶部