期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于FPGA的排序加速方法综述
1
作者 孔浩 卢文岩 +2 位作者 鄢贵海 李晓维 《计算机研究与发展》 EI CSCD 北大核心 2024年第3期780-798,共19页
对于FPGA排序加速来说,各类性能指标的选取与优化至关重要,如延时、吞吐率、功耗、硬件利用率和带宽利用率等.梳理了性能驱动下的排序加速发展脉络,在数据规模、数据类型、算法支持、软硬件协同和新型硬件等方面均取得了进展;分析了在... 对于FPGA排序加速来说,各类性能指标的选取与优化至关重要,如延时、吞吐率、功耗、硬件利用率和带宽利用率等.梳理了性能驱动下的排序加速发展脉络,在数据规模、数据类型、算法支持、软硬件协同和新型硬件等方面均取得了进展;分析了在设计、实现、测试等各不同阶段所面临的问题及优化策略,其中归并排序因其自身优良的硬件并行性、可扩展性和控制逻辑简单等特性成为主流.排序加速是与特定应用场景深度绑定的架构设计,进一步从数据库系统加速角度出发,针对数据库排序所面临的资源竞争、数据组织方式、特有操作以及用户请求多样性等问题,分析了其所进行的架构调整.最后针对现有研究的问题及缺陷,从分布式排序加速、数据处理器、高层次综合辅助工具链等方面对未来的发展方向进行了展望. 展开更多
关键词 加速 数据库 现场可编程门阵列 综述 排序
下载PDF
HyperTree:高并发B+树索引加速器 被引量:1
2
作者 吴婧雅 卢文岩 +1 位作者 鄢贵海 李晓维 《计算机研究与发展》 EI CSCD 北大核心 2023年第7期1661-1677,共17页
B+树是关系型数据库中用来加速查询的常用索引结构,通过构建平衡树维护关键属性的顺序.索引提升了数据库查询性能,但其严格的有序关系增加了数据库表的维护开销.特别是在大数据场景下,数据量激增使得索引查询和维序性能进一步下降.如何... B+树是关系型数据库中用来加速查询的常用索引结构,通过构建平衡树维护关键属性的顺序.索引提升了数据库查询性能,但其严格的有序关系增加了数据库表的维护开销.特别是在大数据场景下,数据量激增使得索引查询和维序性能进一步下降.如何平衡B+树的查询和维序性能,以及在大数据场景下提升索引查询和维序的效率,对提升索引系统性能具有重要意义.由此设计了一种专用的B+树索引加速系统,对存储和计算进行协同优化,均衡提升索引查询和维序性能.利用内存突发读写高带宽的特性设计规则的树和节点存储格式以提升内存带宽利用效率,设计高效的同构计算架构和多数据通道以提升索引操作并行度.同时设计解耦合的子树结构缓解索引维护时的树读写冲突.实验结果表明,相比于CPU,B+树索引加速系统能够提升系统查询性能超过6.84倍,提升索引维序性能提升超过29.14倍. 展开更多
关键词 B+树 现场可编程门阵列 加速器 高吞吐量 高并发 数据库查询
下载PDF
基于FPGA的软硬件协同的多表哈希连接加速器
3
作者 吴婧雅 卢文岩 +1 位作者 鄢贵海 李晓维 《高技术通讯》 CAS 2023年第11期1123-1135,共13页
多表连接操作难以实现硬件加速。一方面,多表连接请求中表的数目不确定且连接方式多变,这种灵活的计算请求与固定的硬件行为之间存在矛盾;另一方面,多表连接的中间结果随表的增加而扩充,数据结构的管理和维护也要求更高的硬件开销。为... 多表连接操作难以实现硬件加速。一方面,多表连接请求中表的数目不确定且连接方式多变,这种灵活的计算请求与固定的硬件行为之间存在矛盾;另一方面,多表连接的中间结果随表的增加而扩充,数据结构的管理和维护也要求更高的硬件开销。为支持灵活高效的多表连接计算,本文提出一种软硬件协同的优化方法。软件部分,将多表连接抽象为正向和反向2种计算模式并支持不同方式的多表连接。硬件设计采用访存和计算协同优化的方法:设计一种规则的硬件哈希表结构以提高内存访存带宽;设计支持正反向计算的同构专用计算引擎,配置多数据通道和指令控制系统实现高效的并行运算,提升多表哈希连接的计算效率。实验结果表明,相比中央处理器(CPU)执行表连接操作,单计算引擎能够提升性能9.2~11.0倍。通过多路并行的技术,实现8路并行的多表哈希引擎,能够充分利用板卡片外(DDR)内存带宽,实现相比CPU超过71.1倍的性能提升。 展开更多
关键词 现场可编程门阵列(FPGA) 多表连接 哈希连接 软硬件协同
下载PDF
深部巷道承压环强化复合支护技术与应用
4
作者 王军 卢文岩 +2 位作者 董晓莉 毛庆福 刘杰 《山东建筑大学学报》 2021年第6期83-90,共8页
承压环是锚杆支护作用下在巷道浅层形成的挤压拱,具有控制外部围岩稳定的作用,强化承压环可以提高其自身稳定性和承载力,是维持深部巷道稳定的有效途径。文章以阳城煤矿北三深部猴车下山为研究对象,分析了巷道地质条件,揭示了原有支护... 承压环是锚杆支护作用下在巷道浅层形成的挤压拱,具有控制外部围岩稳定的作用,强化承压环可以提高其自身稳定性和承载力,是维持深部巷道稳定的有效途径。文章以阳城煤矿北三深部猴车下山为研究对象,分析了巷道地质条件,揭示了原有支护的破坏原因,研究了深部巷道承压环力学模型,建立了承压环稳定性判据,以此为基础设计了“锚网喷+钢管混凝土支架+柔性均压卸压层”复合支护方案,并验证了复合支护稳定性。结果表明:采用基于承压环强化的复合支护技术后巷道整体稳定,1年内围岩收敛<100 mm,可有效控制底鼓,支护效果良好。 展开更多
关键词 深部巷道支护 承压环强化 钢管混凝土支架 复合支护
下载PDF
机器学习算法可近似性的量化评估分析 被引量:1
5
作者 江树浩 鄢贵海 +2 位作者 李家军 卢文岩 李晓维 《计算机研究与发展》 EI CSCD 北大核心 2017年第6期1337-1347,共11页
近年来,以神经网络为代表的机器学习算法发展迅速并被广泛应用在图像识别、数据搜索乃至金融趋势分析等领域.而随着问题规模的扩大和数据维度的增长,算法能耗问题日益突出,由于机器学习算法自身拥有的近似特性,近似计算这种牺牲结果的... 近年来,以神经网络为代表的机器学习算法发展迅速并被广泛应用在图像识别、数据搜索乃至金融趋势分析等领域.而随着问题规模的扩大和数据维度的增长,算法能耗问题日益突出,由于机器学习算法自身拥有的近似特性,近似计算这种牺牲结果的少量精确度降低能耗的技术,被许多研究者用来解决学习算法的能耗问题.我们发现,目前的工作大多专注于利用特定算法的近似特性而忽视了不同算法近似特性的差别对能耗优化带来的影响,而为了分类任务使用近似计算时能够做出能耗最优的选择,了解算法"可近似性"上的差异对近似计算优化能耗至关重要.因此,选取了支持向量机(SVM)、随机森林(RF)和神经网络(NN)3类常用的监督型机器学习算法,评估了针对不同类型能耗时不同算法的可近似性,并建立了存储污染敏感度、访存污染敏感度和能耗差异度等指标来表征算法可近似性的差距,评估得到的结论将有助于机器学习算法在使用近似计算技术时达到最优化能耗的目的. 展开更多
关键词 监督机器学习算法 近似计算 可近似性 能耗优化
下载PDF
软岩巷道交岔点钢管混凝土组合支架支护技术研究 被引量:7
6
作者 王军 卢文岩 +2 位作者 邢鲁义 杨光 王志康 《岩石力学与工程学报》 EI CAS CSCD 北大核心 2022年第3期573-586,共14页
为解决膨胀性软岩巷道交岔点支护难题,以清水营煤矿主斜井与2;给煤机检修联络巷交岔点为工程背景,在针对性分析交岔点地质特征和变形原因的基础上,提出基于矩形钢管混凝土组合支架的返修支护设计。通过数值模拟分析支架承载力,发现组合... 为解决膨胀性软岩巷道交岔点支护难题,以清水营煤矿主斜井与2;给煤机检修联络巷交岔点为工程背景,在针对性分析交岔点地质特征和变形原因的基础上,提出基于矩形钢管混凝土组合支架的返修支护设计。通过数值模拟分析支架承载力,发现组合支架直梁段抗弯承载力不足,以钢管混凝土直梁抗弯性能试验分析结构优化依据,试验表明:在直梁受拉区焊接抗弯圆钢可以有效提高钢管混凝土直梁的抗弯承载力。采用φ50 mm的抗弯圆钢对矩形组合支架进行结构优化,模拟表明优化后的组合支架整体承载力提高了36%。在工程实践中,基于矩形钢管混凝土组合支架的支护方案应用3年来无明显变形,膨胀性软岩巷道交岔点长期保持稳定,对类似条件下的交岔点支护具有重要指导意义。 展开更多
关键词 岩石力学 软岩巷道交岔点 钢管混凝土组合支架 数值模拟 抗弯强化
原文传递
专用处理器比较分析 被引量:4
7
作者 鄢贵海 卢文岩 +1 位作者 李晓维 孙凝晖 《中国科学:信息科学》 CSCD 北大核心 2022年第2期358-375,共18页
微处理器是现代信息系统的核心基础设施.大数据、人工智能、5G等技术的快速发展催生了数据量的爆发性增长,随之对数据处理能力的需求也急剧增长.专用计算技术被广泛认为是后摩尔时代的计算机体系结构演化的重要方向.专用处理器技术的发... 微处理器是现代信息系统的核心基础设施.大数据、人工智能、5G等技术的快速发展催生了数据量的爆发性增长,随之对数据处理能力的需求也急剧增长.专用计算技术被广泛认为是后摩尔时代的计算机体系结构演化的重要方向.专用处理器技术的发展一直伴生着通用处理器的发展,数字信号处理技术甚至早于传统意义上的通用处理器.通用处理器技术的发展,不仅在商业上取得了巨大的成功,很多关键技术也被专用处理器吸收借鉴用于提升专用计算的性能、优化可编程性等.本文主要分析了数字信号处理器(DSP)、图像处理器(GPU)、深度学习处理器(AI芯片)和网络处理器(NPU)的关键技术特征,并进一步对专用计算架构未来发展可能涉及的关键点作出了简要的评述. 展开更多
关键词 专用处理器 数字信号处理 图像处理 深度学习 网络处理
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部