期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
以LDA为例的大规模分布式机器学习系统分析 被引量:5
1
作者 唐黎哲 冯大为 +2 位作者 李东升 李荣春 刘锋 《计算机应用》 CSCD 北大核心 2017年第3期628-634,共7页
针对构建大规模机器学习系统在可扩展性、算法收敛性能、运行效率等方面面临的问题,分析了大规模样本、模型和网络通信给机器学习系统带来的挑战和现有系统的应对方案。以隐含狄利克雷分布(LDA)模型为例,通过对比三款开源分布式LDA系统... 针对构建大规模机器学习系统在可扩展性、算法收敛性能、运行效率等方面面临的问题,分析了大规模样本、模型和网络通信给机器学习系统带来的挑战和现有系统的应对方案。以隐含狄利克雷分布(LDA)模型为例,通过对比三款开源分布式LDA系统——Spark LDA、PLDA+和Light LDA,在系统资源消耗、算法收敛性能和可扩展性等方面的表现,分析各系统在设计、实现和性能上的差异。实验结果表明:面对小规模的样本集和模型,Light LDA与PLDA+的内存使用量约为Spark LDA的一半,系统收敛速度为Spark LDA的4至5倍;面对较大规模的样本集和模型,Light LDA的网络通信总量与系统收敛时间远小于PLDA+与Spark LDA,展现出良好的可扩展性。"数据并行+模型并行"的体系结构能有效应对大规模样本和模型的挑战;参数弱同步策略(SSP)、模型本地缓存机制和参数稀疏存储能有效降低网络开销,提升系统运行效率。 展开更多
关键词 隐含狄利克雷分布 主题模型 文本聚类 吉布斯采样 变分贝叶斯推理 机器学习
下载PDF
一种基于改进BP神经网络的变压器故障诊断方法 被引量:7
2
作者 郭林 唐晶 +2 位作者 唐黎哲 詹彦豪 李飞 《控制与信息技术》 2021年第5期71-77,共7页
变压器内部故障与油中溶解不同组分、不同含量的气体之间的关系是目前进行变压器故障诊断的主要研究内容。文章提出一种基于BP神经网络的变压器故障诊断方法,其在传统反向传播神经网络(BPNN)基础上,引入ResNet残差网络模块思想,并在第... 变压器内部故障与油中溶解不同组分、不同含量的气体之间的关系是目前进行变压器故障诊断的主要研究内容。文章提出一种基于BP神经网络的变压器故障诊断方法,其在传统反向传播神经网络(BPNN)基础上,引入ResNet残差网络模块思想,并在第Ⅳ和第Ⅴ残差模块中嵌入支持向量机(SVM)分类器,从权重角度筛选对诊断结果准确率更具影响的特征向量;构造多个子数据集并对在分布式平台进行并行化训练后获得的不同性能的子分类器进行投票决策。结果表明,相比于基于传统BPNN的诊断方法,本文提出的方法对变压器故障诊断的平均准确率提升了8.56%,验证了该方法能提高变压器故障类型诊断的性能。 展开更多
关键词 变压器 BP神经网络 残差模块 故障诊断
下载PDF
基于小波分析和深度信念网络的牵引系统故障诊断 被引量:6
3
作者 唐黎哲 李珊 +1 位作者 詹彦豪 江平 《控制与信息技术》 2019年第5期77-81,共5页
为实现牵引系统故障的准确定位,文章提出了一种基于小波分析和深度信念网络的故障诊断方法,其分别采集机车牵引系统正常与故障时的数据,利用小波分析计算小波能量分布序列和小波熵来组成特征向量并作为训练数据,建立用于机车牵引系统故... 为实现牵引系统故障的准确定位,文章提出了一种基于小波分析和深度信念网络的故障诊断方法,其分别采集机车牵引系统正常与故障时的数据,利用小波分析计算小波能量分布序列和小波熵来组成特征向量并作为训练数据,建立用于机车牵引系统故障诊断的深度信念网络模型,以实现对牵引系统故障的有效定位。将该模型应用于离线机车故障记录数据分析中,结果表明,该方法能够实现高精度的牵引系统故障分类。 展开更多
关键词 故障诊断 深度信念网络 小波分析 牵引系统
下载PDF
基于SSD的Key-Value系统优化设计与实现 被引量:1
4
作者 刘峪竹 肖侬 +2 位作者 刘芳 陈志广 唐黎哲 《计算机研究与发展》 EI CSCD 北大核心 2014年第S1期136-141,共6页
随着互联网技术的迅猛发展,越来越多的非结构化数据涌入到人们的生活中,为这些数据建立高效的索引面临极大的挑战.键值数据库Key-Value以其结构简单和高扩展性而引起人们的广泛关注,已成为海量数据存储系统中的重要组成部分.由于Key-Va... 随着互联网技术的迅猛发展,越来越多的非结构化数据涌入到人们的生活中,为这些数据建立高效的索引面临极大的挑战.键值数据库Key-Value以其结构简单和高扩展性而引起人们的广泛关注,已成为海量数据存储系统中的重要组成部分.由于Key-Value系统对吞吐量要求较高,而基于Flash的固态硬盘(solid state drive,SSD)能够提供很高的随机读性能,在SSD上构建Key-Value系统已成为海量数据存储领域的一大研究热点.鉴于Flash具有非定点更新、寿命有限等特性,基于SSD的KeyValue系统必须针对Flash的特性作专门优化.以一种称为SkimpyStash的基于SSD的Key-Value系统为基础,提出了一种新的Key-Value系统低延迟存储系统(low latency store,LLStore).LLStore使用内存文件映射技术来减少针对SSD的IO请求,除此之外,针对SkimpyStash中低效的压缩策略,提出一种改进方法,可以在少量增加内存开销的情况下极大地减少查询时间.通过与原系统的性能比较实验,LLStore在平均查询时间上可以获得至少12%的加速. 展开更多
关键词 KEY-VALUE SSD 数据存储 内存文件映射 压缩
下载PDF
DPSM:可扩展高效的分布式子图匹配方法
5
作者 罗京丽 唐黎哲 《计算机工程与设计》 北大核心 2017年第8期2161-2166,共6页
为解决当前常见的子图匹配算法具有较高时间空间复杂度、难以实现大规模子图匹配和难以进行分布式并行等问题,提出一种可扩展高效的分布式子图匹配方法 DPSM。将查询图拆分为基本匹配单元,使用基本匹配单元分布式并行查询,以数据并行方... 为解决当前常见的子图匹配算法具有较高时间空间复杂度、难以实现大规模子图匹配和难以进行分布式并行等问题,提出一种可扩展高效的分布式子图匹配方法 DPSM。将查询图拆分为基本匹配单元,使用基本匹配单元分布式并行查询,以数据并行方式有效解决大规模有向图子图匹配任务。在Spark平台上实现DPSM系统,实验结果表明,DPSM能够在秒级时间完成拥有上亿顶点、数十亿边的大规模自然图子图匹配任务,具有良好的可扩展性。 展开更多
关键词 子图匹配 查询图 数据图 分布式 高效索引
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部