期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
BigDataBench:开源的大数据系统评测基准 被引量:34
1
作者 詹剑锋 高婉铃 +6 位作者 王磊 李经伟 魏凯 罗纯杰 韩锐 田昕晖 姜春宇 《计算机学报》 EI CSCD 北大核心 2016年第1期196-211,共16页
大数据系统的蓬勃发展催生了大数据基准测试的研究,如何公正地评价不同的大数据系统以及怎样根据需求选取合适的系统成为了热点问题.然而,应用领域的广泛性、数据类型的多样性和数据操作的复杂性使得大数据基准测试集的设计面临很大的挑... 大数据系统的蓬勃发展催生了大数据基准测试的研究,如何公正地评价不同的大数据系统以及怎样根据需求选取合适的系统成为了热点问题.然而,应用领域的广泛性、数据类型的多样性和数据操作的复杂性使得大数据基准测试集的设计面临很大的挑战.现有的相关基准测试工作要么针对某一类特定的应用或软件栈,要么根据流行度主观地选择大数据负载,难以全面覆盖大数据的多样性和复杂性.针对现有工作的不足,文中讨论大数据评测基准需要满足的需求,并研制了一个跨系统、体系结构、数据管理3个领域的大数据基准测试开源程序集——BigDataBench.它覆盖5个典型的应用领域(搜索引擎、电子商务、社交网络、多媒体、生物信息学),包含结构化、半结构化、非结构化的数据类型,涵盖离线分析、交互式分析、在线服务、NoSQL这4种负载类型.目前包含14个真实数据集、3种类型的数据生成工具以及33个负载的不同软件栈实现.BigDataBench已广泛应用到学术界和工业界中,应用案例包括负载分析、体系结构设计、系统优化等.基于BigDataBench,中国信息通信研究院联合中国科学院计算技术研究所、华为等国内外知名公司和科研机构共同制定了国内首个工业标准的大数据平台性能评测标准. 展开更多
关键词 大数据 基准测试 工业标准 测试方法 数据生成 应用案例
下载PDF
肽段的理论串联质谱图预测方法研究进展 被引量:1
2
作者 周撷璇 任睿 +6 位作者 高婉铃 黄运有 曾文锋 孔德飞 郝天舒 张知非 詹剑锋 《生物化学与生物物理进展》 SCIE CAS CSCD 北大核心 2019年第2期169-180,共12页
基于串联质谱技术的蛋白质组学已经成为生命科学领域的重要工具,其中肽段的理论串联质谱图(通常也被称为二级谱图)预测问题在近年来广受关注.大量高质量质谱数据的积累和计算技术的发展为此问题的解决提供了有效途径.肽段的理论二级谱... 基于串联质谱技术的蛋白质组学已经成为生命科学领域的重要工具,其中肽段的理论串联质谱图(通常也被称为二级谱图)预测问题在近年来广受关注.大量高质量质谱数据的积累和计算技术的发展为此问题的解决提供了有效途径.肽段的理论二级谱图预测的方法可以分为两大类,一类是基于物理模型的方法,即基于移动质子模型的方法,例如MassAnalyzer、MS-Simulator;另一类是基于机器学习的方法,包括集成学习相关算法和基于神经网络的方法,例如PeptideART、MS2PIP、MS2PBPI和p Deep等.本文对这两大类方法进行了整理和综述,并简要指出了目前理论谱图预测方法存在的一些不足,展望了未来的发展方向. 展开更多
关键词 质谱 蛋白质组学 移动质子模型 机器学习 深度学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部