期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
软件开发活动数据集的层次化及多版本化方法
1
作者 范瑛 《信息与电脑》 2020年第10期73-74,共2页
在开源软件迅速崛起、各种软件开发工具逐渐普及的大背景下,互联网上积累了大量开发活动数据。在运用这些数据构建数据集的过程中,由于其具有可追溯性差、适用范围窄等特点,造成了开发活动数据质量不高以及分析结果缺乏准确性的问题。... 在开源软件迅速崛起、各种软件开发工具逐渐普及的大背景下,互联网上积累了大量开发活动数据。在运用这些数据构建数据集的过程中,由于其具有可追溯性差、适用范围窄等特点,造成了开发活动数据质量不高以及分析结果缺乏准确性的问题。就目前的软件开发技术手段而言,对数据集进行多版本、多层次开发是提高数据质量的一个有效方式。笔者主要阐述了在构建数据集的过程中,如何对其进行多版本、多层次开发。 展开更多
关键词 数据驱动的软件工程 数据 数据质量
下载PDF
软件开发活动数据集的层次化、多版本化方法 被引量:2
2
作者 朱家鑫 周明辉 《软件学报》 EI CSCD 北大核心 2019年第7期2109-2123,共15页
随着开源软件的兴起及软件开发支撑工具的普及,Internet上积累了大量开放的软件开发活动数据,越来越多的实践者与研究者尝试从中获取提高软件开发效率和产品质量的洞察。为了提高数据分析的效率、方便分析结果的重现与对比,许多工作提... 随着开源软件的兴起及软件开发支撑工具的普及,Internet上积累了大量开放的软件开发活动数据,越来越多的实践者与研究者尝试从中获取提高软件开发效率和产品质量的洞察。为了提高数据分析的效率、方便分析结果的重现与对比,许多工作提出了构建与使用共享数据集。然而,现有软件开发活动数据集的构建过程可追溯性差、适用范围窄,对数据随时间、环境发生的变化欠考虑。这些不足直接威胁数据的质量及分析结果的有效性。针对该问题,提出一种层次化、多版本化的方法来构建与使用软件开发活动数据集。层次化是指在数据集中包括收集和后续处理所得的原始、中间和最终数据,建立数据集的可追溯性并扩展其适用范围。多版本化是指通过多种方式进行多次数据收集,使数据使用者能够观察到数据的变化,为数据质量及分析结果有效性的验证和提高创造条件。通过基于该方法构建的Mozilla问题追踪数据集进行示范,并验证了该方法能够帮助数据使用者高效地使用数据。 展开更多
关键词 数据驱动的软件工程 软件开发活动数据 数据分析 数据质量 数据
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部