-
题名意外充分性引导的深度神经网络测试样本生成
- 1
-
-
作者
郭虹静
陶传奇
黄志球
-
机构
南京航空航天大学计算机科学与技术学院
高安全系统的软件开发与验证技术工信部重点实验室(南京航空航天大学)
计算机软件新技术国家重点实验室(南京大学)
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2024年第4期1003-1017,共15页
-
基金
国家自然科学基金重点项目(U224120044)
国家自然科学基金项目(62202223)
+2 种基金
江苏省自然科学基金项目(BK20220881)
计算机软件新技术国家重点实验室开放基金资助项目(KFKT2021B32)
中央高校基本科研业务费专项资金(NT2022027)。
-
文摘
由于深度神经网络(deep neural network,DNN)模型的复杂性和不确定性等属性,对模型的一般行为和边界行为进行充分的测试是保障模型质量的重要手段.当前的研究主要基于制定的覆盖准则,结合模糊测试技术生成衍生测试样本,从而提升测试充分性,但较少综合考虑测试样本的多样性及个体揭错能力.意外充分性指标量化测试样本与训练集在神经元输出方面的差异,是测试充分性评估的重要指标,目前缺乏基于此指标的测试样本生成方法.因此,提出了一种意外充分性引导的深度神经网络测试样本生成方法,首先,筛选对于决策结果贡献较大的重要神经元,以其输出值为特征,改进意外充分性指标;其次,基于测试样本的意外充分性度量筛选具有揭错能力的种子样本;最后,利用覆盖引导的模糊测试思想,将测试样本的意外充分性值和DNN模型预测的类别概率差异作为联合优化目标,利用梯度上升算法计算扰动,迭代生成测试样本.为了验证所提方法的有效性,选取5个DNN模型作为被测对象,涵盖4种不同的图像数据集,实验结果表明,改进的意外充分性指标能够有效捕捉异常的测试样本,同时减少计算时间开销.在测试样本生成方面,与方法DeepGini和RobOT相比,基于所提的种子样本选择策略生成的衍生测试集的意外覆盖率最高提升了5.9个百分比和15.9个百分比.相比于方法DLFuzz和DeepXplore,所提方法的意外覆盖率最高提升了26.5个百分比和33.7个百分比.
-
关键词
软件测试
测试样本生成
测试覆盖
深度神经网络
意外充分性
-
Keywords
software testing
test input generation
test coverage
deep neural network
surprise adequacy
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-