-
题名自然语言数据驱动的智能化软件安全评估方法
被引量:3
- 1
-
-
作者
张一帆
汤恩义
苏琰梓
杨开懋
匡宏宇
陈鑫
-
机构
计算机软件新技术国家重点实验室(南京大学)
南京大学计算机科学与技术系
南京大学软件学院
-
出处
《软件学报》
EI
CSCD
北大核心
2018年第8期2336-2349,共14页
-
基金
国家重点研发计划(2016YFB1000802)
国家自然科学基金(61772260
61402222)~~
-
文摘
软件安全性是衡量软件是否能够抵御恶意攻击的重要性质.在当前互联网环境下,黑客攻击无处不在,因而估计软件中可能含有的漏洞数量与类型,即对软件进行安全评估,变得十分必要.在实际中,用户不仅需要对未发布或者最新发布的软件实施安全性评估,对已发布软件也会有一定的安全评估需求,例如,当用户需要从市场上互为竞争的多款软件中做出选择,就会希望能够花费较低成本、较为客观地对这些软件进行第三方的评估与比较.提出了一种由自然语言数据驱动的智能化软件安全评估方法来满足这一要求.该方法基于待评估软件现有用户的使用经验信息来评估软件的安全性.它首先自适应地爬取用户在软件使用过程中对软件的自然语言评价数据,并利用深度学习方法与机器学习评估模型的双重训练来获得软件的安全性评估指标.由于所提出的自适应爬虫能够在反馈中调整特征词,并结合搜索引擎来获得异构数据,因而可通过采集广泛的自然语言数据来进行安全评估.另外,使用一对多的机器翻译训练能够有效地解决将自然语言数据转换为语义编码的问题,使得用于安全评估的机器学习模型可以建立在自然语言的语义特征基础上.在国际通用漏洞披露数据库(CVE)和美国国家漏洞数据库(NVD)上对该方法进行了实验,结果表明,该方法在评估软件漏洞数量、漏洞类型以及漏洞严重程度等指标上十分有效.
-
关键词
软件安全评估
自然语言处理
机器学习
网络爬虫
-
Keywords
software safety evaluation
natural language processing
machine learning
Web crawler
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于爬虫的软件缺陷预测
- 2
-
-
作者
杨开懋
施小逸
汤恩义
-
机构
南京大学计算机软件新技术国家重点实验室
南京大学计算机软件研究所
-
出处
《南昌教育学院学报》
2016年第6期125-128,共4页
-
基金
国家自然科学基金(61402222)
-
文摘
随着软件的规模和复杂度持续上升,在软件开发中不可避免地会引入缺陷,而如何对软件进行缺陷预测也成为了软件工程研究的热点领域之一。现有的软件缺陷预测方法主要根据源码结构提取预测信息而忽视了软件缺陷报告的作用,而软件缺陷的相关报告广泛存在于各软件技术论坛上,也是软件缺陷预测的重要依据。因此本文提出了一种基于爬虫的软件缺陷预测方法,其主要手段是通过爬虫获取技术论坛中用户提交的缺陷报告信息,并通过机器学习技术的处理,指导开发人员在开发过程中避免相关缺陷,提高软件质量。
-
关键词
网络爬虫
机器学习
缺陷预测
-
Keywords
network crawler
machine learning
software failure prediction
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
-