-
题名面向软件仓库挖掘的数据驱动特征提取方法
被引量:4
- 1
-
-
作者
李晓晨
江贺
任志磊
-
机构
大连理工大学软件学院
-
出处
《计算机科学》
CSCD
北大核心
2015年第9期159-164,共6页
-
基金
教育部新世纪优秀人才支持计划(NCET-13-0073)
国家自然科学基金(61175062
61370144)资助
-
文摘
在软件仓库挖掘领域,通常将软件工程任务转换成数据挖掘问题进行解决。领域特征的使用严重影响了软件任务的解决效果。然而,如何根据特定任务从软件仓库数据中提取有价值的特征,在软件仓库挖掘领域尚缺乏系统的研究。数据驱动特征提取方法是一种新的特征提取方法。对于给定的软件工程任务,该方法从任务的数据集中选取部分数据(如源代码、缺陷报告等),招募若干志愿者人工完成该任务,并要求志愿者说明在人工完成特定软件工程任务时所考虑的因素。通过分析这些因素,可以提取所需的领域特征。以缺陷报告摘要任务为例进行实验,结果表明新方法能够发现高效的领域特征,并取得比现有方法更好的预测效果。
-
关键词
软件仓库挖掘
数据驱动方法
特征提取
缺陷报告摘要
-
Keywords
Mining software repositories,Data driven approach,Feature extraction,Bug report summarization
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-