-
题名基于结构和语义的代码分类以及聚类方法
被引量:1
- 1
-
-
作者
金岩磊
秦冠军
姜凯
甘迪
史志成
周宇
-
机构
南京南瑞继保电气有限公司
南京航空航天大学计算机科学与技术学院
-
出处
《计算机应用与软件》
北大核心
2023年第7期1-6,33,共7页
-
基金
中央高校基本科研业务费专项资金项目(NS2019055)
江苏高校“青蓝工程”项目。
-
文摘
提出一个基于抽象语法树(Abstract Syntax Tree,AST)生成代码向量解决代码分类以及聚类任务的深度学习模型,该模型结合了卷积以及循环神经网络能够同时对AST的结构和语义信息进行提取,在代码分类任务上,分类的准确率与该领域最优的模型效果十分接近,速度却是其1.55倍。聚类任务上Jaccard系数(Jaccard Coefficient)、FMI(Fowlkes and Mallows Index)指数、ACC准确率分别达到74.4%、75.2%和83.6%,对比当下前沿的深度学习模型占有优势。
-
关键词
抽象语法树
代码理解
代码分类
代码聚类
循环神经网络
卷积神经网络
-
Keywords
Abstract syntax tree
Code comprehension
Code classification
Code clustering
Recurrent neural network
Convolutional neural network
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向软件工程数据挖掘的开发测试技术
- 2
-
-
作者
魏翔
-
机构
湖南潇湘技师学院
-
出处
《计算机光盘软件与应用》
2015年第3期61-62,共2页
-
文摘
在软件工程实践中,遇到的有些难题单纯地通过一些传统的这个工程方法,或者是软件工具来处理。但是软件工程数据在这个生命周期中反复积累之后,大部分过去无法利用传统软件工程方法来来处理的这些问题,就能够利用这个软件工程面向数据挖掘的积累来处理完成。在本课题中,探究了基于XML的安全配置J2EE应用程序框架回归测试用例选择的这种方法。利用在实际工程证明基于XML配置J2EE应用程序框架的方法,能够得到绝大部分可以找到缺陷的这个回归测试例。
-
关键词
程序理解
分层聚类代码
分类
回归测试例选择
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
-