-
题名基于改动树检索的拉取请求描述生成方法
- 1
-
-
作者
蒋竞
刘子豪
张莉
汪亮
-
机构
复杂关键软件环境全国重点实验室(北京航空航天大学)
计算机软件新技术国家重点实验室(南京大学)
-
出处
《软件学报》
EI
CSCD
北大核心
2024年第11期5065-5082,共18页
-
基金
科技创新2030—“新一代人工智能”重大项目(2021ZD0112901)
国家自然科学基金(62177003,62172203)。
-
文摘
随着开源人工智能系统规模的扩大,软件的开发与维护也变得困难.GitHub是开源社区最重要的开源项目托管平台之一,通过GitHub提供的拉取请求系统,开发者可以方便地参与到开源项目的开发.拉取请求的描述可以帮助项目核心团队理解拉取请求的内容和开发者的意图,促进拉取请求被接受.当前,存在可观比例的开发者没有为拉取请求提供描述,既增加了核心团队的工作负担,也不利于项目日后的维护工作.提出一种自动为拉取请求生成描述的方法PRSim.所提方法提取拉取请求包含的提交说明、注释更新和代码改动等特征,建立语法改动树,使用树结构自编码器编码以检索代码改动相似的其他拉取请求,参照相似拉取请求的描述,使用编码器-解码器网络概括提交说明和注释更新,生成新拉取请求的描述.实验结果表明,PRSim的生成效果在Rouge-1、Rouge-2和Rouge-L这3个指标的F1分数上分别达到36.47%、27.69%和35.37%,与现有方法LeadCM相比分别提升了34.3%、75.2%和55.3%,与方法Attn+PG+RL相比分别提升了16.2%、22.9%和16.8%,与方法PRHAN相比分别提升了23.5%、72.0%和24.8%.
-
关键词
拉取请求
语法改动树
相似度计算
自动摘要
开源社区
-
Keywords
pull request
syntax modification tree
similarity calculation
automatic summarization
open-source community
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-