-
题名浅谈软组织损伤
- 1
-
-
作者
包盼盼
木日根吉雅
-
机构
不详
-
出处
《中国蒙医药(蒙)》
2024年第2期42-46,共5页
-
-
分类号
R29
[医药卫生—民族医学]
-
-
题名面向开源源码大数据的数据质量研究
被引量:3
- 2
-
-
作者
包盼盼
陶传奇
黄志球
-
机构
南京航空航天大学计算机科学与技术学院
南京航空航天大学高安全系统的软件开发与验证技术工信部重点实验室
南京大学计算机软件新技术国家重点实验室
软件新技术与产业化协同创新中心
-
出处
《计算机科学与探索》
CSCD
北大核心
2020年第3期389-400,共12页
-
基金
国家重点研发计划项目 NS2019058
国家自然科学基金 2018YFB1003900
+2 种基金
计算机软件新技术国家重点实验室基金 61602267,61402229
南京航空航天大学研究生创新基地(实验室)开放基金项目 KFKT2018B19
中央高校基本科研业务费专项资金 NS2019058~~
-
文摘
基于开源源码大数据进行代码生成、缺陷预测等是当前智能化软件开发方法与技术的重要研究内容。然而现有的关注点主要聚焦于各种推荐、预测等智能算法的研究,较少对研究所使用数据的质量进行评估与分析。大部分智能化软件开发研究的数据来源于开源数据托管平台,受限于开发者自身水平,它们并不能保证都具有较高质量。根据"garbage in,garbage out",这会影响最终结果质量。源码数据的质量对相关的研究有重要影响,却没有得到足够的重视。针对上述问题,提出了一种面向开源源码大数据的方法块数据质量评估方法。首先研究如何定义和评估GitHub上抽取的源码的数据质量问题,然后对开源源码从不同维度进行质量评估。通过该源码数据质量评估方法可以帮助相关研究人员构建具有更高质量的数据集,进而提高智能化相关研究,比如代码生成、缺陷预测等的结果质量。
-
关键词
编程智能化
开源大数据
源码数据
数据质量
-
Keywords
intelligent programming
open source big data
source data
data quality
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名编程现场上下文深度感知的代码行推荐
被引量:1
- 3
-
-
作者
陶传奇
包盼盼
黄志球
周宇
张智轶
-
机构
南京航空航天大学计算机科学与技术学院
高安全系统的软件开发与验证技术工信部重点实验室(南京航空航天大学)
计算机软件新技术国家重点实验室(南京大学)
-
出处
《软件学报》
EI
CSCD
北大核心
2021年第11期3351-3371,共21页
-
基金
国家重点研发计划(2018YFB1003900)
国家自然科学基金(61602267,61402229)
计算机软件新技术国家重点实验室基金(KFKT2018B19)。
-
文摘
在软件开发的编程现场,有大量与当前开发任务相关的信息,比如代码上下文信息、用户开发意图等.如果能够根据已有的编程现场上下文给开发人员推荐当前代码行,不仅能够帮助开发人员更好地完成开发任务,还能提高软件开发的效率.而已有的一些方法通常是进行代码修复或者补全,又或者只是基于关键词匹配的搜索方法,很难达到推荐完整代码行的要求.针对上述问题,一种可行的解决方案是基于已有的海量源码数据,利用深度学习析取代码行的相关上下文因子,挖掘隐含的上下文信息,为精准推荐提供基础.因此,提出了一种基于深度学习的编程现场上下文深度感知的代码行推荐方法,能够在已有的大规模代码数据集中学习上下文之间潜在的关联关系,利用编程现场已有的源码数据和任务数据得到当前可能的代码行,并推荐Top-N给编程人员.代码行深度感知使用RNN Encoder-Decoder,该框架能够将编程现场已有的若干行上文代码行进行编码,得到一个包含已有代码行上下文信息的向量,然后根据该向量进行解码,得到预测的Top-N代码行输出.利用在开源平台上收集的大规模代码行数据集,对方法进行实验并测试,结果显示,该方法能够根据已有的上下文推荐相关的代码行给开发人员,Top-10的推荐准确率有60%左右,并且MRR值在0.3左右,表示用户满意的推荐项排在N个推荐结果中比较靠前的位置.
-
关键词
编程现场
代码上下文
代码行
深度学习
RNN
Encoder-Decoder
-
Keywords
onsite programming
source code context
code line
deep learning
RNN Encoder-Decoder
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-