-
题名开源社区众包任务的开发者推荐方法
被引量:3
- 1
-
-
作者
蒋竞
平源
吴秋迪
张莉
-
机构
北京航空航天大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2022年第12期99-108,共10页
-
基金
科技创新2030——“新一代人工智能”重大项目(2018AAA0102304)
国家自然科学基金(62177003)
中央高校基本科研业务费专项资金(YWF-20-BJ-J-1018)。
-
文摘
Gitcoin是一个基于开源社区GitHub的众包平台。在Gitcoin中,项目团队可以发布开发任务,开发者选择感兴趣的任务并注册,发布者选择合适的开发者完成任务并发放赏金。但是一些任务因缺乏注册者而失败,部分任务未能合格完成,顺利完成的任务也面临开发者注册间隔时间长的问题。因此,需要一种开发者推荐方法,快速为众包任务发现合适的开发人员,缩短开发者注册众包任务的时间,发现潜在合适的开发者并激励其注册,促进众包任务顺利完成。文中提出了一种基于LGBM分类算法的开发者推荐方法DEVRec(Developer Recommendation)。该方法提取任务特征、开发者特征、开发者和任务的关系特征,使用LGBM分类算法进行二分类,计算开发者注册任务的概率,最终得到众包任务的推荐人员列表。为了评估推荐效果,获取Gitcoin的1599个已完成众包任务、343名任务发布者和1605名开发者。实验结果显示,与对比方法Policy Model相比,DEVRec前1位、前3位、前5位和前10位推荐的准确度及MRR指标分别提高了73.11%,119.07%,86.55%,29.24%和62.27%。
-
关键词
开源软件
开发者推荐
众包开发
特征提取
机器学习
-
Keywords
Open-source software
Developer recommendation
Crowdsourcing development
Feature extraction
Machine learning
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于多关系知识增强的开发者推荐算法
- 2
-
-
作者
杜军威
王昭哲
于旭
胡强
江峰
巩敦卫
-
机构
青岛科技大学信息科学技术学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2023年第11期3111-3119,共9页
-
基金
国家自然科学基金(No.62172249,No.61973180)
山东省自然科学基金(No.ZR2021MF092,No.ZR2022MF326)
中央高校基本科研业务费(No.93K172022K01)。
-
文摘
近年来,随着众包平台的不断发展,信息过载问题日趋严重,任务难以及时找到可靠的开发者完成,为任务推荐合适的开发者变得至关重要.传统推荐方法存在两大挑战:一是任务和开发者的文本特征高度简练,传统推荐方法聚焦于表面文本信息,未发现其中包含的大量知识实体;二是任务具有一次性,导致显式交互数据极其稀疏.为了解决上述挑战,本文提出一种基于多关系知识增强的开发者推荐算法.对于一个任务和开发者,首先将他们包含的文本内容中的每个单词与知识图谱中的相关实体关联起来,用于丰富任务和开发者的信息表示.除直接相关联的实体外,还使用每个实体的上下文实体集合来提供更多的信息.然后,对于开发者本文使用多关系邻域聚合的方式增强其特征表示,并使用注意力模块区分开发者对任务的关注度.最终获得的用户和开发者的嵌入输入到深度神经网络中进行预测.在真实的Topcoder数据集上进行广泛的实验,结果表明,本文方法在正确率和序位倒数均值上相比于最佳对比方法平均提高11.7%和17.5%.
-
关键词
开发者推荐
软件众包开发
多关系
知识图谱
图神经网络
-
Keywords
developer recommendation
crowdsourced software development
multi-relationship
knowledge graph
graph neural network
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种结合显式特征和隐式特征的开发者混合推荐算法
被引量:9
- 3
-
-
作者
于旭
何亚东
杜军威
王昭哲
江峰
巩敦卫
-
机构
青岛科技大学信息科学技术学院
中国矿业大学信息与电气工程学院
-
出处
《软件学报》
EI
CSCD
北大核心
2022年第5期1635-1651,共17页
-
基金
国家自然科学基金(6217072142,61773384,61973180)
山东省自然科学基金(ZR2021MF092,ZR2019MF014,ZR2018MF007,ZR2019MF033)
山东省重点研发项目(2018GGX101052)。
-
文摘
现有开发者推荐算法通过对任务和开发者的显式信息进行挖掘,抽取任务和开发者的显式特征,完成针对任务的开发者推荐.然而,由于显式信息中的描述信息是主观的,往往是不精确的,现有基于显式特征的开发者推荐算法性能不够理想.众包软件开发平台除包含大量不精确的描述信息外,还包含客观的、较准确的“任务—开发者”成绩信息,可以有效地推断任务和开发者的隐式特征.考虑到隐式特征作为显式特征的补充,将有效缓解描述信息不精确的难题,提出一种结合显式特征和隐式特征的开发者混合推荐算法.首先,利用任务和开发者的平台可见信息充分提取显式特征,提出面向显式特征的因子分解机(FM)推荐模型建模任务、开发者显式特征和相应评分的映射关系.然后,利用“任务—开发者”成绩矩阵提取隐式特征,提出面向隐式特征的矩阵分解(MF)推荐模型.最后,融合面向显式特征的FM推荐模型和面向隐式特征的MF推荐模型,提出多层感知器融合算法.进一步,针对冷启动问题,首先,基于历史数据,构建多层感知器模型建模显式特征到隐式特征的映射关系.然后,针对冷启动任务或冷启动开发者,通过任务或开发者的显式特征求解相应的隐式特征.最后,基于已训练好的多层感知器融合算法预测评分.在Topcoder软件众包平台的仿真实验表明本文算法相对于对比算法在4种不同测试指标上具有明显的优势.
-
关键词
软件众包开发
开发者推荐
混合推荐算法
冷启动难题
多层感知器融合模型
因子分解机
-
Keywords
crowdsourcing software development
developer recommendation
hybrid recommendation algorithm
cold-start problem
multilayer perceptron fusion algorithm
factorization machine(FM)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-