-
题名面向业务需求的算法路径自组配模型
- 1
-
-
作者
刘耀
童昕
陈一风
-
机构
中国科学技术信息研究所信息技术支持中心
北京大学软件与微电子学院
-
出处
《计算机应用》
CSCD
北大核心
2023年第6期1768-1778,共11页
-
基金
国家社会科学基金资助项目(21BTQ011)。
-
文摘
算法平台作为自动机器学习的实现方式近年来受到广泛关注,然而这些平台的业务流程均需要人工搭建,且这些平台存在模型调用不灵活以及无法针对特定业务定制化的自动算法构建的问题。针对这些问题,提出了一种面向业务需求的算法路径自组配模型。首先,基于图卷积网络(GCN)与word2vec表示对代码的序列特征与结构特征同时建模;然后,进一步通过聚类模型发现算法集合中的功能,并基于得到的功能子集为子集间算法组件的路径发现作准备;最后,基于先验知识训练得到关系发现模型与排序模型,挖掘候选代码组件的自组织路径,从而实现算法代码自组配。使用所提评价指标进行对比分析,所提模型的最好结果为0.8,而Okapi BM25+word2vec基线模型的最好结果为0.21。所提模型在一定程度上解决了传统代码表示方法中代码结构与语义信息缺失的问题,并为精细化算法流程自组织和算法管道自动构建的研究奠定了基础。
-
关键词
自然语言处理
排序学习
代码解析
代码资源结构化
代码表示
-
Keywords
Natural Language Processing(NLP)
learning to rank
code parsing
code resource structuring
code representation
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-