期刊文献+

基于代码结构知识的软件文档语义搜索方法 被引量:6

Software Text Semantic Search Approach Based on Code Structure Knowledge
下载PDF
导出
摘要 自然语言文本形式的文档是软件项目的重要组成部分.如何帮助开发者在大量文档中进行高效、准确的信息定位,是软件复用领域中的一个重要研究问题.提出了一种基于代码结构知识的软件文档语义搜索方法.该方法从软件项目的源代码中解析出代码结构图,并以此作为领域特定的知识来帮助机器理解自然语言文本的语义.这一语义信息与信息检索技术相结合,从而实现了对软件文档的语义检索.在StackOverflow问答文档数据集上的实验表明,与多种文本检索方法相比,该方法在平均准确率(mean average precision,简称MAP)上可以取得至少13.77%的提升. Natural language text is a common form of knowledge representation in various software artifacts.During the practice of software reuse,software developers usually need to search the large amount of textual resource.This paper presents a software text semantic search approach based on code structure knowledge.This approach extracts a code structure graph from software source code and leverages it as a domain-specific knowledge base to analyze the semantic meanings of natural language texts.The semantic information is combined with information retrieval technology to re-rank text search results semantically.Experimental results on StackOverflow dataset show that this approach achieves at least 13.77%improvement in mean average precision(MAP)comparing to several text retrieval approaches.
作者 林泽琦 邹艳珍 赵俊峰 曹英魁 谢冰 LIN Ze-Qi;ZOU Yan-Zhen;ZHAO Jun-Feng;CAO Ying-Kui;XIE Bing(Key Laboratory of High Confidence Software Technologies(Peking University),Ministry of Education,Beijing 100871,China;School of Electronics Engineering and Computer Science,Peking University,Beijing 100871,China;Peking University Information Technology Institute(Tianjin Binhai),Tianjin 300450,China)
出处 《软件学报》 EI CSCD 北大核心 2019年第12期3714-3729,共16页 Journal of Software
基金 国家重点研发计划(2016YFB1000801) 国家杰出青年科学基金(61525201)~~
关键词 软件复用 自然语言文本 代码结构知识 信息检索 语义搜索 software reuse natural language text code structure knowledge information retrieval semantic search
  • 相关文献

参考文献1

二级参考文献3

共引文献512

同被引文献34

引证文献6

二级引证文献22

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部