期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于主题建模技术的克隆群映射方法
被引量:
11
1
作者
张瑞霞
张丽萍
+1 位作者
王春晖
侯敏
《计算机工程与设计》
北大核心
2015年第6期1524-1529,共6页
针对对源代码进行拷贝、粘贴及修改活动会导致软件中出现大量的克隆代码的问题,将主题建模技术应用于克隆代码,提出一种克隆群映射方法。运用主题建模技术将映射问题由高维的代码空间转化到低维的主题空间上,通过主题的映射间接实现映...
针对对源代码进行拷贝、粘贴及修改活动会导致软件中出现大量的克隆代码的问题,将主题建模技术应用于克隆代码,提出一种克隆群映射方法。运用主题建模技术将映射问题由高维的代码空间转化到低维的主题空间上,通过主题的映射间接实现映射相邻版本克隆群的目的。对4款开源软件进行方法评估,实验结果表明,使用该方法的查全率和查准率均高达0.99,其能够有效准确地实现相邻版本的克隆群映射。
展开更多
关键词
克隆
代码
软件演化
主题
主题建模
克隆群映射
下载PDF
职称材料
基于改进向量空间模型的克隆群映射方法
被引量:
3
2
作者
陈桌
张丽萍
+2 位作者
王欢
张久杰
王春晖
《计算机应用》
CSCD
北大核心
2016年第7期2031-2037,共7页
针对Type-3克隆代码映射方法少且效率低等问题,提出了一种基于改进向量空间模型(VSM)的映射方法。该方法将改进的VSM引入到克隆代码分析中,从而得到一种可有效映射Type-1、Type-2以及Type-3克隆代码的克隆群映射方法。首先,将克隆群文...
针对Type-3克隆代码映射方法少且效率低等问题,提出了一种基于改进向量空间模型(VSM)的映射方法。该方法将改进的VSM引入到克隆代码分析中,从而得到一种可有效映射Type-1、Type-2以及Type-3克隆代码的克隆群映射方法。首先,将克隆群文档预处理得到去除无用词的代码文档,同时提取克隆群文档的文件名、函数名等特征项;其次,提取并构建克隆群词频向量空间,利用余弦算法计算出克隆群相似度;然后,通过克隆群相似度和特征项的匹配构建克隆群映射,最终得到克隆群映射结果。对5款开源软件进行实验并人工验证,所提方法能在低时耗的前提下,保证查全率和查准率均不低于96.1%和97.1%。实验结果表明了所提方法的可行性,为后期软件演化分析提供数据支撑。
展开更多
关键词
克隆
代码
克隆群映射
向量空间模型
特征项
词频
下载PDF
职称材料
基于LDA和DBSCAN的软件多版本克隆群映射方法
被引量:
2
3
作者
葛广帅
刘东升
侯敏
《计算机应用研究》
CSCD
北大核心
2017年第2期481-486,共6页
针对克隆群映射大多基于相邻版本对比,当克隆群在中期版本短暂消失,实现多版本间映射存在困难,提出一种基于LDA和DBSCAN的软件多版本克隆群映射方法。首先,对所有版本的克隆群进行预处理,获得克隆群文档集合;其次,根据贝叶斯信息准则选...
针对克隆群映射大多基于相邻版本对比,当克隆群在中期版本短暂消失,实现多版本间映射存在困难,提出一种基于LDA和DBSCAN的软件多版本克隆群映射方法。首先,对所有版本的克隆群进行预处理,获得克隆群文档集合;其次,根据贝叶斯信息准则选取合适主题数T,进行主题概率模型训练,将所有克隆群都表示成T个主题的概率分布向量;再次,计算克隆群之间的JS距离,利用DBSCAN算法将同源的克隆群聚成一簇;最后,对同簇的克隆群按版本先后排序,得到多版本克隆群映射结果。对五款开源软件83个版本进行了映射实验,结果表明查全率、查准率均在98%以上,为克隆代码分析、管理提供了有力支持。
展开更多
关键词
克隆群映射
软件演化
LDA
DBSCAN
克隆
代码
下载PDF
职称材料
题名
基于主题建模技术的克隆群映射方法
被引量:
11
1
作者
张瑞霞
张丽萍
王春晖
侯敏
机构
内蒙古师范大学计算机与信息工程学院
出处
《计算机工程与设计》
北大核心
2015年第6期1524-1529,共6页
基金
国家自然科学基金项目(61462071
61363017)
+2 种基金
内蒙古自治区高等学校科学研究基金项目(NJZY13048)
内蒙古自然科学基金项目(2014MS0613)
内蒙古师范大学科学研究基金项目(2013ZRYB06)
文摘
针对对源代码进行拷贝、粘贴及修改活动会导致软件中出现大量的克隆代码的问题,将主题建模技术应用于克隆代码,提出一种克隆群映射方法。运用主题建模技术将映射问题由高维的代码空间转化到低维的主题空间上,通过主题的映射间接实现映射相邻版本克隆群的目的。对4款开源软件进行方法评估,实验结果表明,使用该方法的查全率和查准率均高达0.99,其能够有效准确地实现相邻版本的克隆群映射。
关键词
克隆
代码
软件演化
主题
主题建模
克隆群映射
Keywords
code clone
software evolution
topic
topic modeling
clone group mapping
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于改进向量空间模型的克隆群映射方法
被引量:
3
2
作者
陈桌
张丽萍
王欢
张久杰
王春晖
机构
内蒙古师范大学计算机与信息工程学院
出处
《计算机应用》
CSCD
北大核心
2016年第7期2031-2037,共7页
基金
国家自然科学基金资助项目(61363017
61462071)
+1 种基金
内蒙古自然科学基金资助项目(2014MS0613)
内蒙古教育厅资助项目(NJZY14039)~~
文摘
针对Type-3克隆代码映射方法少且效率低等问题,提出了一种基于改进向量空间模型(VSM)的映射方法。该方法将改进的VSM引入到克隆代码分析中,从而得到一种可有效映射Type-1、Type-2以及Type-3克隆代码的克隆群映射方法。首先,将克隆群文档预处理得到去除无用词的代码文档,同时提取克隆群文档的文件名、函数名等特征项;其次,提取并构建克隆群词频向量空间,利用余弦算法计算出克隆群相似度;然后,通过克隆群相似度和特征项的匹配构建克隆群映射,最终得到克隆群映射结果。对5款开源软件进行实验并人工验证,所提方法能在低时耗的前提下,保证查全率和查准率均不低于96.1%和97.1%。实验结果表明了所提方法的可行性,为后期软件演化分析提供数据支撑。
关键词
克隆
代码
克隆群映射
向量空间模型
特征项
词频
Keywords
code clone
clone group mapping
Vector Space Model(VSM)
feature item
word frequency
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于LDA和DBSCAN的软件多版本克隆群映射方法
被引量:
2
3
作者
葛广帅
刘东升
侯敏
机构
内蒙古师范大学计算机与信息工程学院
出处
《计算机应用研究》
CSCD
北大核心
2017年第2期481-486,共6页
基金
国家自然科学基金资助项目(61363017
61462071)
+2 种基金
内蒙古自然科学基金资助项目(2014MS0613
2015MS0606)
内蒙古自治区高等学校科学研究项目(NJZY16045)
文摘
针对克隆群映射大多基于相邻版本对比,当克隆群在中期版本短暂消失,实现多版本间映射存在困难,提出一种基于LDA和DBSCAN的软件多版本克隆群映射方法。首先,对所有版本的克隆群进行预处理,获得克隆群文档集合;其次,根据贝叶斯信息准则选取合适主题数T,进行主题概率模型训练,将所有克隆群都表示成T个主题的概率分布向量;再次,计算克隆群之间的JS距离,利用DBSCAN算法将同源的克隆群聚成一簇;最后,对同簇的克隆群按版本先后排序,得到多版本克隆群映射结果。对五款开源软件83个版本进行了映射实验,结果表明查全率、查准率均在98%以上,为克隆代码分析、管理提供了有力支持。
关键词
克隆群映射
软件演化
LDA
DBSCAN
克隆
代码
Keywords
clone group mapping
software evolution
LDA
DBSCAN
clone code
分类号
TP311.54 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于主题建模技术的克隆群映射方法
张瑞霞
张丽萍
王春晖
侯敏
《计算机工程与设计》
北大核心
2015
11
下载PDF
职称材料
2
基于改进向量空间模型的克隆群映射方法
陈桌
张丽萍
王欢
张久杰
王春晖
《计算机应用》
CSCD
北大核心
2016
3
下载PDF
职称材料
3
基于LDA和DBSCAN的软件多版本克隆群映射方法
葛广帅
刘东升
侯敏
《计算机应用研究》
CSCD
北大核心
2017
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部