-
题名软件工程数据挖掘研究进展
被引量:24
- 1
-
-
作者
郁抒思
周水庚
关佶红
-
机构
复旦大学计算机科学技术学院
复旦大学上海市智能信息处理重点实验室
同济大学计算机科学与技术系
-
出处
《计算机科学与探索》
CSCD
2012年第1期1-31,共31页
-
基金
国家自然科学基金(60873040
60873070)~~
-
文摘
随着计算机软件的规模不断扩大,手工获取、开发和维护软件所需的信息越来越困难。数据挖掘技术可从软件工程数据中自动发现所需信息,加快软件开发进程。对软件工程数据挖掘的研究进展进行了综述。概述了软件工程数据挖掘的基本概念与技术挑战;详细评述了在软件工程各个阶段,数据挖掘技术所能发现的信息/知识,以及获取这些信息/知识的意义、难点、步骤和方法,重点介绍了数据预处理和数据表示方法;对软件工程数据挖掘研究的发展趋势进行了展望。
-
关键词
软件工程
数据挖掘
数据表示
数据预处理
机器学习
-
Keywords
software engineering
data mining
data representation
data pre-processing
machine learning
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于LDA主题模型的软件缺陷分派方法
被引量:11
- 2
-
-
作者
黄小亮
郁抒思
关佶红
-
机构
复旦大学计算机科学技术学院
同济大学计算机科学与技术系
-
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第21期46-48,共3页
-
基金
国家自然科学基金资助项目(60873040)
-
文摘
传统的基于向量空间模型的软件缺陷分派方法,由于存在特征空间维度高、数据稀疏且包含噪音等问题,分派准确率较低。为此,提出一种基于隐含狄利克雷分配(LDA)主题模型的软件缺陷分派方法,将缺陷报告从原始的高维文本单词空间映射到低维语义主题空间,在新的低维主题空间上进行分派。实验结果表明,在使用SVM和KNN分类器时,该方法的分派准确率较高。
-
关键词
软件缺陷分派
隐含狄利克雷分配模型
马尔可夫链蒙特卡洛方法
吉布斯采样
文本分类
向量空间模型
-
Keywords
software bug triage
Latent Dirichlet Allocation(LDA) model
Markov-Chain Monte Carlo(MCMC) method
Gibbs sampling
text classification
Vector Space Model(VSM)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于算子库的动态加密算法设计与实现
- 3
-
-
作者
郁抒思
王以刚
-
机构
东华大学计算机科学与技术学院
-
出处
《信息安全与通信保密》
2007年第6期220-221,225,共3页
-
文摘
论文探讨了加密算子的定义,建立算子库以及利用算子库产生动态加密算法的一种方法。建立了算子库的原型系统,由该系统生成了一个动态算法实例,并进行分析,以估计动态算法的安全性。分析表明动态算法有较强的抗破解性能,且不会大量占用各种资源。算子库对块加密算法的进一步研究与发展,对加强网络安全传输有促进作用。
-
关键词
算子库
对称加密
块加密
加密算法
动态算法
-
Keywords
Kernel Operator Library
Symmetrical Cipher
Block Cipher
Encryption
dynamic algorithm
-
分类号
TP309.7
[自动化与计算机技术—计算机系统结构]
-