现有的一分类支持向量机算法基于优化最小间隔的思想,只考虑了样本靠近空间原点一侧的噪声,对噪声信息较为敏感。针对该问题,通过优化间隔分布思想,同时考虑样本靠近空间原点和远离空间原点两侧的噪声,提高一分类支持向量机算法的抗噪...现有的一分类支持向量机算法基于优化最小间隔的思想,只考虑了样本靠近空间原点一侧的噪声,对噪声信息较为敏感。针对该问题,通过优化间隔分布思想,同时考虑样本靠近空间原点和远离空间原点两侧的噪声,提高一分类支持向量机算法的抗噪声能力。为此,提出了一种基于最优间隔分布的一分类学习方法(one-class optimal margin distribution machine,OCODM),该方法通过最大化间隔的均值和最小化间隔方差的方式来优化间隔分布。实验结果表明,相比于现有的一分类支持向量机算法,该方法具有更好的鲁棒性,是现有一分类支持向量机方法的有益补充,能够增强现有方法的抗噪声能力。展开更多
针对非平行支持向量机(NonParallel Support Vector Machine,NPSVM)对噪声敏感和忽略了数据分布结构的问题,提出了一种具有间隔分布的抗噪声非平行支持向量机(Anti-Noise NPSVM with Margin Distribution, MDANPSVM)分类模型.在MD-ANPSV...针对非平行支持向量机(NonParallel Support Vector Machine,NPSVM)对噪声敏感和忽略了数据分布结构的问题,提出了一种具有间隔分布的抗噪声非平行支持向量机(Anti-Noise NPSVM with Margin Distribution, MDANPSVM)分类模型.在MD-ANPSVM模型中,每个优化问题同时最小化两类样本的基于L1范数的绝对损失和改进的铰链损失,这可以保证模型的稳定性,减小噪声和异常值的影响.此外,在MD-ANPSVM模型中,采用一阶和二阶统计量来描述训练数据的间隔分布信息,并试图同时最大化间隔均值和最小化间隔方差,这进一步提高了模型的泛化性能.最终,我们在不同的数据集上进行了对比实验.实验结果显示,MD-ANPSVM模型具有较强的泛化能力和强鲁棒性.展开更多
在现实生活中的很多应用里,对不同类别的样本错误地分类往往会造成不同程度的损失,这些损失可以用非均衡代价来刻画.代价敏感学习的目标就是最小化总体代价.提出了一种新的代价敏感分类方法——代价敏感大间隔分布学习机(cost-sensitive...在现实生活中的很多应用里,对不同类别的样本错误地分类往往会造成不同程度的损失,这些损失可以用非均衡代价来刻画.代价敏感学习的目标就是最小化总体代价.提出了一种新的代价敏感分类方法——代价敏感大间隔分布学习机(cost-sensitive large margin distribution machine,CS-LDM).与传统的大间隔学习方法试图最大化"最小间隔"不同,CS-LDM在最小化总体代价的同时致力于对"间隔分布"进行优化,并通过对偶坐标下降方法优化目标函数,以有效地进行代价敏感学习.实验结果表明,CS-LDM的性能显著优于代价敏感支持向量机CS-SVM,平均总体代价下降了24%.展开更多
在大型软件项目的开发与维护中,从大量的代码文件中定位软件缺陷费时、费力,有效地进行软件缺陷自动定位,将能极大地降低开发成本.软件缺陷报告通常包含了大量未发觉的软件缺陷的信息,精确地寻找与缺陷报告相关联的代码文件,对于降低维...在大型软件项目的开发与维护中,从大量的代码文件中定位软件缺陷费时、费力,有效地进行软件缺陷自动定位,将能极大地降低开发成本.软件缺陷报告通常包含了大量未发觉的软件缺陷的信息,精确地寻找与缺陷报告相关联的代码文件,对于降低维护成本具有重要意义.目前,已有一些基于深度神经网络的缺陷定位技术相对于传统方法,其效果有所提升,但相关工作大多关注网络结构的设计,缺乏对训练过程中损失函数的研究,而损失函数对于预测任务的性能会有极大的影响.在此背景下,提出了代价敏感的间隔分布优化(cost-sensitive margin distribution optimization,简称CSMDO)损失函数,并将代价敏感的间隔分布优化层应用到深度卷积神经网络中,能够良好地处理软件缺陷数据的不平衡性,进一步提高缺陷定位的准确度.展开更多
文摘现有的一分类支持向量机算法基于优化最小间隔的思想,只考虑了样本靠近空间原点一侧的噪声,对噪声信息较为敏感。针对该问题,通过优化间隔分布思想,同时考虑样本靠近空间原点和远离空间原点两侧的噪声,提高一分类支持向量机算法的抗噪声能力。为此,提出了一种基于最优间隔分布的一分类学习方法(one-class optimal margin distribution machine,OCODM),该方法通过最大化间隔的均值和最小化间隔方差的方式来优化间隔分布。实验结果表明,相比于现有的一分类支持向量机算法,该方法具有更好的鲁棒性,是现有一分类支持向量机方法的有益补充,能够增强现有方法的抗噪声能力。
文摘针对非平行支持向量机(NonParallel Support Vector Machine,NPSVM)对噪声敏感和忽略了数据分布结构的问题,提出了一种具有间隔分布的抗噪声非平行支持向量机(Anti-Noise NPSVM with Margin Distribution, MDANPSVM)分类模型.在MD-ANPSVM模型中,每个优化问题同时最小化两类样本的基于L1范数的绝对损失和改进的铰链损失,这可以保证模型的稳定性,减小噪声和异常值的影响.此外,在MD-ANPSVM模型中,采用一阶和二阶统计量来描述训练数据的间隔分布信息,并试图同时最大化间隔均值和最小化间隔方差,这进一步提高了模型的泛化性能.最终,我们在不同的数据集上进行了对比实验.实验结果显示,MD-ANPSVM模型具有较强的泛化能力和强鲁棒性.
文摘在现实生活中的很多应用里,对不同类别的样本错误地分类往往会造成不同程度的损失,这些损失可以用非均衡代价来刻画.代价敏感学习的目标就是最小化总体代价.提出了一种新的代价敏感分类方法——代价敏感大间隔分布学习机(cost-sensitive large margin distribution machine,CS-LDM).与传统的大间隔学习方法试图最大化"最小间隔"不同,CS-LDM在最小化总体代价的同时致力于对"间隔分布"进行优化,并通过对偶坐标下降方法优化目标函数,以有效地进行代价敏感学习.实验结果表明,CS-LDM的性能显著优于代价敏感支持向量机CS-SVM,平均总体代价下降了24%.
文摘在大型软件项目的开发与维护中,从大量的代码文件中定位软件缺陷费时、费力,有效地进行软件缺陷自动定位,将能极大地降低开发成本.软件缺陷报告通常包含了大量未发觉的软件缺陷的信息,精确地寻找与缺陷报告相关联的代码文件,对于降低维护成本具有重要意义.目前,已有一些基于深度神经网络的缺陷定位技术相对于传统方法,其效果有所提升,但相关工作大多关注网络结构的设计,缺乏对训练过程中损失函数的研究,而损失函数对于预测任务的性能会有极大的影响.在此背景下,提出了代价敏感的间隔分布优化(cost-sensitive margin distribution optimization,简称CSMDO)损失函数,并将代价敏感的间隔分布优化层应用到深度卷积神经网络中,能够良好地处理软件缺陷数据的不平衡性,进一步提高缺陷定位的准确度.