-
题名基于随机特征子空间及加权核函数的 SVM 算法
- 1
-
-
作者
魏亚利
刘丽
项雪琰
齐绪停
-
机构
山东师范大学信息科学与工程学院
-
出处
《山东师范大学学报(自然科学版)》
CAS
2015年第3期6-9,共4页
-
基金
国家自然科学基金资助项目(61170145,61373081)
教育部博士点基金资助项目(20113704110001)
+1 种基金
山东省自然科学基金资助项目(ZR2010FM021)
山东省科技攻关计划项目(2013GGX10125).
-
文摘
为克服 SVM 算法缺乏高效率和低准确率的问题,笔者对 SVM 算法进行改进。首先通过采用 ReliefF 算法得到各个特征权值,然后基于随机特征子空间方法,即每次都选取权值较大的几个特征,再从剩余特征中随机选取一定数量特征共同组成一个特征空间来表示样本的一个视图。在进行训练分类器时,将特征的权值也应用于 SVM 的核函数中。实验表明,本文算法能有效提高 SVM 的分类精度。
-
关键词
支持向量机
RELIEFF
算法
随机特征子空间
加权核函数
-
Keywords
SVM
ReliefF algorithm
random feature subspace
weighting kernel
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名一种适合于非线性高维数据的谱聚类算法
被引量:2
- 2
-
-
作者
王鸿菲
杜洪波
林凯迪
姚云飞
朱立军
-
机构
沈阳工业大学理学院
天津大学计算机科学与技术学院
北方民族大学信息与计算科学学院
-
出处
《计算机应用与软件》
北大核心
2021年第9期268-272,292,共6页
-
基金
国家自然科学基金项目(61362033)。
-
文摘
谱聚类能识别非线性数据,且优于传统聚类。谱聚类中度量相似性的高斯核函数尺度参数σ和聚类个数k对聚类效果影响较大,但需要人工判断。用向量之间夹角余弦代替σ并且通过特征值的跳跃性确定聚类个数,对于非线性高维数据,提出一种自适应谱聚类算法,将数据通过显式构造映射到随机特征空间,在随机特征空间中实现聚类。实验结果表明,在UCI数据上该算法与传统算法相比效果更好。
-
关键词
谱聚类
非线性高维
自适应
随机特征空间
-
Keywords
Spectral clustering
Non-linear high-dimensional
Adaptive
Random feature space
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于集成学习的软件缺陷检测
被引量:2
- 3
-
-
作者
黄文聪
荆晓远
姚永芳
吴飞
-
机构
南京邮电大学计算机学院
南京邮电大学自动化学院
-
出处
《计算机技术与发展》
2015年第10期63-66,共4页
-
基金
国家自然科学基金资助项目(61272273)
南京邮电大学校科研项目(XJKY14016)
江苏省333工程项目(BRA2011175)
-
文摘
近年来,使用机器学习方法来预测软件缺陷得到了广泛的关注。在实际工程中,软件缺陷特征的构造需要相关领域知识及大量时间,使得到的软件特征一般较少。并且,有缺陷的软件样本会大大少于无缺陷的软件样本,造成样本的高度不平衡。这里,通过显式的特征构造方法,把有限的原特征映射到高维度的特征空间;通过改进的Bagging以及随机特征子空间的方法,在得到类平衡的训练样本集的同时,提高模型的泛化能力。通过上述方法,得到一系列弱分类器。最后,使用一个简单的线性分类器训练得到各个弱分类器的权重来融合所有弱分类器,得到更好的分类效果。
-
关键词
软件缺陷检测
特征构造
改进Bagging
随机特征子空间
-
Keywords
software defect detection
feature constructing
improved Bagging
random feature subspace
-
分类号
O235
[理学—运筹学与控制论]
-