-
题名局部PCA与k近邻相结合的谱聚类算法
被引量:8
- 1
-
-
作者
吴林
文国秋
童涛
谭马龙
杜婷婷
-
机构
广西师范大学计算机科学与信息工程学院广西多源信息挖掘与安全重点实验室
-
出处
《计算机工程与设计》
北大核心
2019年第8期2204-2210,共7页
-
基金
国家重点研发计划基金项目(2016YFB1000905)
国家自然科学基金项目(61170131、61263035、61573270、90718020)
+4 种基金
国家973重点基础研究发展计划基金项目(2013CB329404)
中国博士后科学基金项目(2015M570837)
广西自然科学基金项目(2015GXNSFCB139011、2015GXNSFAA139306)
广西科技基地与人才计划基金项目(桂科AD17195062)
广西师大计信学院研究生教育创新计划基金项目(JXYJSKT-2019-004)
-
文摘
为解决传统谱聚类方法构造相似矩阵时使用距离度量无法充分反映复杂样本空间的全局一致性,且存在聚类个数需要人为指定等问题,提出一种基于近邻与局部PCA结合的谱聚类算法。使用kNN获取邻域子集,使用局部主成分分析保持样本的局部结构,同时考虑样本的全局和局部信息,为相似矩阵提供综合信息,对得到的相似矩阵进行图分割,直接得到聚类的结果。在真实数据集上的实验结果表明,该算法能够自动得到类的个数且聚类准确率有所提高,其在非真实类时有更好的聚类效果。
-
关键词
谱聚类
K-近邻
局部主成分分析
相似矩阵
连通图划分
-
Keywords
spectral clustering
k-nearest neighbor
local principal component analysis
similarity matrix
connected graph division
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于mutual KNN和标准化的谱聚类算法
被引量:4
- 2
-
-
作者
谭马龙
文国秋
童涛
吴林
杜婷婷
-
机构
广西师范大学计算机科学与信息工程学院广西多源信息挖掘与安全重点实验室
-
出处
《计算机工程与设计》
北大核心
2019年第7期1878-1884,共7页
-
基金
国家重点研发计划基金项目(2016YFB1000905)
国家自然科学基金项目(61170131、61263035、61573270、90718020)
+3 种基金
国家973重点基础研究发展计划基金项目(2013CB329404)
中国博士后科学基金项目(2015M570837)
广西自然科学基金项目(2015GXNSFCB139011、2015GXNSFAA139306)
广西师范大学计算机科学与信息工程学院研究 生创新项目(JXY JSKT-2019-003)
-
文摘
在谱聚类算法中,利用K近邻算法构建拉普拉斯矩阵时,会造成聚类的算法复杂度提高和聚类结果不佳的问题,为此提出一种基于mutual KNN和标准化矩阵的谱聚类算法,能有效提升聚类划分的执行效率和准确率。将提出算法与多组对比算法在多个数据集上进行实验比较,比较结果表明,多个评测指标(如聚类准确率、聚类的标准化互信息、方差等)全面验证了该算法能有效提高聚类性能和执行效率,适用于高维大数据的聚类分析。
-
关键词
拉普拉斯矩阵
谱聚类
标准化
聚类性能
高维大数据
-
Keywords
Laplacian matrix
spectral clustering
standardization
clustering performance
large-scale data
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于核函数的稀疏属性选择算法
被引量:2
- 3
-
-
作者
张善文
文国秋
张乐园
李佳烨
-
机构
广西师范大学计算机科学与信息工程学院广西多源信息挖掘与安全重点实验室
-
出处
《计算机科学》
CSCD
北大核心
2019年第2期62-67,共6页
-
基金
国家自然科学基金(61170131
61263035
+6 种基金
61573270
90718020)
中国博士后基金(2015M570837)
广西自然科学基金(2015GXNSFCB139011
2015GXNSFAA139306)
国家重点研发计划资助项目(2016YFB1000905)
广西科技基地与人才计划项目(Guike 541804573)资助
-
文摘
鉴于传统属性选择算法无法捕捉属性之间的关系的问题,文中提出了一种非线性属性选择方法。该方法通过引入核函数,将原始数据集投影到高维的核空间,因在核空间内进行运算,进而可以考虑到数据属性之间的关系。由于核函数自身的优越性,即使数据通过高斯核投影到无穷维的空间中,计算复杂度亦可以控制得较小。在正则化因子的限制上,使用两种范数进行双重约束,不仅提高了算法的准确率,而且使得算法实验结果的方差仅为0.74,远小于其他同类对比算法,且算法更加稳定。在8个常用的数据集上将所提算法与6个同类算法进行比较,并用SVM分类器来测试分类准确率,最终该算法得到最少1.84%,最高3.27%,平均2.75%的提升。
-
关键词
核函数
属性选择
稀疏
L1范数
L
2
1范数
-
Keywords
Kernel function
Feature selection
Sparse
L1-norm
L2
1-norm
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种可用于数据和模型分享的模型链
- 4
-
-
作者
闫凯伦
张继连
-
机构
广西师范大学计算机科学与信息工程学院广西多源信息挖掘与安全重点实验室
暨南大学网络空间安全学院
-
出处
《计算机科学》
CSCD
北大核心
2021年第2期311-316,共6页
-
基金
国家自然科学基金(61932011,61972177,61877029,62020106013)
广西多源信息挖掘与安全重点实验室开放课题(MIMS18-09)
广东省计算机网络重点实验室开放课题(CCNL201903)。
-
文摘
机器学习开始在越来越多的行业中得到应用,但使用机器学习执行任务的软件一直受限于第三方软件商更新模型。文中基于区块链,将训练神经网络消耗的算力和区块链的工作量证明机制相结合,提出并实现了模型链。模型链作为一种可用于分享数据和机器学习模型的区块链,基于骨架网络训练神经网络模型,以全网节点匿名分享的数据作为训练模型的数据集,实现了不依赖第三方更新神经网络模型。模型链使用环签名来保护用户数据隐私,节点训练的模型使用统一的测试集评估,通过评估的模型将作为节点的工作量证明用于投票达成一致共识。文中提出了两种可行的激励机制,即物质奖励和模型奖励。对于潜在的威胁,如账本分析、脏数据攻击和欺骗投票,给出了相应的解决方案.实现了一个用于数字识别的模型链。实验结果表明,模型链中的模型可以适应实际场景下发生的用户变迁和数据变化。
-
关键词
区块链
投票共识机制
数据分享
工作量证明
神经网络
-
Keywords
Blockchain
Voting consensus mechanism
Data Sharing
Proof-of-work
Neural network
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-