-
题名基于加权马氏距离的改进深度嵌入聚类算法
被引量:3
- 1
-
-
作者
颜子寒
张正军
王雅萍
金亚洲
严涛
-
机构
南京理工大学理学院
-
出处
《计算机应用》
CSCD
北大核心
2019年第S02期122-126,共5页
-
基金
国家自然科学基金资助项目(61773014,11671205)
-
文摘
针对深度嵌入聚类(DEC)算法在数据降维后的特征空间中采用欧氏距离度量嵌入点之间的距离,容易忽视各特征不同量纲以及不同重要性的问题,提出了基于加权马氏距离的改进DEC算法,并同时给出基于加权马氏距离的间隔统计量(GS)方法判断最佳聚类数。该算法使用信息熵加权的马氏距离作为距离度量,规范化了欧氏距离的计算,并利用信息熵加大了对聚类重要的特征的权重。实证表明,基于加权马氏距离的改进DEC算法准确率优于原DEC算法,在UCI的路透社新闻等文本数据集上的聚类效果有明显的提升。利用改进的GS方法判断的最佳聚类数也有很大的可行性。
-
关键词
深度嵌入聚类模型
信息熵
加权马氏距离
无监督学习
间隔统计量
-
Keywords
deep embedding clustering model
information entropy
weighted Mahalanobis distance
unsupervised learning
gap statistics
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于改进的迁移率模型的生物地理学优化算法
被引量:14
- 2
-
-
作者
王雅萍
张正军
颜子寒
金亚洲
-
机构
南京理工大学理学院
-
出处
《计算机应用》
CSCD
北大核心
2019年第9期2511-2516,共6页
-
基金
国家自然科学基金资助项目(61773014)~~
-
文摘
生物地理学优化(BBO)算法通过迁移和变异不断更新栖息地,以寻找最优解,其中迁移率模型的优劣会直接影响算法的优化性能。针对原始BBO算法采用线性迁移率模型适应性不足的问题,基于Logistic函数、三次多项式函数以及双曲正切函数提出了三种新的非线性迁移率模型,并应用于原始BBO算法中。对17个典型的基准函数进行优化性能测试,结果表明,基于双曲正切函数的迁移率模型所得解更接近函数的全局最小值,总体表现优于原始线性迁移率模型的BBO算法以及相关改进算法中表现优异的余弦迁移率模型。稳定性测试结果表明,在不同的变异率下,基于双曲正切函数的迁移率模型在多数测试函数上表现优于原始线性迁移率模型。在满足解多样性的基础上,该模型能够较好地适应非线性迁移问题,提高寻优能力。
-
关键词
生物地理学优化
迁移率模型
逻辑回归函数
三次多项式
双曲正切函数
-
Keywords
Biogeography-Based Optimization(BBO)
migration rate model
logistic regression function
cubic polynomial
hyperbolic tangent function
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于间隔准则的优化排序多标记学习算法
- 3
-
-
作者
金亚洲
张正军
颜子寒
王雅萍
-
机构
南京理工大学理学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2020年第7期104-109,共6页
-
基金
全国统计科学研究项目“海量数据下半参数测量误差模型的统计建模和应用”(2018LD01)。
-
文摘
针对多标记学习分类问题,算法适应方法将其转化为排序问题,并将输出标记按照其与示例的相关性进行排序,该类方法取得了较好的分类效果。基于间隔准则提出一种多标记学习算法,通过优化模型在示例的相关标记集合中最小输出与不相关标记集合中最大输出的间隔损失来进行标记排序。在此基础上,为充分利用全部标记信息,提出一种改进的优化排序多标记学习算法,分别优化模型在示例的相关标记集合中平均输出与不相关标记集合中最大输出的间隔损失,以及优化模型在相关标记集合中最小输出与不相关标记集合中平均输出的间隔损失,从而实现标记排序。在模型的参数学习过程中,使用改进的次梯度Pegasos算法进行优化。将所提2种算法与ML-RBF、BP-MLL、ML-KNN多标记学习算法在4个多标记数据集上进行对比实验,结果表明,在HL、RL等5种不同的评价准则下,2种算法均能与对比算法取得相近的分类性能。
-
关键词
多标记学习
算法适应
标记排序
平均输出
间隔准则
Pegasos算法
-
Keywords
multi-label learning
algorithm adaptation
label ranking
average output
margin criterion
Pegasos algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-