-
题名深度强化学习优化的学习向量量化聚类算法
- 1
-
-
作者
史凯岳
李凤莲
张雪英
杜海文
于丽君
-
机构
太原理工大学信息与计算机学院
山西省中电科新能源技术有限公司
-
出处
《电子设计工程》
2023年第9期43-48,共6页
-
基金
国家自然科学基金资助项目(62171307)
山西省科技重大专项(20181102008)。
-
文摘
基于学习向量量化(Learning Vector Quantization,LVQ)单次迭代聚类效果不稳定和随着数据维度增大,聚类效果下降的缺陷,采用了一种深度强化学习优化的LVQ聚类算法。将LVQ算法的每一次迭代看做深度强化学习的一个状态,LVQ算法初始化一组原型向量后,用原型向量与数据集中每一个数据点做“拉近”或“远离”运算来完成一次迭代。优化算法挑选一部分数据点,并与原型向量做运算,将这一过程作为一个动作,选取的数据子集不同,产生的动作也不同,把这些动作组成动作集,选定动作后,根据奖赏函数找到最佳动作,进入下一状态。通过对UCI公共数据集和碳碳沉积数据集试验,得出优化后的算法FMI提升3%到10%,Dunn指数提升2%到9%,准确率提高3%到6%,用于公共数据集及碳碳沉积材料的生产过程数据分析性能较优。
-
关键词
深度Q网络
学习向量量化
聚类
碳碳沉积
-
Keywords
deep Q network
learning vector quantification
clustering
carbon deposition
-
分类号
TN98
[电子电信—信息与通信工程]
-
-
题名基于DP_(RI)的单行为强化聚类算法
被引量:1
- 2
-
-
作者
张龙
李凤莲
张雪英
史凯岳
-
机构
太原理工大学信息与计算机学院
-
出处
《电子设计工程》
2022年第12期31-37,共7页
-
基金
山西省自然科学基金资助项目(201801D121138)
山西省重点研发计划(社会发展领域)项目(201803D31045)
+1 种基金
山西省科技重大专项(20181102008)
山西省回国留学人员科研资助项目(HGKY201925)。
-
文摘
针对基于划分的聚类算法对初始聚类中心较为敏感的缺陷以及样本划分方式导致算法时间复杂度较高的问题,通过引入强化学习中的学习机制,结合DP_(RI)算法中的离散化奖励技术,提出一种基于DP_(RI)的单行为强化聚类算法。该算法把聚类任务转化成强化学习任务,通过智能体不断“探索”和“利用”的过程,使算法具有了一定的自我学习能力,该算法以平均类内距离的变化趋势作为发送反馈信号的依据,智能体接收到信号后不断更新Q表,最终达到稳定状态,输出聚类结果。使用K-means、K-means++、FCM以及最近提出的LAC算法在准确率、DB指数、轮廓系数以及运行时间等指标上进行对比实验。结果表明10个数据集中,文中算法在6个数据集上准确率最高、DB指数最优,在5个数据集上轮廓系数最高。时间复杂度方面,文中算法处理中规模和大规模数据的运行时间降低了一个数量级。
-
关键词
聚类算法
强化学习
DP_(RI)算法
聚类中心
样本划分方式
-
Keywords
clustering algorithm
reinforcement learning
DPRI algorithm
cluster center
sample division method
-
分类号
TN98
[电子电信—信息与通信工程]
-