期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
深度聚类模型训练加速方法研究
1
作者 陈傲天 李少勇 《计算机科学与应用》 2024年第10期85-101,共17页
深度聚类通过联合深度学习和传统的聚类方法,可以有效解决高维数据聚类问题,在数据处理领域受到广泛关注,然而,需要花费大量计算资源的深度聚类模型往往会制约其研究发展乃至应用。因此,本文针对深度聚类模型训练耗费时间过长的问题,从... 深度聚类通过联合深度学习和传统的聚类方法,可以有效解决高维数据聚类问题,在数据处理领域受到广泛关注,然而,需要花费大量计算资源的深度聚类模型往往会制约其研究发展乃至应用。因此,本文针对深度聚类模型训练耗费时间过长的问题,从减少单次迭代时间和缩短达到期望精度的迭代次数两个思路去探索提高模型训练效率的方法,分别提出了基于随机采样策略的深度K-means (Deep K-means based on Random Sampling Strategy, RSDK)和基于正交变换特征的二阶段深度K-means (Two Stage Deep K-means based on Orthogonal Transform Features, OTDK),前者利用随机采样策略优化深度聚类模型,通过减少单次纪元需要处理的数据量以缩短其耗费的时间,致使在相同纪元数的条件下模型总的训练时间减少。后者则是从训练策略、损失函数、网络架构多个角度对深度聚类模型进行改进,企图让模型参数经历较少的更新次数就令其聚类结果达到预期。最终在MNIST、F-MNIST、CIFAR-10三个数据集验证所提出的两种改进算法,可以发现RSDK所耗费的训练时间会随着采样率下降而下降,而OTDK在MNIST数据集上可以让模型参数花费较少的更新次数就获得较高的聚类精度,虽然在另外两个数据集上获得的聚类精度还未能处于非常优越的水准,但与RSDK相比无明显差异,且模型具有收敛较快的优点。Deep clustering, by combining deep learning and traditional clustering methods, can effectively solve the problem of high-dimensional data clustering and has received widespread attention in the field of data processing. However, deep clustering models that require a large amount of computational resources often constrain their research and development, and even their applications. Therefore, this article explores methods to improve the training efficiency of deep clustering models by reducing the single iteration time and shortening the number of iterations required to achieve the desired accuracy. Two methods are proposed: Deep K-means based on Random Sampling Strategy (RSDK) and Two Stage Deep K-means based on Orthogonal Transform Features (OTDK). The former optimizes the deep clustering model using a random sampling strategy by reducing the amount of data that needs to be processed in a single epoch to shorten its training time, resulting in a reduction in the total training time of the model under the same epoch conditions. The latter improves the deep clustering model from multiple perspectives, such as training strategy, loss function, and network architecture, attempting to achieve the expected clustering results with fewer updates to the model parameters. The two improved algorithms proposed were ultimately validated on three datasets: MNIST, F-MNIST, and CIFAR-10. It was found that the training time consumed by RSDK decreased with decreasing sampling rate, while OTDK achieved higher clustering accuracy with fewer updates of model parameters on the MNIST dataset. Although the clustering accuracy obtained on the other two datasets was not yet at a very superior level, there was no significant difference compared to RSDK, and the model had the advantage of faster convergence. 展开更多
关键词 深度K-Means 随机采样策略 正交变换特征
下载PDF
基于最大熵的深度模糊聚类方法研究
2
作者 黄皓宇 李少勇 陈傲天 《计算机科学与应用》 2024年第4期276-289,共14页
高维数据聚类是数据挖掘和模式识别研究领域的一项关键且具有挑战性的任务。深度聚类方法借助神经网络高效地特征提取能力,往往比传统聚类方法具有更好的性能。因此,本文提出了一种基于最大熵的深度模糊聚类算法(DFMEC)。该算法通过构... 高维数据聚类是数据挖掘和模式识别研究领域的一项关键且具有挑战性的任务。深度聚类方法借助神经网络高效地特征提取能力,往往比传统聚类方法具有更好的性能。因此,本文提出了一种基于最大熵的深度模糊聚类算法(DFMEC)。该算法通过构建神经网络来表示模糊聚类,具有算法模型的可解释性。联合深度自动编码器模型,DFMEC通过梯度下降实现了深度特征学习和聚类中心的同步更新,解决了硬聚类由于其离散性而不能更新梯度的问题。此外,在所提出方法的目标函数的优化中,添加了基于模糊分配的最大熵正则项来提高聚类模型的鲁棒性。在各个高维数据集上的综合实验表明,与其他先进的深度聚类方法相比,该方法在重构表示和聚类质量方面都有更好的性能,大量实验的深入分析证明了这一点。 展开更多
关键词 模糊聚类 深度聚类 可解释性
下载PDF
雄安新区“多测合一”信息共享关键技术与应用 被引量:5
3
作者 张秋义 马晓辉 +3 位作者 李彬彬 吴棠侠 陈傲天 王晓旭 《地理信息世界》 2022年第4期17-22,共6页
针对工程建设项目“多测合一”改革实践中信息共享难、信息共享效率低,导致“重复测绘”不同程度存在、制约改革落地见效“最后一公里”的现实问题,本文分析雄安新区“多测合一”信息共享需求和需解决的主要问题,提出了“多测合一”信... 针对工程建设项目“多测合一”改革实践中信息共享难、信息共享效率低,导致“重复测绘”不同程度存在、制约改革落地见效“最后一公里”的现实问题,本文分析雄安新区“多测合一”信息共享需求和需解决的主要问题,提出了“多测合一”信息共享的总体技术框架,阐述了雄安新区“多测合一”信息共享关键技术和信息共享系统的设计及应用。该成果帮助雄安新区工程建设项目测绘服务总时限从50多个工作日缩减至15个工作日左右,为雄安新区大规模工程建设提供了有力保障。 展开更多
关键词 雄安新区 “多测合一” 信息共享机制 信息共享技术 信息管理系统
下载PDF
雄安新区工程建设项目“多测合一”改革实践与创新发展路径探析 被引量:3
4
作者 黄庆彬 张秋义 +2 位作者 王晓旭 陈傲天 董涛 《城市勘测》 2023年第2期169-173,共5页
介绍了“多测合一”政策的出台背景,系统总结了各地“多测合一”的典型做法。重点从制度体系、标准体系、信息管理和共享应用介绍了雄安新区“多测合一”实践经验,通过工作实际验证了其创新性和有效性,并对进一步改进“多测合一”工作... 介绍了“多测合一”政策的出台背景,系统总结了各地“多测合一”的典型做法。重点从制度体系、标准体系、信息管理和共享应用介绍了雄安新区“多测合一”实践经验,通过工作实际验证了其创新性和有效性,并对进一步改进“多测合一”工作提出了对策和建议。 展开更多
关键词 “多测合一” 雄安新区 工程建设 实践经验
下载PDF
城市工程建设"多测合一"关键技术研发与应用
5
作者 张秋义 黄庆彬 +9 位作者 倪晓东 王晓旭 李彬彬 王树东 马晓辉 周爱华 陈傲天 董涛 郭瑞刚 叶梓 《中国科技成果》 2024年第11期73-73,共1页
长期以来,由于城市工程建设中测绘技术服务的体制机制不健全、技术标准不统一、测绘成果数据更新和信息共享效率不高、与BIM等新技术融合不够,难以满足城市大规模开发建设和智慧城市建设的迫切需要.本项目突破了"多测合一"多... 长期以来,由于城市工程建设中测绘技术服务的体制机制不健全、技术标准不统一、测绘成果数据更新和信息共享效率不高、与BIM等新技术融合不够,难以满足城市大规模开发建设和智慧城市建设的迫切需要.本项目突破了"多测合一"多源异构时空数据转换和集成、联动更新、信息共享以及测绘成果与BIM模型集成融合等关键技术,创新了城市工程建设"多测合一"全生命周期管理框架、工艺流程和技术体系,研制了系列标准规范和信息平台. 展开更多
关键词 信息共享 信息平台 数据更新 测绘成果 全生命周期管理 时空数据 多源异构 技术融合
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部