文章针对物流企业的订单分批问题,提出了改进的Canopy-k-means算法。该算法是采用Canopy算法依据最大最小原则生成初始聚类中心,并使用k-means聚类算法对其进行优化获取分批结果的。此外,文章针对不同规模的订单数据集,比较了该算法和...文章针对物流企业的订单分批问题,提出了改进的Canopy-k-means算法。该算法是采用Canopy算法依据最大最小原则生成初始聚类中心,并使用k-means聚类算法对其进行优化获取分批结果的。此外,文章针对不同规模的订单数据集,比较了该算法和先来先服务(first come first served,FCFS)、k-means以及Canopy-k-means算法的实际效果,实验结果表明:该算法可以避免k-means算法中k值选取的盲目性,同时可以有效地提高分拣效率以及降低分拣批次。展开更多
针对SMOTE算法和随机森林可较好解决不平衡数据集的分类问题但对少数类样本分类效果还有待提高的问题,融合Canopy和K-means两种聚类算法,设计了C-K-SMOTE改进算法。先后利用Canopy算法进行快速近似聚类,再利用K-means算法进行精准聚类,...针对SMOTE算法和随机森林可较好解决不平衡数据集的分类问题但对少数类样本分类效果还有待提高的问题,融合Canopy和K-means两种聚类算法,设计了C-K-SMOTE改进算法。先后利用Canopy算法进行快速近似聚类,再利用K-means算法进行精准聚类,得到精准聚类簇,最后利用SMOTE算法增加少数类样本数量,使数据趋于平衡。选取公开数据集KEEL(knowledge extraction on evolutionary learning)数据库中的不平衡数据集,结合随机森林分类模型进行了实验验证,实验表明C-K-SMOTE算法可有效平衡不平衡数据集。展开更多
文摘文章针对物流企业的订单分批问题,提出了改进的Canopy-k-means算法。该算法是采用Canopy算法依据最大最小原则生成初始聚类中心,并使用k-means聚类算法对其进行优化获取分批结果的。此外,文章针对不同规模的订单数据集,比较了该算法和先来先服务(first come first served,FCFS)、k-means以及Canopy-k-means算法的实际效果,实验结果表明:该算法可以避免k-means算法中k值选取的盲目性,同时可以有效地提高分拣效率以及降低分拣批次。
文摘针对SMOTE算法和随机森林可较好解决不平衡数据集的分类问题但对少数类样本分类效果还有待提高的问题,融合Canopy和K-means两种聚类算法,设计了C-K-SMOTE改进算法。先后利用Canopy算法进行快速近似聚类,再利用K-means算法进行精准聚类,得到精准聚类簇,最后利用SMOTE算法增加少数类样本数量,使数据趋于平衡。选取公开数据集KEEL(knowledge extraction on evolutionary learning)数据库中的不平衡数据集,结合随机森林分类模型进行了实验验证,实验表明C-K-SMOTE算法可有效平衡不平衡数据集。