为捕捉由轨道交通站点周边建成环境与客流时变特征的互动关系而反映的站点类型差异,基于地铁刷卡数据与站点周边兴趣点(Point of Interest,POI)数据,分别通过客流时间序列分析和地理加权回归模型进行时空维度聚类变量提取.应用K-means+...为捕捉由轨道交通站点周边建成环境与客流时变特征的互动关系而反映的站点类型差异,基于地铁刷卡数据与站点周边兴趣点(Point of Interest,POI)数据,分别通过客流时间序列分析和地理加权回归模型进行时空维度聚类变量提取.应用K-means++聚类算法将杭州地铁1、2、4号线站点划分为工作导向型、居住导向型、商业型以及工作-居住混合型4种类型.研究结果表明:该方法相对于传统K-means算法具有更优的性能表现,其中轮廓系数、Davies-Bouldin指数与Calinski-Harabaz指数等3项聚类评价指标的改善幅度分别为30.43%、10.51%、9.02%,因而能够准确识别时空视角下的轨道交通站点类型并反映其客流出行模式,进而为站点客流预测、站城一体化建设等后续研究提供分析依据.展开更多
随着海量大数据的出现,聚类算法需要新型计算模式来提高计算速度与运行效率。本文提出一种基于动态双子种群的差分进化K中心点聚类算法DGP-DE-K-mediods(Dynamic Gemini Population based DE-K-mediods)。DGP-DE-K-mediods利用动态双子...随着海量大数据的出现,聚类算法需要新型计算模式来提高计算速度与运行效率。本文提出一种基于动态双子种群的差分进化K中心点聚类算法DGP-DE-K-mediods(Dynamic Gemini Population based DE-K-mediods)。DGP-DE-K-mediods利用动态双子种群方法,解决聚类算法在维持种群密度的时候避免陷入局部最优的问题;采用差分进化(Differential Evolution,DE)算法来提高全局最优能力的强健性;基于Hadoop云平台来并行处理DGP-DE-K-mediods,加快算法的运行速度和效率;描述基于MapReduce的并行聚类算法的编程过程;DGP-DE-K-mediods利用UIC的大数据分类的案例数据和网络入侵检测这种大数据应用来仿真算法的效果。实验结果表明,与已有的聚类算法相比,DGP-DE-K-mediods在检测精度、运行时间上有明显的优势。展开更多
文摘为捕捉由轨道交通站点周边建成环境与客流时变特征的互动关系而反映的站点类型差异,基于地铁刷卡数据与站点周边兴趣点(Point of Interest,POI)数据,分别通过客流时间序列分析和地理加权回归模型进行时空维度聚类变量提取.应用K-means++聚类算法将杭州地铁1、2、4号线站点划分为工作导向型、居住导向型、商业型以及工作-居住混合型4种类型.研究结果表明:该方法相对于传统K-means算法具有更优的性能表现,其中轮廓系数、Davies-Bouldin指数与Calinski-Harabaz指数等3项聚类评价指标的改善幅度分别为30.43%、10.51%、9.02%,因而能够准确识别时空视角下的轨道交通站点类型并反映其客流出行模式,进而为站点客流预测、站城一体化建设等后续研究提供分析依据.
文摘随着海量大数据的出现,聚类算法需要新型计算模式来提高计算速度与运行效率。本文提出一种基于动态双子种群的差分进化K中心点聚类算法DGP-DE-K-mediods(Dynamic Gemini Population based DE-K-mediods)。DGP-DE-K-mediods利用动态双子种群方法,解决聚类算法在维持种群密度的时候避免陷入局部最优的问题;采用差分进化(Differential Evolution,DE)算法来提高全局最优能力的强健性;基于Hadoop云平台来并行处理DGP-DE-K-mediods,加快算法的运行速度和效率;描述基于MapReduce的并行聚类算法的编程过程;DGP-DE-K-mediods利用UIC的大数据分类的案例数据和网络入侵检测这种大数据应用来仿真算法的效果。实验结果表明,与已有的聚类算法相比,DGP-DE-K-mediods在检测精度、运行时间上有明显的优势。