期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于OD流向语义和时空语义聚类的居民出行特征分析方法
1
作者 柯玮文 吴升 柯日宏 《地球信息科学学报》 EI CSCD 北大核心 2023年第11期2150-2163,共14页
分析居民的出行特征是解决和缓解日益凸显的城市问题的一种重要途径。当前采用出租车OD流向数据挖掘居民出行特征已经取得了丰富的研究成果,但是大部分研究忽略了OD流向的语义信息。针对时空聚类算法中语义信息考虑不足的问题,本文提出... 分析居民的出行特征是解决和缓解日益凸显的城市问题的一种重要途径。当前采用出租车OD流向数据挖掘居民出行特征已经取得了丰富的研究成果,但是大部分研究忽略了OD流向的语义信息。针对时空聚类算法中语义信息考虑不足的问题,本文提出了一种基于GloVe(Global Vectors)模型的OD流向语义提取方法和基于密度的时空语义聚类算法(STS-DBSCAN,Spatial Temporal Semantic-DBSCAN)。首先,结合POI访问概率和GloVe模型提取了OD流向语义。在此基础上,提出了一种OD流向的时空语义相似性度量规则。然后,根据时空语义相似性度量规则改进了DBSCAN聚类算法,实现了OD流向数据的时空语义聚类。最后,以厦门岛为例进行居民出行特征分析,共提取了7种居民出行语义,发现:(1)居民出行语义受时间因素的影响较大,不同时间段的主要居民出行语义不同;(2)居民出行热点主要分布在厦门岛的中部发达区域;(3)通过时空语义聚类分析,从4种主要居民出行语义中提取了7种典型的居民出行模式。结果表明,基于OD流向语义和时空语义聚类方法能够有效地挖掘城市居民的出行特征。 展开更多
关键词 出租车od流向 语义信息 POI访问概率 GloVe模型 时空语义 od流向聚类 出行特征
原文传递
一种逐级合并OD流向时空联合聚类算法 被引量:4
2
作者 项秋亮 邬群勇 张良盼 《地球信息科学学报》 CSCD 北大核心 2020年第6期1394-1405,共12页
现有OD流向聚类多将O点和D点相分离或者将OD流向看作4维空间的数据点进行聚类处理,忽视了流向长度、方向、时间对流向聚类的影响。本文以流向作为研究对象,提出一种基于流向间相似性度的逐级合并OD流向时空联合聚类算法。首先在充分研... 现有OD流向聚类多将O点和D点相分离或者将OD流向看作4维空间的数据点进行聚类处理,忽视了流向长度、方向、时间对流向聚类的影响。本文以流向作为研究对象,提出一种基于流向间相似性度的逐级合并OD流向时空联合聚类算法。首先在充分研究OD流向的空间信息和时间信息的基础上,构建合理的OD流向间时空相似性度量方法,对OD流向间的时空相似性进行量化;然后提出逐级合并OD流向聚类策略,优化类簇合并的顺序,以减少层次聚类的时间开销,实现OD流向的时空联合聚类。以成都市的滴滴出行OD数据和纽约市出租车数据为例对本文方法进行了验证,结果表明:①本算法聚类获得的流向类簇不仅带有空间特征还具备时间特征;②在不同参数下本方法可以得到不同时空尺度的聚类结果;③与现有较高水平的流向聚类算法相对比,本文方法的聚类效果更好。这体现在流向类簇内部的流向之间有着充分的相似性,以及本文方法不仅可以提取出显著的流向类簇,还可以提取出非热点区域之间的流向类簇。本算法顾及空间因素和时间因素,可以通过调整时空相似性度量方法中的时间参数和空间参数以实现不同时空尺度的流向聚类,这使得从不同时空角度研究城市居民出行模式成为可能。本文提出的OD流向时空联合聚类算法从联合时间信息和空间信息的角度获得对运动数据的新见解,有助于合理全面地研究居民的移动模式、区域之间的空间联系、已知出行结构的确定以及出行目的的探索,是后续一系列分析工作的基础。 展开更多
关键词 od流向 时空联合聚类 时空相似性度量 逐级合并策略 层次聚类 时空尺度 移动模式 空间联系
原文传递
基于LDA和优化蚁群的OD流向时空语义聚类算法 被引量:2
3
作者 张晗 邬群勇 《地球信息科学学报》 CSCD 北大核心 2022年第5期837-850,共14页
针对OD流向聚类中语义信息考虑不足和流向语义提取困难的问题,本文提出了一种基于隐含狄利克雷分布模型(Latent Dirichlet Allocation,LDA)和优化蚁群的OD流向语义聚类算法。算法首先以流向终点的POI类别为词汇构建流向文档,采用LDA主... 针对OD流向聚类中语义信息考虑不足和流向语义提取困难的问题,本文提出了一种基于隐含狄利克雷分布模型(Latent Dirichlet Allocation,LDA)和优化蚁群的OD流向语义聚类算法。算法首先以流向终点的POI类别为词汇构建流向文档,采用LDA主题模型提取流向语义,量化OD流向间的语义相似度,融合时间、空间和语义相似度构建流向时空语义相似度;接着以流向为节点,以流向时空语义相似度为边构建流向图,利用高斯函数映射以及图连通分量,剔除不相似的流向,实现数据精简;之后借鉴了密度峰值聚类算法思想,利用节点的介数中心性优化蚁群初始位置选取;最后基于多路切图准则(Multiway Normalized Cut,MNCUT)强化蚁群搜索的目的性,优化蚁群搜索的聚类效果,实现OD流向的时空语义聚类。以厦门市出租车公开数据集与厦门市高德地图POI数据为例进行分析与验证,结果表明本文基于LDA模型的语义提取方法可以有效提取流向的语义信息,构建有效的流向相似度度量;基于高斯函数和图连通分量特性的映射策略可以有效剔除了流向数据中的噪音,有效节省无向图构建的计算开支,大约节省了88.5%~88.8%的运行时间;基于介数中心性和多路切图准则优化的蚁群搜索聚类算法,可以有效进行流向语义聚类。相比已有方法本文方法能够更好地衡量流向间的语义相似程度,可实现按主题进行聚类划分,划分更加精细,更方便有效地进行流向语义的相关分析。 展开更多
关键词 od流向 地理信息 数据挖掘 时空语义聚类 LDA 流向语义相似度 蚁群算法 移动模式
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部