海洋数据具有多源、多类、多维、海量等特点,是一种典型的大数据,海洋大数据上的快速查询是该领域各类应用的基本需求.提高查询速度的关键是建立一个完善的索引结构,为此提出了一种基于时间间隔B+-tree和HSP-tree的多层索引架构ML-index...海洋数据具有多源、多类、多维、海量等特点,是一种典型的大数据,海洋大数据上的快速查询是该领域各类应用的基本需求.提高查询速度的关键是建立一个完善的索引结构,为此提出了一种基于时间间隔B+-tree和HSP-tree的多层索引架构ML-index(multi-layer index),分别制定样本驱动的数据融合机制(adaptive method of data merging strategy)以确定分布式时态数据分区;并基于海洋数据特性、数据单元饱和度等,提出了一种自适应空间划分方法(adaptive space partition),在此基础上建立HSP-tree作为辅助索引.实验验证在海洋数据模式下,提出的多层索引结构保证了海洋数据的查询速度,逼近线性的时间复杂度.展开更多
针对社交网络以及社交用户关注主题,分析用户所在位置,在社交网络的基础上提出主题推荐模型即location-themesocial model(LTS M odel).文章主要从三个方面进行了分析,首先对主题进行分类,运用余弦相似性算法构建向量空间主题模型.其次,...针对社交网络以及社交用户关注主题,分析用户所在位置,在社交网络的基础上提出主题推荐模型即location-themesocial model(LTS M odel).文章主要从三个方面进行了分析,首先对主题进行分类,运用余弦相似性算法构建向量空间主题模型.其次,在MapReduce框架下根据位置快速构建R*-tree索引,建立空间模型,在此基础上找到基于位置和主题的社交网络模型.最后,使用标准数据集对算法进行测试,并根据准确率、召回率和F1值对其效果进行评价.R*-tree索引算法采用抽样方法快速确定空间划分函数,保证了数据对象均匀地划分到各个分区.余弦相似性算法能够快速准确地找到相似主题,并且敏感识别度较强.实验证明基于LTS Model的位置—主题推荐算法(LTRA)能够快速找到满足用户兴趣的主题并进行推荐.展开更多
文摘海洋数据具有多源、多类、多维、海量等特点,是一种典型的大数据,海洋大数据上的快速查询是该领域各类应用的基本需求.提高查询速度的关键是建立一个完善的索引结构,为此提出了一种基于时间间隔B+-tree和HSP-tree的多层索引架构ML-index(multi-layer index),分别制定样本驱动的数据融合机制(adaptive method of data merging strategy)以确定分布式时态数据分区;并基于海洋数据特性、数据单元饱和度等,提出了一种自适应空间划分方法(adaptive space partition),在此基础上建立HSP-tree作为辅助索引.实验验证在海洋数据模式下,提出的多层索引结构保证了海洋数据的查询速度,逼近线性的时间复杂度.
文摘针对社交网络以及社交用户关注主题,分析用户所在位置,在社交网络的基础上提出主题推荐模型即location-themesocial model(LTS M odel).文章主要从三个方面进行了分析,首先对主题进行分类,运用余弦相似性算法构建向量空间主题模型.其次,在MapReduce框架下根据位置快速构建R*-tree索引,建立空间模型,在此基础上找到基于位置和主题的社交网络模型.最后,使用标准数据集对算法进行测试,并根据准确率、召回率和F1值对其效果进行评价.R*-tree索引算法采用抽样方法快速确定空间划分函数,保证了数据对象均匀地划分到各个分区.余弦相似性算法能够快速准确地找到相似主题,并且敏感识别度较强.实验证明基于LTS Model的位置—主题推荐算法(LTRA)能够快速找到满足用户兴趣的主题并进行推荐.