期刊文献+

格网化的位置微博数据抓取与人群信息提取 被引量:6

Grid-based location Microblog data fetching and human information extraction
原文传递
导出
摘要 空间位置信息通常代表了设备使用人群的地理空间活动特征,客观体现人群活动的时空分布。针对现有的微博数据抓取方法由于普通用户的访问限制易导致采集的目标数据缺失的问题,该文提出了一种目标区域空间划分策略。在数据抓取之前对目标区域实行格网化,进而实现数据的同时抓取。通过统计分析基于网格单元抓取的位置微博数据,从中提取出人群活动信息,结合位置微博数据所在的兴趣点类型,统计分析了位置微博用户的时空分布和活动特征。这种方法缩小了采集区域,可实现并行高效的位置微博抓取,并保证了采集范围的重叠,最大限度地保证采集数据的完整性。 Spatial location information usually symbolize the geographical spatial activity features of people who use the smart mobile devices, and the features can reflect the users activity temporal and special distribution. Aiming at the problem of goal data missing caused by the restriction of common users' access of existed Microblog data fetching methods, this paper proposed a spatial partition strategy for target area. Before fetching the Microblog data, the grid transformation was carried out in the target area to realize data fetching at the same time. Through counting and analyzing the location data fetched by the grid cells, the user's activity information could be extracted from distribution trend based on different POI types. This method greatly narrowed the collection area and realized the efficient parallel of Microblog position data fetching, which ensured the overlap of collection scope and the integrity of collecting data.
出处 《测绘科学》 CSCD 北大核心 2017年第2期125-129,共5页 Science of Surveying and Mapping
基金 国家自然科学基金项目(41201412,41471414) 特色研究所培育建设服务项目(TSYJS03) 资源与环境信息系统国家重点实验室青年人才培养基金项目(O8R8B640KA)
关键词 格网 位置微博 数据抓取 人群活动 信息提取 grid location Microblog data fetching human dynamic information extraction
  • 相关文献

参考文献12

二级参考文献210

共引文献833

同被引文献64

引证文献6

二级引证文献31

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部