随着网络信息技术在各领域的深入发展与应用,社会科学领域的数据类型和数量快速增长,尽管绝大部分社会科学领域的数据量很难达到TB级,但传统基于文件型的数据存储和处理方法已无法适用,需要借助数据库技术和方法。本文以粤港澳大湾区的...随着网络信息技术在各领域的深入发展与应用,社会科学领域的数据类型和数量快速增长,尽管绝大部分社会科学领域的数据量很难达到TB级,但传统基于文件型的数据存储和处理方法已无法适用,需要借助数据库技术和方法。本文以粤港澳大湾区的496万个POI(Point of Interest)数据的存储与分析处理为例,结合PostgreSQL开源数据库探讨社会科学大数据的处理与应用方法。本文通过研究认为:单机数据库系统能胜任绝大部分社会科学领域的大数据应用,不需要大规模的分布式数据库;PostgreSQL数据库免费、易于适用、性能强大等特点使得非常易于社科研究人员使用;POI大数据也将随着网络地图服务的深入发展成为一种重要的社会科学研究数据;根据POI大数据的空间核密度分析可以发现粤港澳大湾区城市空间呈现高度集聚、多中心、等级化及功能空间连片化特征。展开更多
文摘随着网络信息技术在各领域的深入发展与应用,社会科学领域的数据类型和数量快速增长,尽管绝大部分社会科学领域的数据量很难达到TB级,但传统基于文件型的数据存储和处理方法已无法适用,需要借助数据库技术和方法。本文以粤港澳大湾区的496万个POI(Point of Interest)数据的存储与分析处理为例,结合PostgreSQL开源数据库探讨社会科学大数据的处理与应用方法。本文通过研究认为:单机数据库系统能胜任绝大部分社会科学领域的大数据应用,不需要大规模的分布式数据库;PostgreSQL数据库免费、易于适用、性能强大等特点使得非常易于社科研究人员使用;POI大数据也将随着网络地图服务的深入发展成为一种重要的社会科学研究数据;根据POI大数据的空间核密度分析可以发现粤港澳大湾区城市空间呈现高度集聚、多中心、等级化及功能空间连片化特征。