新冠疫情背景下,随着人们线上观影需求的不断增大,如何从互联网海量数据中为用户精准推荐其喜爱的电影已然成为了众多流媒体平台关注的问题。本文以TMDB(The Movie Database)电影数据集和Netflix Prize电影评分数据集为例进行知识抽取,...新冠疫情背景下,随着人们线上观影需求的不断增大,如何从互联网海量数据中为用户精准推荐其喜爱的电影已然成为了众多流媒体平台关注的问题。本文以TMDB(The Movie Database)电影数据集和Netflix Prize电影评分数据集为例进行知识抽取,构建电影知识图谱,利用图数据库Neo4j对知识图谱进行存储,基于知识图谱进行电影推荐。相较于传统的电影推荐算法,本文的电影推荐利用了知识图谱可以存储海量电影特征信息、用户信息,并可以依据数据间的关系进行快速检索的特点,使推荐结果更加精准多样,同时具有良好的可解释性。展开更多
文摘新冠疫情背景下,随着人们线上观影需求的不断增大,如何从互联网海量数据中为用户精准推荐其喜爱的电影已然成为了众多流媒体平台关注的问题。本文以TMDB(The Movie Database)电影数据集和Netflix Prize电影评分数据集为例进行知识抽取,构建电影知识图谱,利用图数据库Neo4j对知识图谱进行存储,基于知识图谱进行电影推荐。相较于传统的电影推荐算法,本文的电影推荐利用了知识图谱可以存储海量电影特征信息、用户信息,并可以依据数据间的关系进行快速检索的特点,使推荐结果更加精准多样,同时具有良好的可解释性。