摘要
随着大数据时代的到来,其应有价值也越来越广泛,特别在“互联网+”商业推广中的“精准营销”更是发挥着重要的意义。该文利用用户的搜索记录文本为数据,进行分词处理、建模,采用SparkSql与hive进行整合(spark on hive)。首先,采用SparkSql对表中的元数据进行读取,再使用Spark引擎进行底层数据的分析处理达到高效为有搜索记录的用户建立标签从而构建用户画像的,达到构建智能推荐目的。最后,利用几种常用的分词工具对本文测试,并使用Bayes模型比较了它们在项目中的效果。
出处
《电脑知识与技术》
2020年第33期14-16,共3页
Computer Knowledge and Technology
基金
广东省普通高校特色创新类项目(自然科学)——基于大数据的用户画像与用户行为分析平台研究(2019KTSCX258)。