针对历史数据稀疏性导致推荐算法预测精度低的问题,提出基于多重相似度分析和CatBoost的推荐算法。利用修正的余弦相似度函数求解项目元数据和评分数据的相似矩阵并进行融合;采用大规模信息嵌入网络(large-scale information network em...针对历史数据稀疏性导致推荐算法预测精度低的问题,提出基于多重相似度分析和CatBoost的推荐算法。利用修正的余弦相似度函数求解项目元数据和评分数据的相似矩阵并进行融合;采用大规模信息嵌入网络(large-scale information network embedding,LINE)对融合后的相似矩阵进行多阶相似性分析计算更精确的近邻集;以此作为CatBoost的输入预测项目评分并利用Top-N推荐项目。为验证其有效性,在MovieLens数据集上进行实验并与其它方法对比。实验结果表明,该方法具有更高的推荐精度、更强的稳定性,可解决历史数据稀疏性导致的推荐质量低的问题。展开更多
文摘针对历史数据稀疏性导致推荐算法预测精度低的问题,提出基于多重相似度分析和CatBoost的推荐算法。利用修正的余弦相似度函数求解项目元数据和评分数据的相似矩阵并进行融合;采用大规模信息嵌入网络(large-scale information network embedding,LINE)对融合后的相似矩阵进行多阶相似性分析计算更精确的近邻集;以此作为CatBoost的输入预测项目评分并利用Top-N推荐项目。为验证其有效性,在MovieLens数据集上进行实验并与其它方法对比。实验结果表明,该方法具有更高的推荐精度、更强的稳定性,可解决历史数据稀疏性导致的推荐质量低的问题。