针对协同过滤推荐系统在稀疏数据集条件下推荐准确度低的问题,提出了推荐支持度模型以及用于该模型计算的邻域线性最小二乘拟合的推荐支持度评分算法(linear least squares fitting,LLSF)。该模型描述用户对被推荐项目更感兴趣的可能性...针对协同过滤推荐系统在稀疏数据集条件下推荐准确度低的问题,提出了推荐支持度模型以及用于该模型计算的邻域线性最小二乘拟合的推荐支持度评分算法(linear least squares fitting,LLSF)。该模型描述用户对被推荐项目更感兴趣的可能性,通过用高支持度的评分估计取代传统的期望估计法来找出用户更喜欢的项目,从而提高推荐的准确度,并从理论上论述了该算法在稀疏数据集条件下相对其他算法具有更强的抗干扰能力。该模型还易于与其他推荐模型融合,具有很好的可拓展性。实验结果表明:LLSF算法显著提升了推荐的准确性,在MovieLens数据集上,F1分数可达到传统的kNN算法的3倍多,对于越是稀疏的数据集,准确率提升幅度越大,在Book-Crossing数据集上,当稀疏度由91%增加到99%时,F1分数的改进由22%提高到125%。同时该方法不会牺牲推荐覆盖率,可以保证长尾项目的挖掘效果。展开更多
针对日长(Length Of Day,LOD)变化预报中最小二乘(Least Squares,LS)拟合存在端点效应的问题,采用时间序列分析方法对日长变化序列进行端点延拓,形成一个新序列,然后用新序列建立最小二乘模型,最后再结合最小二乘模型和自回归(Autoregre...针对日长(Length Of Day,LOD)变化预报中最小二乘(Least Squares,LS)拟合存在端点效应的问题,采用时间序列分析方法对日长变化序列进行端点延拓,形成一个新序列,然后用新序列建立最小二乘模型,最后再结合最小二乘模型和自回归(Autoregressive,AR)模型对原始日长变化序列进行预报。实验结果表明,在日长变化序列两端增加统计延拓数据,能有效减小最小二乘拟合序列的端点畸变,从而提高日长变化的预报精度,尤其对中长期预报精度提高明显。展开更多
文摘针对协同过滤推荐系统在稀疏数据集条件下推荐准确度低的问题,提出了推荐支持度模型以及用于该模型计算的邻域线性最小二乘拟合的推荐支持度评分算法(linear least squares fitting,LLSF)。该模型描述用户对被推荐项目更感兴趣的可能性,通过用高支持度的评分估计取代传统的期望估计法来找出用户更喜欢的项目,从而提高推荐的准确度,并从理论上论述了该算法在稀疏数据集条件下相对其他算法具有更强的抗干扰能力。该模型还易于与其他推荐模型融合,具有很好的可拓展性。实验结果表明:LLSF算法显著提升了推荐的准确性,在MovieLens数据集上,F1分数可达到传统的kNN算法的3倍多,对于越是稀疏的数据集,准确率提升幅度越大,在Book-Crossing数据集上,当稀疏度由91%增加到99%时,F1分数的改进由22%提高到125%。同时该方法不会牺牲推荐覆盖率,可以保证长尾项目的挖掘效果。
文摘针对日长(Length Of Day,LOD)变化预报中最小二乘(Least Squares,LS)拟合存在端点效应的问题,采用时间序列分析方法对日长变化序列进行端点延拓,形成一个新序列,然后用新序列建立最小二乘模型,最后再结合最小二乘模型和自回归(Autoregressive,AR)模型对原始日长变化序列进行预报。实验结果表明,在日长变化序列两端增加统计延拓数据,能有效减小最小二乘拟合序列的端点畸变,从而提高日长变化的预报精度,尤其对中长期预报精度提高明显。