-
题名标签扩展的协同过滤推荐算法
被引量:2
- 1
-
-
作者
陈海龙
闫五岳
孙海娇
程苗
-
机构
哈尔滨理工大学计算机科学与技术学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2021年第10期1826-1832,共7页
-
基金
国家自然科学基金(61772160)
哈尔滨市科技创新人才研究专项资金(青年后备人才A类,2017RAQXJ045)。
-
文摘
大多数利用标签与用户和项目之间关系的推荐算法,都要面临用户个体不同所导致的标签稀疏问题,不同的用户为项目所标注的标签会有所不同。针对由于用户标注标签的随意性而导致的用户标签和项目标签矩阵稀疏问题,提出了一种标签扩展的协同过滤推荐算法。该算法根据用户标注标签的行为计算基于标签的标签相似度,根据用户标注的标签语义计算基于标签语义的标签相似度,从用户行为和标签语义2个方面评估标签的相似度,并利用标签相似度来扩展每个项目标签,降低由项目与标签的关联关系产生的矩阵稀疏度。在MovieLens数据集上的实验结果表明,所提算法在精度上有所提高。
-
关键词
协同过滤
标签稀疏
标签语义
标签扩展
-
Keywords
collaborative filtering
tag sparse
tag semantics
tag extension
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名基于BM25聚类与巴氏系数相似度改进的推荐算法
被引量:6
- 2
-
-
作者
程苗
陈海龙
孙海娇
闫五岳
-
机构
哈尔滨理工大学计算机科学与技术学院
-
出处
《黑龙江大学自然科学学报》
CAS
2020年第5期610-616,共7页
-
基金
哈尔滨市科技创新人才研究专项资金项目(2017RAQXJ045)
国家自然科学基金资助项目(61772160)。
-
文摘
推荐算法的目的是给用户推荐潜在的感兴趣的物品和信息,在传统的算法设计中,由于数据稀疏和冷启动等因素往往给推荐带来较大误差,依靠传统的用户项目数据评分来计算相似度已经难以达到让人满意的推荐效果。本文引入BM25算法对计算用户和词素之间的相关性得分具有较准确效果。在用户项目评分矩阵和项目关键词矩阵的基础上,形成用户关键词矩阵,挖掘出用户对关键词的喜爱,继而完成用户兴趣聚类。引入巴氏系数,可以解决用户在没有共同评分项目情况下用户相似度计算问题。利用巴氏系数改进相似度,在类簇中找到与用户最相似的邻居集,产生有效推荐。对MovieLens数据集进行实验的结果表明,无论在准确率或召回率等实验测评中,该算法相比于传统的基于用户和基于物品等协同算法的实验结果都显著提高。
-
关键词
聚类
BM25
巴氏系数
兴趣矩阵
-
Keywords
clustering
BM25
Babbitt coefficient
interest matrix
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于巴氏系数与矩阵分解的推荐算法
被引量:1
- 3
-
-
作者
孙海娇
陈海龙
闫五岳
程苗
-
机构
哈尔滨理工大学计算机科学与技术学院
-
出处
《黑龙江大学自然科学学报》
CAS
2020年第4期419-426,共8页
-
基金
国家自然科学基金面上项目(61772160)
哈尔滨市科技创新人才研究专项资金项目(2017RAQXJ045)。
-
文摘
针对传统的协同过滤算法的数据稀疏性以及相似度计算中对用户的共同评分项过度依赖问题,提出一种改进相似度与矩阵分解的协同过滤推荐算法。首先,利用矩阵分解对用户评分矩阵降维处理,缓解数据稀疏对推荐准确率的影响;其次,将巴氏系数融入到用户的相似度计算公式中,解决传统计算方法中依赖于用户间的共同评分信息的问题,并将用户属性相似度与改进的相似度加权融合,解决系统新用户的评分数据稀少问题;最后,根据预测评分给目标用户生成推荐。将该算法在MovieLens数据集.上与传统协同过滤算法、基于巴氏系数与用户属性改进的算法以及基于矩阵分解的推荐算法进行准确率、召回率、F1值对比分析。实验结果表明,当邻居个数为25时,与后三种算法相比,所提出算法的准确率分别提高了38.89%、37.97%、33.71%;召回率分别提高了38.92%、38.05%、33.84%;F1值分别提高了38.88%、38.02%、33.74%。
-
关键词
协同过滤
矩阵分解
巴氏系数
用户属性
-
Keywords
collaborative filtering
matrix factorization
Bhattacharyya coefficient
user attribute
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-