期刊文献+

一种基于K-均值的用户行为聚类算法 被引量:1

A User Action Clustering Algorithm Based on K-means
下载PDF
导出
摘要 针对电子商务系统中大多采取用户评分或购买数据进行聚类,较少进一步分析用户行为的现状,提出一种根据用户浏览商品时序分析用户兴趣的方法 .在此基础上先用Canopy算法进行数据预处理后使用K-均值算法根据用户兴趣实现用户聚类.采用KDD CUP2000数据集中的用户点击流数据中的用户浏览记录对算法进行实验,实验结果表明算法有较好的聚类结果 . This paper presents a method based on analyzingthe users' interesting while their browsing goods, aiming atfurther exploring the current situation of their behaviors,as the e ﹣ commerce conducts the clustering based on the user rating data or user purchase data,less doesthe further analysis of their behaviors. On this basis, the Canopy algorithm was used to preprocess the data,and then use K ﹣ means algorithm to do the user cluste-ring. And in the end,the user click stream data of Gazelle. com provided by the KDD Cup 2000 was used to vali-date the algorithm,the experimental results shows that the algorithm has better clustering results.
作者 曾蔚
出处 《绵阳师范学院学报》 2015年第8期94-98,共5页 Journal of Mianyang Teachers' College
基金 福建省大数据管理新技术与知识工程重点实验室 智能计算与信息处理福建省高等学校重点实验室开放课题(2014KL06)
关键词 用户行为聚类 K﹣均值 CANOPY user action clustering K ﹣ means CanoPy
  • 相关文献

参考文献8

  • 1王微微,夏秀峰,李晓明.一种基于用户行为的兴趣度模型[J].计算机工程与应用,2012,48(8):148-151. 被引量:37
  • 2Han J,Mickeline K,Pel J.数据挖掘:概念与技术[M].范明,孟小峰,译.北京:机械工业出版社,2012.
  • 3毛典辉.基于MapReduce的Canopy-Kmeans改进算法[J].计算机工程与应用,2012,48(27):22-26. 被引量:66
  • 4KDD Cup 2000 : Online retailer website clickstream analysis I Sig KDD [ EB/OL]. http ://www. kdd. org/kdd - cup - 2000 - online - retailer - website - clickstream - analysis.
  • 5何莹,秦亮曦.基于PCA的H-K聚类算法研究[J].微计算机信息,2012,28(6):163-165. 被引量:3
  • 6JannaehD,ZankerM,FelfemigA,FriedriehG.推荐系统[M].北京:人民邮电出版社,2013.36-37.
  • 7项亮.推荐系统实践[M].北京:人民邮电出版社,2013.
  • 8OwenS,AnilR,DunningT,FriedmanE.Mahout实战[M].北京:人民邮电出版社,2014.125一134.

二级参考文献30

共引文献113

同被引文献5

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部