期刊文献+

一种新的基于事物聚类Web浏览偏爱路径挖掘算法 被引量:1

New approach of mining user’s preferred browsing paths based on things clustering algorithm
下载PDF
导出
摘要 目前的挖掘算法单纯考虑了用户的访问频度,而忽略了用户对访问路径的兴趣度。本文通过分析目前用户偏爱路径挖掘算法存在的问题,结合事物聚类算法,将雅克比系数与最长公共路径系数相乘,得到更准确地用户相似集,并基于一个三元组模型构造以页面兴趣度为元素值的网站浏览数据矩阵,采用改进的挖掘算法计算用户偏爱度和访问兴趣度,降低访问页面闲置及链接等因素对数据挖掘的影响;实验结果表明,该算法针对Web日志海量数据进行挖掘,具有较高的效率和准确率。
出处 《制造业自动化》 北大核心 2013年第4期65-67,86,共4页 Manufacturing Automation
  • 相关文献

参考文献6

二级参考文献21

  • 1业宁,李威,梁作鹏,董逸生.一种Web用户行为聚类算法[J].小型微型计算机系统,2004,25(7):1364-1367. 被引量:20
  • 2陈小松,崔志明.基于Chameleon算法的用户聚类的设计与实现[J].微机发展,2005,15(4):48-50. 被引量:7
  • 3姚洪波,杨炳儒.Web日志挖掘数据预处理过程技术研究[J].微计算机信息,2006,22(06X):234-236. 被引量:17
  • 4周琪锋.基于Web的数据挖掘技术的研究[J].电脑知识与技术,2007(1):97-97. 被引量:4
  • 5PALIOURS G, PAPATHEODOROU C, KARKALETSIS V, et al. Clustering the users of large Web sites into communities [ C]//Proceedings of the Seventeenth International Conference on Machine Learning. San Francisco: Morgan Kaufmann Publishers Inc., 2000:719 - 726.
  • 6FU Y, SANDHU K, SHIH M. Clustering of Web users based on access patterns [ C]//International Workshop on Web Usage Analysis and User Profiling. San Diego: [ s. n. ], 1999:142 - 162.
  • 7ZADEH L A. Fuzzy sets[J]. Infromation and Control, 1965, 8:338 -353.
  • 8Pei J,Han J,Mortazavi-Asl B.Mining access patterns efficiently from web logs[C]//Proceedings of Fourth Pacific Asia Conference on Knowledge Discovery and Data Mining.Berlin:Springer,2000:257-261.
  • 9Xiao Y,Dunham M H.Efficient mining of traversal patterns[J].Data and Knowledge Engineering,2001,39(2):191-214.
  • 10Pei J,Han J,Mortazavi-Asl B.Mining access patterns efficiently from web logs[C]//Proceedings of Fourth Pacific Asia Conference on Knowledge Discovery and Data Mining.Berlin:Springer,2000:306-315.

共引文献17

同被引文献7

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部