基于频繁访问页组的路径聚类研究被引量：3

Research of path clustering based on frequently visited page groups

下载PDF

导出

摘要基于用户会话的页面聚类算法旨在发现用户在浏览过程中频繁访问的页组,为站点管理员优化站点结构提供有力的依据。将介绍一种改进的基于频繁访问页组的路径聚类算法K-PathPlus,其中定义了新的兴趣度、内容链接因子。最后采用龙城热线网站日志进行真实测试,实验的结果是成功的。 The page clustering based on user sessions is to group the frequently visited pages,which can help the webmaster to optimize the site topology.This paper will introduce an improved clustering algorithm based on users＇ access interest. K-PathPlus defines new interest degree,content-link ratio.In the end a true experiment is done by using www.ty.sx.cn log file. The result of experiment is successful.

作者吴俊杰刘耀军陈俊杰

机构地区太原师范学院计算机系太原理工大学计算机与软件学院

出处《计算机工程与应用》 CSCD 北大核心 2010年第33期130-131,共2页 Computer Engineering and Applications

基金山西省自然科学基金No.2008021025~~

关键词访问兴趣聚类路径聚类数据挖掘兴趣度内容链接因子 access interest clustering path clustering data mining interest degree content-link ratio

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1钱卫宁,周傲英.从多角度分析现有聚类算法(英文)[J].软件学报,2002,13(8):1382-1394. 被引量：86
2吴俊杰,陈俊杰,赵栓柱.基于用户访问兴趣的路径聚类研究[J].计算机工程与应用,2005,41(36):170-171. 被引量：7
3杨怡玲,管旭东,尤晋元.基于页面内容和站点结构的页面聚类挖掘算法[J].软件学报,2002,13(3):467-469. 被引量：20
4Mobasher B,Dai H,Luo T,et al.Discovery and evaluation of aggregate usage profiles for Web personalization[J].Data Mining and Knowledge Discovery,2002,6(1):61-82.
5Cadez I,Heckerman D,Meek C,et al.Model-based clustering and visualization of navigation patterns on a Web site[J].Data Mining and Knowledge Discovery,2003,7(4):399-424.
6Grabmeier J,Rudolph A.Techniques of cluster algorithms in data mining[J].Data Mining and Knowledge Discovery,2002,6(4):303-360.
7Cho Y H,Kim J K,Kim S H.A personalized recommender system based on Web usage mining and decision tree induction[J].Expert Systems with Applications,2002,23(3):329-342.
8Tan P,Kumar V.Discovery of Web robot sessions based on their navigational patterns[J].Data Mining and Knowledge Discovery,2002,6(1):9-35.

二级参考文献42

1[1]Cooley,R.,Srivastava,J.Data preparation for mining World Wide Web browsing patterns.Journal of Knowledge and Information Systems,1999,1(1):5～32.
2[2]Fayyad,U.M.,Piatetsky-Shapiro,G.,Smyth,P.The KDD process for extracting useful knowledge from volumes of data.Communications of the ACM,1996,39(11):27～34.
3[3]Mobasher,B.,Jain,N.,Han,E.H.,et al.Web mining:pattern discovery and from World Wide Web transactions.Technical Report,96-050,University of Minnesota,1996.
4[4]Wu,K.L.,Yu,P.S.,Ballman,A.SpeedTracer:a web usage mining and analysis tool.IBM System Journal,1998,37(1):89～105.
5[1]Fasulo, D. An analysis of recent work on clustering algorithms. Technical Report, Department of Computer Science and Engineering, University of Washington, 1999. http://www.cs.washington.edu.
6[2]Baraldi, A., Blonda, P. A survey of fuzzy clustering algorithms for pattern recognition. IEEE Transactions on Systems, Man and Cybernetics, Part B (Cybernetics), 1999,29:786～801.
7[3]Keim, D.A., Hinneburg, A. Clustering techniques for large data sets - from the past to the future. Tutorial Notes for ACM SIGKDD 1999 International Conference on Knowledge Discovery and Data Mining. San Diego, CA, ACM, 1999. 141～181.
8[4]McQueen, J. Some methods for classification and Analysis of Multivariate Observations. In: LeCam, L., Neyman, J., eds. Proceedings of the 5th Berkeley Symposium on Mathematical Statistics and Probability. 1967. 281～297.
9[5]Zhang, T., Ramakrishnan, R., Livny, M. BIRCH: an efficient data clustering method for very large databases. In: Jagadish, H.V., Mumick, I.S., eds. Proceedings of the 1996 ACM SIGMOD International Conference on Management of Data. Quebec: ACM Press, 1996. 103～114.
10[6]Guha, S., Rastogi, R., Shim, K. CURE: an efficient clustering algorithm for large databases. In: Haas, L.M., Tiwary, A., eds. Proceedings of the 1998 ACM SIGMOD International Conference on Management of Data. Seattle: ACM Press, 1998. 73～84.

共引文献110

1刘英林,陈玉柱,丁文静,程红云.钢卷表面缺陷分布特征发现方法研究[J].冶金自动化,2020,44(1):27-31. 被引量：2
2毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
3李华,贾雪.基于FM度量的自适应K-Means聚类的工业生产运行基准挖掘[J].长春大学学报,2022,32(4):22-27.
4Qi Zhang,Jianshe Cao,Yanfeng Sui.Development of a research platform for BEPCⅡ accelerator fault diagnosis[J].Radiation Detection Technology and Methods,2020,4(3):269-276.
5郭景峰,赵玉艳,边伟峰,李晶.基于改进的凝聚性和分离性的层次聚类算法[J].计算机研究与发展,2008,45(z1):202-206. 被引量：15
6王建会,申展,胡运发.一种实用高效的聚类算法[J].软件学报,2004,15(5):697-705. 被引量：26
7张虎,郑家恒,刘江.语料库词性标注一致性检查方法研究[J].中文信息学报,2004,18(5):11-16. 被引量：9
8高波,张忠能,查志琴.基于文字链接比的网页分类的研究[J].计算机工程与应用,2004,40(27):151-153. 被引量：1
9杨涛,李龙澍.一种基于粗糙集聚类的数据约简算法[J].系统仿真学报,2004,16(10):2195-2197. 被引量：5
10张虎,郑家恒,刘江.汉语语料库词性标注自动校对方法研究[J].计算机应用,2005,25(1):17-19. 被引量：1

同被引文献15

1Jiawei Han Micheline Kamber著.范明,孟小峰译.数据挖掘概念与技术[M].北京:机械工业出版社,2001.
2段利君.基于Web挖掘的网页动态推荐系统研究[D].复旦大学,2010年.
3王琼,刘珏,徐汀荣.基于站点结构的用户频繁路径挖掘[J].计算机应用与软件,2009,26(1):150-152. 被引量：3
4陈文林,宋江春.一个基于学习者访问聚类的远程教育智能推荐系统[J].中国远程教育,2009(9):64-67. 被引量：2
5庞敏,赵乙国,周海英.改进的基于Web的频繁访问路径挖掘算法[J].测试技术学报,2009,23(3):244-247. 被引量：1
6缪勇,宋斌.基于Web日志的典型匿名用户路径挖掘研究[J].计算机应用,2009,29(10):2774-2777. 被引量：3
7杨秋田.对网络教学的几点思考[J].武警学院学报,2010,26(3):71-72. 被引量：4
8王义,马尚才.基于用户行为的个性化推荐系统的设计与应用[J].计算机系统应用,2010,19(8):29-33. 被引量：21
9孙金华,朱顺痣,翁伟,谢彦麒.基于最大正向引用序列的Web浏览模式挖掘算法与应用[J].黄石理工学院学报,2010,26(5):28-32. 被引量：1
10柴巧叶.基于关联规则的用户频繁访问模式研究[J].太原师范学院学报（自然科学版）,2011,10(2):87-89. 被引量：2

引证文献3

1吴振慧,缪勇.基于典型用户路径的网页推荐技术在网络教学平台中的应用研究[J].福建电脑,2013,29(9):15-17.
2彭昱静,缪勇.智能推荐在网络辅助教学中的个性化教学探索[J].福建电脑,2013,29(10):30-31. 被引量：1
3李珊,邵兰洁,刘淑艳,邵芬红.一种基于INT的用户浏览兴趣路径挖掘算法[J].控制工程,2017,24(5):1043-1047. 被引量：1

二级引证文献2

1周卉.基于个性化推荐的计算机辅助教学系统[J].科技传播,2019,11(14):110-111. 被引量：2
2张铁宝,李桂娥.能力约束下多产品物流频繁路径挖掘算法仿真[J].计算机仿真,2019,36(12):249-252. 被引量：1

1吴俊杰,陈俊杰,赵栓柱.基于用户访问兴趣的路径聚类研究[J].计算机工程与应用,2005,41(36):170-171. 被引量：7
2林文龙,刘业政,余智学.用页组拓扑平均距离改善页面聚类算法[J].计算机科学,2008,35(10):200-203. 被引量：1
3张龙翔.一种基于Web日志挖掘的频繁访问页组加强算法[J].临沂师范学院学报,2004,26(3):100-103.
4王实,高文,李锦涛,谢辉.路径聚类:在Web站点中的知识发现[J].计算机研究与发展,2001,38(4):482-486. 被引量：59
5谭薇,马力,索永强.基于用户访问兴趣的Web站点路径聚类研究[J].西安邮电学院学报,2009,14(5):111-115. 被引量：1
6王霞,赵龙,夏秀峰.基于位置近邻的RFID路径聚类算法[J].沈阳航空航天大学学报,2012,29(2):46-50.
7刘晓东,刘国荣,王颖,李辉.基于ISODATA的用户访问路径聚类算法[J].微电子学与计算机,2006,23(8):91-93.
8MSC.Software2009虚拟产品开发大会召开[J].舰船科学技术,2009,31(5):15-15.
9张国平,黄淼,马丽,赵桂钦.路径聚类融合USTU的自适应多通道生物特征识别研究[J].计算机应用研究,2015,32(7):2184-2188.
10冷泳林,鲁富宇.一种基于时序的层次轨迹聚类算法[J].重庆理工大学学报（自然科学）,2017,31(3):123-127. 被引量：4

计算机工程与应用

2010年第33期

浏览历史

内容加载中请稍等...

基于频繁访问页组的路径聚类研究被引量：3

参考文献8

二级参考文献42

共引文献110

同被引文献15

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于频繁访问页组的路径聚类研究 被引量：3

参考文献8

二级参考文献42

共引文献110

同被引文献15

引证文献3

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于频繁访问页组的路径聚类研究被引量：3