基于网站结构的网络使用挖掘树化模型被引量：1

A Tree Model for Web-Usage Mining Based on Web Site Structure

下载PDF

导出

摘要根据网站的树形结构特点,提出了一种统一的树化模型对用户访问路径进行建模,解决了因使用原始访问路径产生的"过度比较问题",并通过采用适合该模型的网页相对位置的概念,大大减轻了原来由于使用网页绝对访问位置导致的误差。结果表明:树化模型能够提高用户访问行为的相似度识别率。 In this paper, we abstract the salient features of the sequence as a tree model for web usage analysis, motivated by web site structure, to solve these problems. At the same time, we suggest the relative position to improve the error from the comparison of the absolutely position. Finally, the experimental results with an amount of datasets demonstrate the effectiveness of tree modeling approach.

作者白锦士张有仁

机构地区华东理工大学计算机科学与工程系

出处《华东理工大学学报（自然科学版）》 CAS CSCD 北大核心 2005年第2期193-197,共5页 Journal of East China University of Science and Technology

关键词网络使用挖掘访问路径相似度聚类网站结构预聚类 web usage mining visit path similarity clustering web site structure pre-clustering

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1Shahabi C, Farnoush B K. Efficient and anonymous Webusage mining for Web personalization[A]. Informs Journal on Computing, Special Issue on Data Mining[C]. Cincinnati,Ohio, USA:[s. n.],2003. 123-147.
2Cooley R, Mobasher B, Srivastava J. Web mining:Information and pattern discovery on the world wide Web[A]. 9th International conference on Tools with Artificial Intelligence[C]. Newport Beach CA, USA:[s. n. ],1997. 158-172.
3Fu Y, Sandhu K, Shih M. Clustering of web users based on access patterns[A]. Proceedings of the 1999 KDD Workshopon Web Mining[C]. San Diego, CA,USA:[s. n.],1999.42-445.
4Banerjee, Ghosh A, Clickstream J. Clustering using weighted longest common subsequences[A]. Proc of the Workshop on Web Mining, SIAM Conference on Data Mining[C]. Chicago,USA: Es. n. 3,2001. 158-172.
5Guha S, Rastogi R, Shim K. CURE: An efficient clustering algorithm for large databases[A]. Proceedings of ACM SIG-MOD International Conference on Management of Data[C].Seattle, Washington, USA: [s. n. ] ,1998. 67-96.

同被引文献6

1孙华文,王大玲,于戈,鲍玉斌,王琢.Web挖掘及个性化推荐中网站拓扑结构的获取、分析及应用[J].小型微型计算机系统,2005,26(7):1225-1228. 被引量：3
2王军,王涛,宋宝燕.Web日志挖掘中重构网站结构技术[J].辽宁大学学报（自然科学版）,2006,33(3):276-279. 被引量：2
3段爱华.基于网站结构分析页面信息提取的方法研究[J]电脑知识与技术,2008(23).
4杜华.电子商务网站结构优化模型与算法研究[D]首都师范大学,首都师范大学2009.
5何坤鹏.基于本体的网站结构知识获取与分析[D]北京化工大学,北京化工大学2007.
6韩云端.基于浏览者的网站结构研究[D]山西财经大学,山西财经大学2006.

引证文献1

1王尧.综合性艺术门户网站设计研究——观视音网站的架构及内容设计[J].美与时代（创意）（上）,2011(7):80-82.

1吴小波,徐维祥.多支持度关联规则在网络使用挖掘中的应用[J].计算机工程与应用,2005,41(31):164-167. 被引量：9
2庞敏,周海英,魏海燕.Web使用挖掘中重建会话的改进算法[J].长春理工大学学报（自然科学版）,2009,32(2):288-291.
3刘路,刘朝明.网络(WEB)挖掘方法及其最新进展[J].世界科技研究与发展,2006,28(1):66-71.
4佘东晓,陈传波.在网络使用挖掘中的应用条件序列模式分析[J].计算机工程与科学,2003,25(5):23-26.
5陶剑文.一种分布式智能推荐系统的设计与实现[J].计算机仿真,2007,24(7):296-300. 被引量：1
6胡天濡.浅谈万维网上的数据挖掘[J].现代营销（下）,2011(11):268-268.
7余力,刘鲁.事件序列的相似性研究[J].计算机工程,2003,29(15):13-14. 被引量：5
8杨钤雯,寇纪淞,陈富赞,李敏强.基于本体的语义网络会话聚类和可视化方法[J].模式识别与人工智能,2011,24(1):111-116. 被引量：2
9马超,沈微.基于闭合有间隔频繁子序列的点击流聚类[J].计算机工程,2010,36(23):72-75. 被引量：5
10王琼,刘珏,徐汀荣.结合Web站点结构的路径补充[J].计算机技术与发展,2007,17(6):120-122. 被引量：2

华东理工大学学报（自然科学版）

2005年第2期

浏览历史

内容加载中请稍等...

基于网站结构的网络使用挖掘树化模型被引量：1

参考文献5

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于网站结构的网络使用挖掘树化模型 被引量：1

参考文献5

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于网站结构的网络使用挖掘树化模型被引量：1