Web使用挖掘的数据采集技术探究被引量：3

Research on Techniques of Data Collecting for Web Usage Mining

下载PDF

导出

摘要如何准确、及时、全面地采集用户使用数据是Web使用挖掘的重要前提和基础。基于Web的基本结构,Web使用挖掘的数据源可以从Web服务器端、应用服务器端、代理服务器端和客户端进行采集。文中分析了传统的基于Web日志进行Web使用挖掘所面临的问题,讨论了建立在用户浏览行为基础上的客户端数据采集技术,重点讨论了其中的JavaApplet技术。通过Java Applet技术可以获取客户端IP,可以自动完成用户浏览信息的准确采集,可以广泛用于各类网站的个性化和智能化服务、站点结构改进、商业智能等。 How to collect users＇ data accurately and quickly and ensure data integrity is an important precondition and foundation for Web usage mining research. Based on the Web structure, the data source of Web usage mining can be collected from Web server, application server, agent server and client. In this paper, the problems facing traditional Web usage mining based on the Web log are analysed, the data collection techniques of client are discussed which is based on the users＇ browsing behaviours, and the Java Applet technique is much emphasized, which can help get the IP address of client, automaticly complete the accurate collection of users＇ browsing information, can he widely used for the Web sites＇ personal and intelligent service, for the improvement of Web structure, and for the business intelligence, etc.

作者邵兰洁李光忠

机构地区北京化工大学北方学院信息学院山东农业大学信息科学与工程学院

出处《计算机技术与发展》 2010年第3期225-229,共5页 Computer Technology and Development

基金国家"十一五"计划项目(FIB070335-B8-08)

关键词数据采集 WEB使用挖掘 WEB日志 JAVA APPLET data collecting Web usage mining Web Log Java Applet

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献9

1涂承胜,陆玉昌.Web使用挖掘技术研究[J].小型微型计算机系统,2004,25(7):1177-1184. 被引量：37
2向坚持,刘相滨,徐选华.基于用户行为的Web使用挖掘数据采集技术研究[J].计算机与现代化,2007(12):59-62. 被引量：8
3Chen M S, Park J S, Yu P S. Data Mining for Path Traversal Patterns in a Web Environment[C] // In: Proceedings of the 16th International Conference on Distributed Computing Systems. Hong Kong: [ s. n. ], 1996: 385 - 392.
4Yan Tak, Jacobsen M, Gareia Molina H, et al. From User Access Patterns to Dynamic Hyper text Linking[C] //In: Proceedings of the 5th International World Wide Web Corderence. Paris, Franee:[s.n.], 1996:1007-1014.
5BoNes J, Levene M. Data Mining of User Navigation Patterns[C] // In: Proceedings of the WEBKDD' 99 Workshop on Web Usage Analysis and User Profiling. San Diego, CA, USA:[s.n. ], 1999:31-39.
6SEIGERM MADSENMR LANGSTONJ etal 陆昌辉张光剑陈佐译.点击流数据仓库[M].北京:电子工业出版社,2004..
7朱志国,邓贵仕.Web使用挖掘技术的分析与研究[J].计算机应用研究,2008(1):29-32. 被引量：23
8刘立军,周军,梅红岩.Web使用挖掘的数据预处理[J].计算机科学,2007,34(5):200-201. 被引量：22
9Schildt H.Java2参考大全[M].第5版.周志彬,吕建宁,章小莉译.北京:电子工业出版社,2004.

二级参考文献35

1刘洪涛,张平,黄智兴,程静,刘革平.用户浏览行为数据采集方法综述[J].西南科技大学学报,2004,19(2):45-49. 被引量：6
2向坚持,陈晓红,刘相滨,徐选华.基于Web Log的数据预处理研究[J].湖南师范大学自然科学学报,2004,27(4):33-36. 被引量：4
3Mark Sweiger, Mark R Mandsen, Jimmy Langston, Howard Lombard. 点击流数据仓库[M]．北京：电子工业出版社，2004．
4Pyle D.Data Preparation for Data Mining.Morgan Kaufmann Publishers Inc,San Francisco,CA,1999.540
5Cooley R,Mobasher B,Srivastava J.Data preparation for mining World Wide Web browsing patterns.Journal of Knowledge and Information Systems,1999,1(1):5～32
6Tan P,Kumar V.Discovery of Web robot sessions based on their navigational patterns.Data Mining and Knowledge Discovery,2002,6:9～35
7Jetal S.Web Usage Mining:Discovery and application of usage patterns from Web data[J].SIGKDD Explorations,2000,1(2):12～23
8Cooley R,Mobasher B,Srivastava J.Data Preparation for Mining World Wide Web Browsing Patterns[J].Journal of Knowledge and Information Systems,1999,1(1):5～32
9Chen MS,Park J S,Yu PS.Data Mining for Path Traversal Patterns[A].In:Proc.of the 16th Int'l Confon Distributed Computing System[C].Hong Kong,1996
10Perkowitz M,Etzioni O.Towards adaptive Web sites:Coneeptual framework and case study[J].Artificial Intelligence,2000,118:245～275

共引文献80

1郭伟刚.电子商务网站用户访问模式挖掘中的预处理技术[J].计算机应用,2005,25(3):691-694. 被引量：5
2郭伟刚.电子商务数据挖掘中的预处理技术[J].通信学报,2005,26(B01):275-278.
3李超锋.Web使用挖掘数据源分析[J].中南民族大学学报（自然科学版）,2005,24(4):82-85. 被引量：7
4余强,张海盛.个性化Web信息服务技术研究[J].计算机应用研究,2006,23(2):198-200. 被引量：13
5程宝雷.一个基于C/S模式的通用主界面的设计方案[J].计算机与现代化,2006(8):124-126. 被引量：1
6贾虹.基于Web使用挖掘的数字图书馆个性化服务[J].河南图书馆学刊,2006,26(4):58-62. 被引量：5
7黄永青,凌海峰,梁昌勇.网络教育资源浏览的导航模型及其挖掘算法[J].合肥工业大学学报（自然科学版）,2006,29(9):1077-1080. 被引量：1
8王玉姣.Web使用挖掘研究分析[J].国外电子测量技术,2007,26(1):39-42.
9易明,张扬.基于全信息的“点击流”信息资源开发利用研究[J].情报科学,2007,25(2):198-203. 被引量：3
10吴荣.基于Web的数据挖掘技术[J].福建电脑,2007,23(4):17-18.

同被引文献36

1王志明,沙莎.Web文本挖掘技术在新闻主题检测中的应用研究[J].长沙大学学报,2007,21(5):58-60. 被引量：2
2叶君.web网站信息采集系统的设计方案[J].硅谷,2008,1(22):81-81. 被引量：1
3余少云.基于XML的科研管理信息系统研究[J].江西农业学报,2011,23(2):182-183. 被引量：3
4唐翔弘,汪林林,文展.基于Web的数据采集[J].计算机科学,2004,31(8):74-76. 被引量：2
5何拥军,骆嘉伟,孙星明.应用链接分析的web搜索结果聚类[J].计算机工程与应用,2005,41(2):179-183. 被引量：4
6何拥军,龚发根.最大流算法发现Web社团的改进[J].计算机工程与应用,2007,43(13):170-173. 被引量：1
7许高建.基于Web的文本挖掘技术研究[J].计算机技术与发展,2007,17(6):187-190. 被引量：19
8查志琴.基于行模式的网页信息提取算法[J].常州工学院学报,2007,20(4):1-4. 被引量：3
9马同星.网络型海洋环境监测数据挖掘和信息动态发布系统研究[D].济南:山东大学,2004:6-8.
10陈上及.海洋数据处理分析方法及其应用[M].北京:海洋出版社,2009:23-36.

引证文献3

1何拥军,龚发根.基于用户辅助估计的相关网页搜索聚类[J].计算机技术与发展,2011,21(7):112-115. 被引量：1
2黎永壹,王远干.多监测点数据采集的Web文本挖掘算法及应用[J].实验室研究与探索,2013,32(6):87-90. 被引量：1
3王亮.学习分析技术建立学习预测模型[J].实验室研究与探索,2015,34(1):215-218. 被引量：8

二级引证文献10

1王亮.学习者与平台交互行为挖掘及学习预测模型构建[J].中国远程教育,2021(5):62-67. 被引量：8
2江林升,张春霞.含关键字的新浪微博获取与舆情分析[J].宝鸡文理学院学报（自然科学版）,2014,34(1):51-54. 被引量：4
3吴国芳,张万礼.一种基于用户浏览行为的数据采集方法[J].洛阳师范学院学报,2014,33(8):76-79.
4潘娟,田美,张敏.LAe-R在Moodle平台中的应用[J].软件导刊,2016,15(3):159-161.
5杨艺.大数据思维下教学过程数据分析及应用研究[J].中国远程教育,2016(11):22-27. 被引量：24
6陶佳.基于社交学习的教师网络学习共同体之构建——兼论面向智能时代的教师网络学习共同体[J].远程教育杂志,2018,36(2):87-95. 被引量：19
7王改花,傅钢善.网络学习行为与成绩的预测及学习干预模型的设计[J].中国远程教育,2019,0(2):39-48. 被引量：57
8丁鹏飞.学习分析技术在教学中的应用研究[J].实验室研究与探索,2019,38(4):215-219. 被引量：6
9柯斌,杨思林,曾睿,代飞,强振平.基于Inception V3的高校学生课堂行为识别研究[J].电脑知识与技术,2021,17(6):13-15. 被引量：4
10吴军其,任飞翔,吴飞燕.数据驱动课堂精准施教关键指标体系构建及应用[J].现代远距离教育,2023(2):39-52. 被引量：3

1陈玉梅,尹其畅,赵忠杰.嵌入式远程视频监控系统设计与实现[J].西安工程大学学报,2013,27(5):638-642. 被引量：5
2姬钰.浅析Java Applet技术在网络管理中的研究及应用[J].信息技术与信息化,2016(1):33-35.
3李幼平,杨建红.一种利用位图实现类WebGIS的方法[J].湖北大学学报（自然科学版）,2009,31(3):241-243.
4田晟,刘一凡,牛端.Java技术在概率统计网络教学上的应用[J].现代计算机,2006,12(3):97-99.
5梁玉清,张自军.基于ARM的无线视频网络系统研究与实现[J].赤峰学院学报（自然科学版）,2012,28(5):26-28. 被引量：1
6尹洪伟,冯玉光,冷江,李飞,孙美美.基于Applet的LXI仪器Web接口的研究与实现[J].国外电子测量技术,2011,30(5):67-69. 被引量：3
7向坚持,刘相滨,徐选华.基于用户行为的Web使用挖掘数据采集技术研究[J].计算机与现代化,2007(12):59-62. 被引量：8
8闫黎,白晓虎.基于Web的JGraphx自动绘制拓扑图的设计和实现[J].机械设计与制造工程,2013,42(8):18-22. 被引量：1
9张广,侯立刚,曹江涛.基于ARM9的网络视频监控系统设计与实现[J].电子设计工程,2013,21(12):161-163. 被引量：6
10李群先.基于字符编码特征将电子表格导入数据库的方法[J].福建电脑,2008,24(7):163-163.

计算机技术与发展

2010年第3期

浏览历史

内容加载中请稍等...

Web使用挖掘的数据采集技术探究被引量：3

参考文献9

二级参考文献35

共引文献80

同被引文献36

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

Web使用挖掘的数据采集技术探究 被引量：3

参考文献9

二级参考文献35

共引文献80

同被引文献36

引证文献3

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

Web使用挖掘的数据采集技术探究被引量：3