Web日志挖掘中的数据预处理的研究被引量：57

Data Preparation in Web Log Mining

下载PDF

导出

摘要为了更加合理地组织Ｗｅｂ服务器的结构，需要通过Ｗｅｂ日志挖掘分析用户的浏览模式，而Ｗｅｂ日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究，提出一个包括数据净化、用户识别、会话识别和路径补充等过程的数据预处理模型，并通过一个实例具体介绍了各过程的主要任务。 In order to organize the web server architecture more logically. Web log mining is needed to analyze user's.browsing patterns. This paper studies the data preprocessing phase of Web log mining, which is the key to get good mining result, and presents a data preprocessing model including middle steps line data cleaning, user recognition, session recognition, and path supplementation. Also, each step is demonstrated through an example.

作者陆丽娜杨怡玲管旭东魏恒义

机构地区西安交通大学计算机科学与技术系

出处《计算机工程》 EI CAS CSCD 北大核心 2000年第4期66-67,72,共3页 Computer Engineering

关键词数据挖掘 WEB 日志挖掘数据预处理数据库 Data mining Web log mining Data preparation

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论] TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1黄丹华,纪泽泉,吴少巧,余天浩.新形势下加强医学生人文素质教育的对策与建议[J].西北医学教育,2009,17(2):266-267. 被引量：10
2多文兰,张燕.高职院校医学人文素质教育的现状及原因分析与对策[J].中国医学伦理学,2011,24(2):178-180. 被引量：10
3徐华平,赖平.浅论新形势下的医学生人文素质教育[J].中国高等医学教育,2004(2):24-26. 被引量：54

二级参考文献17

1杨德广.加强人文教育提高人文素质[J].教育研究,1999,20(2):31-38. 被引量：182
2王文华.耶鲁大学通识教育[J].世界教育信息,2007,20(1):76-77. 被引量：16
3聂素滨金祥雷.发达国家医学人文学科教学探析[J].中国高等医学教育,1998,4:18-18.
4Clark. Kerr. The Great Transfortnation in Higher Education [ M ]. New York : State University of NewYork Press, 1991:63 - 298.
5王星明,王艳华.西方国家医学生职业道德教育的特点及启示[J].中国医学伦理学,2008,21(2):30-31. 被引量：35
6蒙丽珍,莫光政.论高校学科与专业及其建设的基本理论[J].广西财经学院学报,2008,21(3):106-112. 被引量：12
7朱白薇.论加强高等医药院校人才培养中的人文关怀[J].广东药学院学报,2008,24(4):397-399. 被引量：2
8刘冬梅,晏东铭.人文精神与和谐的医患关系[J].中国医学伦理学,2008,21(4):143-144. 被引量：2
9张俊,戴冰,邱高会.医科大学生人文素质现状的调查与思考[J].中国医学伦理学,2009,22(1):64-66. 被引量：23
10蔡骏翔,罗萍.艺术美育中的怡情效能与教师应用策略研究[J].医学教育探索,2009,8(4):365-366. 被引量：3

共引文献69

1纪欢欢.护理硕士研究生人文素质培养[J].大众标准化,2020,2(14):120-121.
2王小燕,张旺清.加强我院医学生人文素质教育的探索与实践[J].广东医学院学报,2004,22(z1):61-62. 被引量：3
3杨菲.浅谈医学生的人文素质教育[J].中国校外教育,2008(7). 被引量：2
4刘希欣,曲晓兰.新形势下医学生人文精神缺失情况分析及教育对策[J].高校医学教学研究（电子版）,2012,2(2):55-57. 被引量：2
5赵善超,孙大成,陈庆,杜跃军.适应扩招新趋势改革手术学教学[J].南方医学教育,2006(1):18-20. 被引量：1
6许海东.医学教育标准与医学人文精神的培养[J].南方医学教育,2013(3):3-6. 被引量：1
7侯劲松,唐海阔,刘海潮,陶谦,廖贵清.全程式典型病例研讨在口腔颌面外科临床教学中的应用[J].西北医学教育,2005,13(5):560-561. 被引量：1
8刘利平,方定志.对当前医学生人文素质教育的几点思考[J].西北医学教育,2005,13(6):616-617. 被引量：9
9王慧萍,刘乃丰,谢波.强化医学实习教学培养高素质创新人才[J].现代医学,2006,34(2):125-127. 被引量：7
10王慧萍,庄冬云,谢波,张磊.推进教育创新培养高素质医学人才[J].医学教育探索,2006,5(3):285-286. 被引量：2

同被引文献321

1唐北平,肖建华.通用Web日志挖掘系统设计实现[J].电脑知识与技术（过刊）,2007(2):310-311. 被引量：2
2吕佳.Web日志挖掘技术应用研究[J].重庆师范大学学报（自然科学版）,2006,23(4):39-44. 被引量：15
3张福安.电子商务与ERP的整合应用研究[J].合肥工业大学学报（自然科学版）,2003,26(z1):835-837. 被引量：5
4王才有.中国社区卫生信息化发展策略分析[J].中国数字医学,2007,2(10):9-13. 被引量：12
5丁涛.电子商务下增值税机制探析[J].财会通讯（中）,2011(11):32-34. 被引量：4
6孙晓燕.我国在国际贸易中应用电子商务存在的问题及对策[J].哈尔滨职业技术学院学报,2008(6):21-22. 被引量：18
7江洁星.论电子商务对税收的影响[J].当代经济,2012,29(20):82-83. 被引量：1
8刘春梅.通用Web日志挖掘系统(CWLMS)设计实现[J].防灾技术高等专科学校学报,2004,6(2):48-52. 被引量：1
9胡建武,何贞铭,张贻权.WEB日志挖掘及其实现[J].计算机工程与应用,2004,40(14):156-158. 被引量：13
10涂承胜,陆玉昌.Web使用挖掘技术研究[J].小型微型计算机系统,2004,25(7):1177-1184. 被引量：37

引证文献57

1唐北平,肖建华.通用Web日志挖掘系统设计实现[J].电脑知识与技术（过刊）,2007(2):310-311. 被引量：2
2徐勇,张利宏,张慧.基于web的肺结核病人规范管理转诊系统的设计与实现[J].科技信息,2008(24):424-425. 被引量：4
3许亮,李明,梁素田,侯耕.数据挖掘技术在电子商务中的应用[J].甘肃科学学报,2002,14(S1):17-20. 被引量：1
4谢维奇.基于"电大在线"远程教学平台的web数据挖掘[J].教育信息化,2004(10):62-62. 被引量：6
5赵红玲,宋瀚涛,牛振东,刘桂山.Web日志挖掘中数据预处理的研究[J].计算机应用研究,2005,22(6):67-69. 被引量：20
6孙华文,王大玲,于戈,鲍玉斌,王琢.Web挖掘及个性化推荐中网站拓扑结构的获取、分析及应用[J].小型微型计算机系统,2005,26(7):1225-1228. 被引量：3
7戴军湘,李陶,李燕辉.Web日志挖掘技术及其在电子商务中的应用[J].科学技术与工程,2005,5(15):1081-1086. 被引量：6
8谭小球,徐妙君,张建科.基于改进FP-Tree的Web频繁序列模式挖掘技术[J].浙江海洋学院学报（自然科学版）,2005,24(3):284-288. 被引量：1
9谭小球,徐妙君,张建科.基于简化站点结构的Web路径完善技术[J].计算机与现代化,2006(2):56-58.
10陈阳,崔英敏.基于WEB日志的数据挖掘在校园网应用中的探索[J].广东轻工职业技术学院学报,2005,4(1):20-22. 被引量：2

二级引证文献183

1徐勇,张利宏,张慧.基于web的肺结核病人规范管理转诊系统的设计与实现[J].科技信息,2008(24):424-425. 被引量：4
2黄云,唐世民,罗宇.基于关联规则的站内搜索引擎设计[J].软件导刊,2010,9(1):90-92.
3李招远,丁振国.一个基于投影的Web访问序列挖掘算法[J].情报杂志,2004,23(8):59-60. 被引量：3
4崔春莎.浅谈以用户为导向的信息需求分析[J].现代情报,2004,24(9):175-176. 被引量：12
5葛蓉.利用网络日志分析提高搜索引擎的检准率[J].情报科学,2004,22(10):1250-1253. 被引量：5
6张国鹏.基于事务的Web日志挖掘在远程教育中的应用[J].现代计算机,2004,10(8):27-30.
7向坚持,陈晓红,刘相滨,徐选华.基于Web Log的数据预处理研究[J].湖南师范大学自然科学学报,2004,27(4):33-36. 被引量：4
8马宏伟.数据挖掘在网络信息中的应用[J].情报探索,2005(2):83-85. 被引量：5
9战立强,刘大昕.基于网页模糊分类的用户兴趣度分析方法[J].计算机工程与应用,2005,41(15):188-190. 被引量：2
10贾文举,张颖,孟祥岗.一个基于数据仓库Web日志的数据挖掘实例[J].佳木斯大学学报（自然科学版）,2005,23(4):522-524.

1沈晨鸣.基于数据仓库的数据预处理模型的算法研究[J].淮阴工学院学报,2005,14(5):44-46. 被引量：3
2罗艳霞.基于数据仓库的无线网络优化数据预处理[J].电脑编程技巧与维护,2010(24):70-71.
3蒋石浩,林亚平.移动用户行为分析的数据预处理算法应用研究[J].计算机与数字工程,2010,38(1):28-31. 被引量：2
4周海洋,余剑.无线传感器网络中基于RSSI的测距研究[J].电子测量技术,2014,37(1):89-91. 被引量：14
5徐睿,何志平,陈凯,张虎,傅忠谦,王建宇.AOTF短波红外光谱仪的空间温度特性及其数据预处理模型[J].红外与毫米波学报,2014,33(3):327-332. 被引量：3
6赵莹莹,韩元杰.Web日志数据挖掘中数据预处理模型的研究与建立[J].现代电子技术,2007,30(4):103-105. 被引量：9
7黄志强,贾宇波.Web访问挖掘中数据预处理的改进[J].广西师范大学学报（自然科学版）,2007,25(2):69-73. 被引量：3
8赵博,徐卫亚,赵亚琼,梁桂兰.数据预处理模型及其应用[J].水电能源科学,2012,30(5):80-82. 被引量：7
9刘伙玉,王东波.面向论文相似性检测的数据预处理研究[J].现代图书情报技术,2015(5):50-56. 被引量：5
10陈俊,查亚兵,焦鹏,许国珍.制导仿真数据仓库研究[J].计算机仿真,2011,28(7):100-104. 被引量：2

计算机工程

2000年第4期

浏览历史

内容加载中请稍等...

Web日志挖掘中的数据预处理的研究被引量：57

参考文献3

二级参考文献17

共引文献69

同被引文献321

引证文献57

二级引证文献183

相关作者

相关机构

相关主题

浏览历史

Web日志挖掘中的数据预处理的研究 被引量：57

参考文献3

二级参考文献17

共引文献69

同被引文献321

引证文献57

二级引证文献183

相关作者

相关机构

相关主题

浏览历史

Web日志挖掘中的数据预处理的研究被引量：57