期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
Web日志挖掘中的数据预处理的研究 被引量:57
1
作者 陆丽娜 杨怡玲 +1 位作者 管旭东 魏恒义 《计算机工程》 EI CAS CSCD 北大核心 2000年第4期66-67,72,共3页
为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的... 为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的数据预处理模型,并通过一个实例具体介绍了各过程的主要任务。 展开更多
关键词 数据挖掘 web 日志挖掘 数据预处理 数据库
下载PDF
基于日志定制的Web使用数据挖掘预处理研究 被引量:5
2
作者 易敏昕 张有仁 汪胜 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2003年第4期395-399,共5页
Web使用数据挖掘是为网站经营管理和结构调整提供决策支持的主要手段,其中的数据预处理工作关系到挖掘的质量。本文首先针对各类数据分别定义其数据模型;然后根据服务器托管网站的实际工作环境,针对现有预处理工具仅仅局限于固定的日志... Web使用数据挖掘是为网站经营管理和结构调整提供决策支持的主要手段,其中的数据预处理工作关系到挖掘的质量。本文首先针对各类数据分别定义其数据模型;然后根据服务器托管网站的实际工作环境,针对现有预处理工具仅仅局限于固定的日志格式的不足,提出了定制日志的思想,并结合前面定义的数据模型,详细描述了一个预处理工具原型WUMPA。 展开更多
关键词 web使用数据挖掘 数据预处理 数据模型 日志格式
下载PDF
Web日志挖掘中的数据预处理研究 被引量:4
3
作者 卢健 刁雅静 《江苏科技大学学报(自然科学版)》 CAS 2012年第1期81-85,共5页
Web日志挖掘中,数据源(日志文件)的复杂性是挖掘所面临的主要问题之一.针对Web日志挖掘的数据预处理问题,全面梳理了数据预处理的全过程.针对日志文件数据量巨大的难题,使用Python语言程序高效的实现了数据清理.在用户识别、会话识别和... Web日志挖掘中,数据源(日志文件)的复杂性是挖掘所面临的主要问题之一.针对Web日志挖掘的数据预处理问题,全面梳理了数据预处理的全过程.针对日志文件数据量巨大的难题,使用Python语言程序高效的实现了数据清理.在用户识别、会话识别和路径完善中,在传统方法的基础上引入了启发性规则,通过实验数据验证了方法的有效性. 展开更多
关键词 web挖掘 web日志挖掘 数据预处理
下载PDF
模糊C均值聚类算法在Web使用挖掘上的应用研究 被引量:9
4
作者 吴瑛 王秋生 《计算机技术与发展》 2008年第6期32-35,共4页
Web日志中含有大量的用户浏览信息,从中将相似用户及相关页面进行聚类是建立自适应网站的必要前提。通过基本的预处理,实现了日志的数据净化、用户识别会话识别及数据规约,形成了用户访问页面的序列数据库,同时通过离散化技术计算出用... Web日志中含有大量的用户浏览信息,从中将相似用户及相关页面进行聚类是建立自适应网站的必要前提。通过基本的预处理,实现了日志的数据净化、用户识别会话识别及数据规约,形成了用户访问页面的序列数据库,同时通过离散化技术计算出用户访问页面频度。在这些数据准备工作的基础上,构造了用户-页面关联矩阵,作为改进的模糊C均值聚类算法的输入,实现了相似用户及相关页面的聚类。实验表明改进的FCM算法的有效性。 展开更多
关键词 模糊C均值聚类 web日志预处理 关联矩阵 用户聚类 页面聚类
下载PDF
Web日志挖掘的预处理过程及算法 被引量:5
5
作者 靳风荣 郑雪峰 《微型电脑应用》 2004年第6期44-45,55,共3页
随着WWW的广泛应用和Web技术的发展,数据挖掘进入一个崭新阶段。本文详细介绍了Web日志挖掘的预处理过程,通过实例分析了预处理方法,并给出了预处理过程中用户识别的算法实现。
关键词 web日志挖掘 预处理 算法 数据挖掘 数据格式 数据库
下载PDF
Web日志挖掘中数据预处理技术的研究 被引量:2
6
作者 张沫 陈基漓 阮百尧 《计算机与数字工程》 2007年第9期90-92,共3页
在Web数据挖掘研究领域中,Web日志挖掘是一个极其重要的应用方面,而数据预处理技术在Web日志挖掘中又起到非常重要的作用。介绍Web日志文件的记录格式和Web日志挖掘预处理的一般过程,针对实际应用中遇到的问题提出一种解决方法,最后给... 在Web数据挖掘研究领域中,Web日志挖掘是一个极其重要的应用方面,而数据预处理技术在Web日志挖掘中又起到非常重要的作用。介绍Web日志文件的记录格式和Web日志挖掘预处理的一般过程,针对实际应用中遇到的问题提出一种解决方法,最后给出算法代码。 展开更多
关键词 数据挖掘 web日志挖掘 数据预处理
下载PDF
基于WEB日志的数据挖掘研究 被引量:1
7
作者 张治斌 姜亚南 《电脑与信息技术》 2009年第6期68-71,共4页
随着Internet的不断发展,数据挖掘技术的研究和应用也越来越成为热点问题,如何把数据挖掘技术应用于Web,从Web服务器的日志中发掘有用的、重要的知识(包括模式、规则等),成为数据挖掘与知识发现的一个重要研究和应用领域,这就是基于Web... 随着Internet的不断发展,数据挖掘技术的研究和应用也越来越成为热点问题,如何把数据挖掘技术应用于Web,从Web服务器的日志中发掘有用的、重要的知识(包括模式、规则等),成为数据挖掘与知识发现的一个重要研究和应用领域,这就是基于Web日志的数据挖掘。 展开更多
关键词 数据挖掘 web日志 预处理
下载PDF
Web日志数据预处理 被引量:3
8
作者 侯枫 《河南工程学院学报(自然科学版)》 2008年第3期54-57,共4页
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础,在Web日志挖掘中起着重要的作用,数据预处理关系到Web日志挖掘的质量.对数据预处理的基本知识及Web日志数据预处理的四个阶段进行了综述和研究,并给出... Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础,在Web日志挖掘中起着重要的作用,数据预处理关系到Web日志挖掘的质量.对数据预处理的基本知识及Web日志数据预处理的四个阶段进行了综述和研究,并给出了一些算法的伪码以及经过预处理的事务在实际事务数据库中的存储形式. 展开更多
关键词 web数据挖掘 数据预处理 web日志挖掘
下载PDF
Web日志挖掘中重构网站结构技术 被引量:2
9
作者 王军 王涛 宋宝燕 《辽宁大学学报(自然科学版)》 CAS 2006年第3期276-279,共4页
提出了一种重构网站结构的方法,并将此方法应用于Web日志挖掘的数据预处理中.实验表明,本方法能够更好地还原用户访问情景,为Web日志挖掘提供有效数据.
关键词 web日志挖掘 数据挖掘 网站结构 数据预处理
下载PDF
应用模糊集理论的多因素兴趣度评价 被引量:4
10
作者 李珊 云彩霞 +2 位作者 白彦霞 张秋菊 李丽芬 《计算机工程与应用》 CSCD 北大核心 2009年第8期132-134,共3页
互联网的信息急剧增加,用户越来越难以找到自己所需要的信息。针对目前个性化服务系统中用户兴趣难以获取的问题,提出了一种模糊综合评判评价用户兴趣的方法,实验表明具有较好的评价效果。
关键词 模糊集理论 模糊综合评判 web 日志 用户行为 用户兴趣 数据挖掘
下载PDF
Wed使用挖掘数据预处理中的一种会话识别改进算法
11
作者 周青 姚力文 +1 位作者 黄龙军 肖燕 《科技广场》 2008年第7期85-87,共3页
本文论述了Web用户访问模式挖掘中的数据预处理,主要提出了数据预处理中如何识别会话的一种改进算法。该方法通过使用三个因素来构造会话:①根据先验知识,确定会话时间阈值识别会话;②根据页面访问时间统计分布,确定相邻网页访问时间间... 本文论述了Web用户访问模式挖掘中的数据预处理,主要提出了数据预处理中如何识别会话的一种改进算法。该方法通过使用三个因素来构造会话:①根据先验知识,确定会话时间阈值识别会话;②根据页面访问时间统计分布,确定相邻网页访问时间间隔阈值识别会话;③页面内容及站点结构确定页面重要程度识别会话。实验结果表明,相对于传统的单一方法进行会话识别的方法,该方法能够准确的识别会话,更为合理有效。 展开更多
关键词 访问模式挖掘 数据预处理 会话识别 阈值 网站结构
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部