期刊文献+
共找到325篇文章
< 1 2 17 >
每页显示 20 50 100
Web日志挖掘中的数据预处理技术研究 被引量:62
1
作者 赵伟 何丕廉 +1 位作者 陈霞 谢振亮 《计算机应用》 CSCD 北大核心 2003年第5期62-64,67,共4页
在Web数据挖掘研究领域中,Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文中深入探讨了数据预处理环节的主要任务,并介绍这个过程中一些特殊情况的处理方法。
关键词 数据挖掘 web日志挖掘 数据预处理
下载PDF
一个简单的Web日志挖掘系统 被引量:22
2
作者 杨怡玲 管旭东 +1 位作者 陆丽娜 尤晋元 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第7期932-935,共4页
在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序... 在分析 Web日志挖掘的困难及对策的基础上 ,给出了一个简单的 Web日志挖掘系统( SWLMS)的体系结构 .具体介绍了 SWLMS中日志的预处理过程 ,包括数据净化、用户识别、会话识别、路径补充的主要任务及其实现 ,并着重介绍了预处理之后的序列模式识别过程和算法 ,包括最大向前路径的识别和频繁遍历路径的发现 。 展开更多
关键词 数据挖掘 web日志挖掘 序列模式识别 SWLMS
下载PDF
Web日志挖掘技术进展 被引量:17
3
作者 陈新中 李岩 +2 位作者 杨炳儒 谢永红 张运涛 《系统工程与电子技术》 EI CSCD 北大核心 2003年第4期492-495,共4页
用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方... 用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方面都将起到重要的作用。概述了Web挖掘的概念、分类及其主要应用领域,详细介绍了Web日志挖掘的主要方法和用户访问模式挖掘算法及国内外最新研究进展。最后提出了Web用户访问信息挖掘研究的发展方向和趋势。 展开更多
关键词 AI 万维网 web挖掘 web日志挖掘
下载PDF
结合网站内容和结构进行的Web日志挖掘 被引量:9
4
作者 江宝林 申展 +2 位作者 张川 葛家翔 胡运发 《计算机工程》 CAS CSCD 北大核心 2004年第16期30-32,共3页
提出一种以聚类为基础的Web日志挖掘方法:从Web日志事务、Web站点内容和Web站点结构3个不同方面来聚类页面集合,并通过将用户的访问记录和页面聚集进行匹配和相关度计算,来预测用户感兴趣的页面。
关键词 web日志挖掘 web日志事务 访问模式 聚类
下载PDF
Web日志挖掘中数据预处理的研究 被引量:20
5
作者 赵红玲 宋瀚涛 +1 位作者 牛振东 刘桂山 《计算机应用研究》 CSCD 北大核心 2005年第6期67-69,共3页
针对框架式页面存在的问题,对数据预处理过程进行了改进,在数据清洗和用户识别部分添加了页面过滤部分,同时对预处理过程中的页面过滤算法和用户识别策略也进行了改进。
关键词 数据挖掘 web日志挖掘 数据预处理
下载PDF
Web日志挖掘中的数据预处理技术 被引量:22
6
作者 李燕 冯博琴 鲁晓锋 《计算机工程》 CAS CSCD 北大核心 2009年第22期44-46,49,共4页
数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中... 数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中的记录引用信息较完整的情况下,该方法可以高效地获得用户的访问路径。 展开更多
关键词 web日志挖掘 数据预处理 用户会话识别 路径补充
下载PDF
Web日志挖掘技术的研究与应用 被引量:20
7
作者 肖立英 李建华 谭立球 《计算机工程》 CAS CSCD 北大核心 2002年第7期276-277,284,共3页
介绍了目前世界上两种主要的日志挖掘技术基于事务和基于数据立方体。同时,提出了一个基于日志挖掘技术的应Web (Web)Web用,即用户自适应的站点,介绍了这一系统的实现方法和主要特色。
关键词 web日志挖掘 数据挖掘 数据库 数据立方体
下载PDF
基于Hadoop的Web日志挖掘 被引量:64
8
作者 程苗 陈华平 《计算机工程》 CAS CSCD 北大核心 2011年第11期37-39,共3页
基于单一节点的数据挖掘系统在挖掘Web海量数据源时存在计算瓶颈,针对该问题,利用云计算的分布式处理和虚拟化技术的优势,设计一种基于云计算的Hadoop集群框架的Web日志分析平台,提出一种能够在云计算环境中进行分布式处理的混合算法。... 基于单一节点的数据挖掘系统在挖掘Web海量数据源时存在计算瓶颈,针对该问题,利用云计算的分布式处理和虚拟化技术的优势,设计一种基于云计算的Hadoop集群框架的Web日志分析平台,提出一种能够在云计算环境中进行分布式处理的混合算法。为进一步验证该平台的高效性,在该平台上利用改进后的算法挖掘Web日志中用户的偏爱访问路径。实验结果表明,在集群中运用分布式算法处理大量的Web日志文件,可以明显提高Web数据挖掘的效率。 展开更多
关键词 云计算 Hadoop架构 Map/Reduce编程模式 web日志挖掘 遗传算法 偏爱访问路径
下载PDF
Web日志挖掘中的用户序列模式识别 被引量:6
9
作者 李明星 衡萍 +1 位作者 董沛武 陈健 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2005年第11期1570-1572,1602,共4页
为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的... 为研究W eb日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变,大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度技术就能达到阈值,从而发现更多有意义的序列模式,同时运用理论证明该方法的正确性. 展开更多
关键词 web日志挖掘 阈值 序列模式识别 IA^x算法
下载PDF
一种适用于Web日志挖掘的关联规则发现算法 被引量:7
10
作者 栾汝朋 张倩 +2 位作者 张峻峰 于峰 刘新 《计算机应用与软件》 CSCD 北大核心 2013年第1期114-116,225,共4页
Apriori算法是一种经典的关联规则发现算法。针对Web日志挖掘的特点,在Apriori算法基础上给出一种适用于动态事务数据库挖掘的关联规则发现算法,并对比该算法与Apriori算法的区别。将该算法应用到网站的日志挖掘中,实验证明该算法的性... Apriori算法是一种经典的关联规则发现算法。针对Web日志挖掘的特点,在Apriori算法基础上给出一种适用于动态事务数据库挖掘的关联规则发现算法,并对比该算法与Apriori算法的区别。将该算法应用到网站的日志挖掘中,实验证明该算法的性能较原算法有一定的提高。 展开更多
关键词 web日志挖掘 关联分析 APRIORI算法
下载PDF
基于Web日志挖掘的网页推荐方法 被引量:4
11
作者 解男男 胡亮 +2 位作者 努尔布力 樊丽 印晓天 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2013年第2期267-272,共6页
针对传统单纯聚类算法实现网页推荐精确度欠缺的问题,提出一种基于Web日志挖掘的个性化网页推荐模型,并实现了相应的网页推荐算法,算法结合聚类分析和关联规则挖掘,能有效实现网页推荐.实验结果表明,在保障网页页面推荐覆盖率的条件下,... 针对传统单纯聚类算法实现网页推荐精确度欠缺的问题,提出一种基于Web日志挖掘的个性化网页推荐模型,并实现了相应的网页推荐算法,算法结合聚类分析和关联规则挖掘,能有效实现网页推荐.实验结果表明,在保障网页页面推荐覆盖率的条件下,该方法有较高的精确度、有效性和实用性. 展开更多
关键词 网页推荐 模糊聚类 关联规则挖掘 web日志挖掘
下载PDF
Web日志挖掘中数据预处理技术的研究 被引量:19
12
作者 马瑞民 李向云 《计算机工程与设计》 CSCD 北大核心 2007年第10期2358-2360,共3页
在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访... 在Web日志挖掘中数据预处理是整个挖掘过程的基础,由于客户端缓存的存在,在已往的预处理过程中都是通过路径补充技术得到用户完整的访问路径之后,才能进行事务识别。提出了一种只需根据网站的拓扑结构,不需要使用路径补充技术,由用户访问序列直接生成事务的算法。 展开更多
关键词 web日志挖掘 数据预处理 路径补充 访问序列 访问事务
下载PDF
基于Hadoop的并行PSO-kmeans算法实现Web日志挖掘 被引量:13
13
作者 马汉达 郝晓宇 马仁庆 《计算机科学》 CSCD 北大核心 2015年第S1期470-473,共4页
互联网技术的迅速发展,使得基于单一结点的Web日志挖掘变得十分困难,而Hadoop云平台的出现,为这类问题提供了新的解决方案。但传统的Web日志挖掘聚类k-means算法对初始聚类中心的选择敏感等缺点,容易影响聚类准确率。针对这个问题,提出... 互联网技术的迅速发展,使得基于单一结点的Web日志挖掘变得十分困难,而Hadoop云平台的出现,为这类问题提供了新的解决方案。但传统的Web日志挖掘聚类k-means算法对初始聚类中心的选择敏感等缺点,容易影响聚类准确率。针对这个问题,提出基于粒子群算法(PSO)的k-means算法,使得k-means算法不受初始聚类中心的影响,并且在Hadoop平台上实现了算法的MapReduce编程。实验结果证明:提出的改进算法,与传统的k-means算法相比,具有更高的聚类准确率;与串行单机算法相比,运行效率也有很大的提升。 展开更多
关键词 HADOOP K-MEANS PSO MAPREDUCE web日志挖掘
下载PDF
基于模糊聚类的Web日志挖掘 被引量:13
14
作者 李桂英 李吉桂 《计算机科学》 CSCD 北大核心 2004年第12期130-131,153,共3页
本文使用模糊聚类的方法对Web日志进行数据挖掘,实现用户聚类和页面聚类,并设计与实现了一个基于模糊聚类的Web日志挖掘系统。
关键词 web日志挖掘 行数据 页面 模糊聚类 用户 系统 设计
下载PDF
基于Apriori改进算法的Web日志挖掘支撑工具的实现 被引量:5
15
作者 陈炼 孙金华 +2 位作者 饶泓 廖远 林渝 《南昌大学学报(工科版)》 CAS 2007年第2期190-193,201,共5页
Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,以发现相似客户群体、相关Web页面和频繁访问路径等,其目的在于从用户访问Web系统的行为中发现用户的访问模式.在对Web日志挖掘的原理和技术进行讨论的基础上,重点探讨了... Web日志挖掘就是运用数据挖掘的思想来对服务器日志进行分析处理,以发现相似客户群体、相关Web页面和频繁访问路径等,其目的在于从用户访问Web系统的行为中发现用户的访问模式.在对Web日志挖掘的原理和技术进行讨论的基础上,重点探讨了如何将Apriori改进算法应用于对Web日志的挖掘,提出了一种基于该算法的Web日志挖掘实现方法,实验结果表明了算法的有效性. 展开更多
关键词 web日志挖掘 关联规则 APRIORI算法
下载PDF
基于MapReduce的Web日志挖掘 被引量:15
16
作者 李彬 刘莉莉 《计算机工程与应用》 CSCD 2012年第22期95-98,共4页
针对单一CPU节点的Web数据挖掘系统在挖掘Web海量数据源时存在的计算瓶颈问题,利用云计算的分布式处理和虚拟化技术优势以及蚁群算法并行性的优点,设计一种基于Map/Reduce架构的Web日志挖掘算法。为进一步验证该算法的高效性,通过搭建Ha... 针对单一CPU节点的Web数据挖掘系统在挖掘Web海量数据源时存在的计算瓶颈问题,利用云计算的分布式处理和虚拟化技术优势以及蚁群算法并行性的优点,设计一种基于Map/Reduce架构的Web日志挖掘算法。为进一步验证该算法的高效性,通过搭建Hadoop平台,利用该算法挖掘Web日志中用户的偏爱访问路径。实验结果表明,充分利用了集群系统的分布式计算能力处理大量的Web日志文件,可以大大地提高Web数据挖掘的效率。 展开更多
关键词 云计算 MAP/REDUCE HADOOP平台 web日志挖掘 蚁群算法
下载PDF
Web日志挖掘数据预处理研究 被引量:6
17
作者 何波 涂飞 程勇军 《微电子学与计算机》 CSCD 北大核心 2011年第4期111-114,共4页
数据预处理在Web日志挖掘过程中起着至关重要的作用.论文分析了Web日志挖掘数据预处理的主要步骤,设计了用户识别、访问操作识别和路径完善三个步骤的关键算法.实验结果表明,设计的关键算法是有效的.
关键词 数据预处理 web日志挖掘 路径完善 用户识别
下载PDF
基于Web日志挖掘和相关性度量的电子商务推荐系统 被引量:6
18
作者 马勇 鲜敏 +1 位作者 郑翔 黎远松 《计算机系统应用》 2016年第8期91-95,共5页
基于Web日志挖掘的个性化推荐技术已在电子商务网站中广泛应用,针对现有推荐系统的准确性不高等问题,提出一种基于Web日志挖掘和相关性度量的个性化推荐系统.首先,提取用户的访问日志,并对其进行预处理,以获得精简的结构化数据.然后,对... 基于Web日志挖掘的个性化推荐技术已在电子商务网站中广泛应用,针对现有推荐系统的准确性不高等问题,提出一种基于Web日志挖掘和相关性度量的个性化推荐系统.首先,提取用户的访问日志,并对其进行预处理,以获得精简的结构化数据.然后,对日志进行分析,提取出特征序列.再后,根据特征的出现频率和页面停留时间,计算出页面与交易文本文档的相关性.最终,利用夹角余弦公式计算出用户与页面的相关性,并以此形成推荐列表.实验结果表明,该方案能够根据用户偏好精确的给出个性化推荐. 展开更多
关键词 web日志挖掘 推荐系统 相关性度量 电子商务
下载PDF
基于用户访问树的Web日志挖掘数据预处理 被引量:8
19
作者 刘加伶 范军 《计算机科学》 CSCD 北大核心 2009年第9期154-156,210,共4页
在Web日志挖掘中数据预处理是整个挖掘过程的基础,直接影响日志挖掘的质量和结果。提出了一种基于用户访问树的Web日志挖掘数据预处理方法,该方法在处理过程中根据Web日志建立用户访问树,并利用用户访问树进行用户和事务识别,从而可以... 在Web日志挖掘中数据预处理是整个挖掘过程的基础,直接影响日志挖掘的质量和结果。提出了一种基于用户访问树的Web日志挖掘数据预处理方法,该方法在处理过程中根据Web日志建立用户访问树,并利用用户访问树进行用户和事务识别,从而可以在缺乏网站拓扑结构的情况下准确地对Web日志进行预处理。 展开更多
关键词 web日志挖掘 数据预处理 用户识别 事务识别
下载PDF
Web日志挖掘的预处理及路径补全算法的研究 被引量:11
20
作者 王岚 翟正军 《微电子学与计算机》 CSCD 北大核心 2006年第8期113-116,共4页
Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文章详细介绍了Web日志挖掘的预处理过程。通过实例分析了预处理方法,着重分析其中的路径补全方法,并给出了路径补全的... Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文章详细介绍了Web日志挖掘的预处理过程。通过实例分析了预处理方法,着重分析其中的路径补全方法,并给出了路径补全的算法实现。 展开更多
关键词 web日志挖掘 数据预处理 路径补全 算法
下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部