期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
11
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Web日志挖掘中的数据预处理的研究
被引量:
57
1
作者
陆丽娜
杨怡玲
+1 位作者
管旭东
魏恒义
《计算机工程》
EI
CAS
CSCD
北大核心
2000年第4期66-67,72,共3页
为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的...
为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的数据预处理模型,并通过一个实例具体介绍了各过程的主要任务。
展开更多
关键词
数据挖掘
web
日志挖掘
数据预处理
数据库
下载PDF
职称材料
基于日志定制的Web使用数据挖掘预处理研究
被引量:
5
2
作者
易敏昕
张有仁
汪胜
《华东理工大学学报(自然科学版)》
CAS
CSCD
北大核心
2003年第4期395-399,共5页
Web使用数据挖掘是为网站经营管理和结构调整提供决策支持的主要手段,其中的数据预处理工作关系到挖掘的质量。本文首先针对各类数据分别定义其数据模型;然后根据服务器托管网站的实际工作环境,针对现有预处理工具仅仅局限于固定的日志...
Web使用数据挖掘是为网站经营管理和结构调整提供决策支持的主要手段,其中的数据预处理工作关系到挖掘的质量。本文首先针对各类数据分别定义其数据模型;然后根据服务器托管网站的实际工作环境,针对现有预处理工具仅仅局限于固定的日志格式的不足,提出了定制日志的思想,并结合前面定义的数据模型,详细描述了一个预处理工具原型WUMPA。
展开更多
关键词
web
使用数据挖掘
数据预处理
数据模型
日志格式
下载PDF
职称材料
Web日志挖掘中的数据预处理研究
被引量:
4
3
作者
卢健
刁雅静
《江苏科技大学学报(自然科学版)》
CAS
2012年第1期81-85,共5页
Web日志挖掘中,数据源(日志文件)的复杂性是挖掘所面临的主要问题之一.针对Web日志挖掘的数据预处理问题,全面梳理了数据预处理的全过程.针对日志文件数据量巨大的难题,使用Python语言程序高效的实现了数据清理.在用户识别、会话识别和...
Web日志挖掘中,数据源(日志文件)的复杂性是挖掘所面临的主要问题之一.针对Web日志挖掘的数据预处理问题,全面梳理了数据预处理的全过程.针对日志文件数据量巨大的难题,使用Python语言程序高效的实现了数据清理.在用户识别、会话识别和路径完善中,在传统方法的基础上引入了启发性规则,通过实验数据验证了方法的有效性.
展开更多
关键词
web
挖掘
web
日志挖掘
数据预处理
下载PDF
职称材料
模糊C均值聚类算法在Web使用挖掘上的应用研究
被引量:
9
4
作者
吴瑛
王秋生
《计算机技术与发展》
2008年第6期32-35,共4页
Web日志中含有大量的用户浏览信息,从中将相似用户及相关页面进行聚类是建立自适应网站的必要前提。通过基本的预处理,实现了日志的数据净化、用户识别会话识别及数据规约,形成了用户访问页面的序列数据库,同时通过离散化技术计算出用...
Web日志中含有大量的用户浏览信息,从中将相似用户及相关页面进行聚类是建立自适应网站的必要前提。通过基本的预处理,实现了日志的数据净化、用户识别会话识别及数据规约,形成了用户访问页面的序列数据库,同时通过离散化技术计算出用户访问页面频度。在这些数据准备工作的基础上,构造了用户-页面关联矩阵,作为改进的模糊C均值聚类算法的输入,实现了相似用户及相关页面的聚类。实验表明改进的FCM算法的有效性。
展开更多
关键词
模糊C均值聚类
web
日志预处理
关联矩阵
用户聚类
页面聚类
下载PDF
职称材料
Web日志挖掘的预处理过程及算法
被引量:
5
5
作者
靳风荣
郑雪峰
《微型电脑应用》
2004年第6期44-45,55,共3页
随着WWW的广泛应用和Web技术的发展,数据挖掘进入一个崭新阶段。本文详细介绍了Web日志挖掘的预处理过程,通过实例分析了预处理方法,并给出了预处理过程中用户识别的算法实现。
关键词
web
日志挖掘
预处理
算法
数据挖掘
数据格式
数据库
下载PDF
职称材料
Web日志挖掘中数据预处理技术的研究
被引量:
2
6
作者
张沫
陈基漓
阮百尧
《计算机与数字工程》
2007年第9期90-92,共3页
在Web数据挖掘研究领域中,Web日志挖掘是一个极其重要的应用方面,而数据预处理技术在Web日志挖掘中又起到非常重要的作用。介绍Web日志文件的记录格式和Web日志挖掘预处理的一般过程,针对实际应用中遇到的问题提出一种解决方法,最后给...
在Web数据挖掘研究领域中,Web日志挖掘是一个极其重要的应用方面,而数据预处理技术在Web日志挖掘中又起到非常重要的作用。介绍Web日志文件的记录格式和Web日志挖掘预处理的一般过程,针对实际应用中遇到的问题提出一种解决方法,最后给出算法代码。
展开更多
关键词
数据挖掘
web
日志挖掘
数据预处理
下载PDF
职称材料
基于WEB日志的数据挖掘研究
被引量:
1
7
作者
张治斌
姜亚南
《电脑与信息技术》
2009年第6期68-71,共4页
随着Internet的不断发展,数据挖掘技术的研究和应用也越来越成为热点问题,如何把数据挖掘技术应用于Web,从Web服务器的日志中发掘有用的、重要的知识(包括模式、规则等),成为数据挖掘与知识发现的一个重要研究和应用领域,这就是基于Web...
随着Internet的不断发展,数据挖掘技术的研究和应用也越来越成为热点问题,如何把数据挖掘技术应用于Web,从Web服务器的日志中发掘有用的、重要的知识(包括模式、规则等),成为数据挖掘与知识发现的一个重要研究和应用领域,这就是基于Web日志的数据挖掘。
展开更多
关键词
数据挖掘
web
日志
预处理
下载PDF
职称材料
Web日志数据预处理
被引量:
3
8
作者
侯枫
《河南工程学院学报(自然科学版)》
2008年第3期54-57,共4页
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础,在Web日志挖掘中起着重要的作用,数据预处理关系到Web日志挖掘的质量.对数据预处理的基本知识及Web日志数据预处理的四个阶段进行了综述和研究,并给出...
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础,在Web日志挖掘中起着重要的作用,数据预处理关系到Web日志挖掘的质量.对数据预处理的基本知识及Web日志数据预处理的四个阶段进行了综述和研究,并给出了一些算法的伪码以及经过预处理的事务在实际事务数据库中的存储形式.
展开更多
关键词
web
数据挖掘
数据预处理
web
日志挖掘
下载PDF
职称材料
Web日志挖掘中重构网站结构技术
被引量:
2
9
作者
王军
王涛
宋宝燕
《辽宁大学学报(自然科学版)》
CAS
2006年第3期276-279,共4页
提出了一种重构网站结构的方法,并将此方法应用于Web日志挖掘的数据预处理中.实验表明,本方法能够更好地还原用户访问情景,为Web日志挖掘提供有效数据.
关键词
web
日志挖掘
数据挖掘
网站结构
数据预处理
下载PDF
职称材料
应用模糊集理论的多因素兴趣度评价
被引量:
4
10
作者
李珊
云彩霞
+2 位作者
白彦霞
张秋菊
李丽芬
《计算机工程与应用》
CSCD
北大核心
2009年第8期132-134,共3页
互联网的信息急剧增加,用户越来越难以找到自己所需要的信息。针对目前个性化服务系统中用户兴趣难以获取的问题,提出了一种模糊综合评判评价用户兴趣的方法,实验表明具有较好的评价效果。
关键词
模糊集理论
模糊综合评判
web
日志
用户行为
用户兴趣
数据挖掘
下载PDF
职称材料
Wed使用挖掘数据预处理中的一种会话识别改进算法
11
作者
周青
姚力文
+1 位作者
黄龙军
肖燕
《科技广场》
2008年第7期85-87,共3页
本文论述了Web用户访问模式挖掘中的数据预处理,主要提出了数据预处理中如何识别会话的一种改进算法。该方法通过使用三个因素来构造会话:①根据先验知识,确定会话时间阈值识别会话;②根据页面访问时间统计分布,确定相邻网页访问时间间...
本文论述了Web用户访问模式挖掘中的数据预处理,主要提出了数据预处理中如何识别会话的一种改进算法。该方法通过使用三个因素来构造会话:①根据先验知识,确定会话时间阈值识别会话;②根据页面访问时间统计分布,确定相邻网页访问时间间隔阈值识别会话;③页面内容及站点结构确定页面重要程度识别会话。实验结果表明,相对于传统的单一方法进行会话识别的方法,该方法能够准确的识别会话,更为合理有效。
展开更多
关键词
访问模式挖掘
数据预处理
会话识别
阈值
网站结构
下载PDF
职称材料
题名
Web日志挖掘中的数据预处理的研究
被引量:
57
1
作者
陆丽娜
杨怡玲
管旭东
魏恒义
机构
西安交通大学计算机科学与技术系
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2000年第4期66-67,72,共3页
文摘
为了更加合理地组织Web服务器的结构,需要通过Web日志挖掘分析用户的浏览模式,而Web日志挖掘中的数据预处理工作关系到挖掘的质量。文章就此进行了深入的研究,提出一个包括数据净化、用户识别、会话识别和路径补充等过程的数据预处理模型,并通过一个实例具体介绍了各过程的主要任务。
关键词
数据挖掘
web
日志挖掘
数据预处理
数据库
Keywords
data
mining
web
log
mining
data
preparation
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于日志定制的Web使用数据挖掘预处理研究
被引量:
5
2
作者
易敏昕
张有仁
汪胜
机构
华东理工大学计算机科学与工程系
出处
《华东理工大学学报(自然科学版)》
CAS
CSCD
北大核心
2003年第4期395-399,共5页
文摘
Web使用数据挖掘是为网站经营管理和结构调整提供决策支持的主要手段,其中的数据预处理工作关系到挖掘的质量。本文首先针对各类数据分别定义其数据模型;然后根据服务器托管网站的实际工作环境,针对现有预处理工具仅仅局限于固定的日志格式的不足,提出了定制日志的思想,并结合前面定义的数据模型,详细描述了一个预处理工具原型WUMPA。
关键词
web
使用数据挖掘
数据预处理
数据模型
日志格式
Keywords
web
u
s
age mining
data
preparation
data
model
log
format
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Web日志挖掘中的数据预处理研究
被引量:
4
3
作者
卢健
刁雅静
机构
江苏科技大学经济管理学院
出处
《江苏科技大学学报(自然科学版)》
CAS
2012年第1期81-85,共5页
文摘
Web日志挖掘中,数据源(日志文件)的复杂性是挖掘所面临的主要问题之一.针对Web日志挖掘的数据预处理问题,全面梳理了数据预处理的全过程.针对日志文件数据量巨大的难题,使用Python语言程序高效的实现了数据清理.在用户识别、会话识别和路径完善中,在传统方法的基础上引入了启发性规则,通过实验数据验证了方法的有效性.
关键词
web
挖掘
web
日志挖掘
数据预处理
Keywords
web
mining
web
log
-file mining
data
preparation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
模糊C均值聚类算法在Web使用挖掘上的应用研究
被引量:
9
4
作者
吴瑛
王秋生
机构
北京航空航天大学自动化科学与电气工程学院
出处
《计算机技术与发展》
2008年第6期32-35,共4页
文摘
Web日志中含有大量的用户浏览信息,从中将相似用户及相关页面进行聚类是建立自适应网站的必要前提。通过基本的预处理,实现了日志的数据净化、用户识别会话识别及数据规约,形成了用户访问页面的序列数据库,同时通过离散化技术计算出用户访问页面频度。在这些数据准备工作的基础上,构造了用户-页面关联矩阵,作为改进的模糊C均值聚类算法的输入,实现了相似用户及相关页面的聚类。实验表明改进的FCM算法的有效性。
关键词
模糊C均值聚类
web
日志预处理
关联矩阵
用户聚类
页面聚类
Keywords
fuzzy c-mean
s
algorithm
web log's data preparation
a
s
s
ociated matrix
cu
s
tomer-clu
s
tering
page-clu
s
tering
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Web日志挖掘的预处理过程及算法
被引量:
5
5
作者
靳风荣
郑雪峰
机构
新疆工业高等专科学校计算机系
北京科技大学
出处
《微型电脑应用》
2004年第6期44-45,55,共3页
文摘
随着WWW的广泛应用和Web技术的发展,数据挖掘进入一个崭新阶段。本文详细介绍了Web日志挖掘的预处理过程,通过实例分析了预处理方法,并给出了预处理过程中用户识别的算法实现。
关键词
web
日志挖掘
预处理
算法
数据挖掘
数据格式
数据库
Keywords
web
log
mining
data
preparation
u
s
er identification algorithm
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Web日志挖掘中数据预处理技术的研究
被引量:
2
6
作者
张沫
陈基漓
阮百尧
机构
桂林工学院电子与计算机系
出处
《计算机与数字工程》
2007年第9期90-92,共3页
基金
国家自然科学基金(编号:40344022)资助
文摘
在Web数据挖掘研究领域中,Web日志挖掘是一个极其重要的应用方面,而数据预处理技术在Web日志挖掘中又起到非常重要的作用。介绍Web日志文件的记录格式和Web日志挖掘预处理的一般过程,针对实际应用中遇到的问题提出一种解决方法,最后给出算法代码。
关键词
数据挖掘
web
日志挖掘
数据预处理
Keywords
data
mining,
web
log
mining,
data
preparation
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于WEB日志的数据挖掘研究
被引量:
1
7
作者
张治斌
姜亚南
机构
河南理工大学计算机学院
出处
《电脑与信息技术》
2009年第6期68-71,共4页
基金
河南省教育厅自然科学研究项目(项目编号:200510460015)
文摘
随着Internet的不断发展,数据挖掘技术的研究和应用也越来越成为热点问题,如何把数据挖掘技术应用于Web,从Web服务器的日志中发掘有用的、重要的知识(包括模式、规则等),成为数据挖掘与知识发现的一个重要研究和应用领域,这就是基于Web日志的数据挖掘。
关键词
数据挖掘
web
日志
预处理
Keywords
data
mining
web
log
prepar
e a proce
s
s
ing
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Web日志数据预处理
被引量:
3
8
作者
侯枫
机构
三门峡职业技术学院信息工程系
出处
《河南工程学院学报(自然科学版)》
2008年第3期54-57,共4页
文摘
Web日志信息的预处理是Web日志挖掘任务中的重要阶段,是整个Web日志挖掘过程的基础,在Web日志挖掘中起着重要的作用,数据预处理关系到Web日志挖掘的质量.对数据预处理的基本知识及Web日志数据预处理的四个阶段进行了综述和研究,并给出了一些算法的伪码以及经过预处理的事务在实际事务数据库中的存储形式.
关键词
web
数据挖掘
数据预处理
web
日志挖掘
Keywords
web
data
mining
data
preparation
web
log
mining
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Web日志挖掘中重构网站结构技术
被引量:
2
9
作者
王军
王涛
宋宝燕
机构
辽宁大学信息科学与技术学院
出处
《辽宁大学学报(自然科学版)》
CAS
2006年第3期276-279,共4页
文摘
提出了一种重构网站结构的方法,并将此方法应用于Web日志挖掘的数据预处理中.实验表明,本方法能够更好地还原用户访问情景,为Web日志挖掘提供有效数据.
关键词
web
日志挖掘
数据挖掘
网站结构
数据预处理
Keywords
web
log
mining
data
mining
web
s
ite
s
tructure
data
preparation
.
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
应用模糊集理论的多因素兴趣度评价
被引量:
4
10
作者
李珊
云彩霞
白彦霞
张秋菊
李丽芬
机构
北京化工大学北方学院信息学院
出处
《计算机工程与应用》
CSCD
北大核心
2009年第8期132-134,共3页
文摘
互联网的信息急剧增加,用户越来越难以找到自己所需要的信息。针对目前个性化服务系统中用户兴趣难以获取的问题,提出了一种模糊综合评判评价用户兴趣的方法,实验表明具有较好的评价效果。
关键词
模糊集理论
模糊综合评判
web
日志
用户行为
用户兴趣
数据挖掘
Keywords
fuzzy
s
et
s
theory
fuzzy comprehen
s
ive evaluation
web
log
s
u
s
er'
s
action
s
u
s
er'
s
intere
s
t
data
mining
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
Wed使用挖掘数据预处理中的一种会话识别改进算法
11
作者
周青
姚力文
黄龙军
肖燕
机构
南昌大学信息工程学院计算机系
江西师范大学软件学院
江西省经济管理干部学院
出处
《科技广场》
2008年第7期85-87,共3页
文摘
本文论述了Web用户访问模式挖掘中的数据预处理,主要提出了数据预处理中如何识别会话的一种改进算法。该方法通过使用三个因素来构造会话:①根据先验知识,确定会话时间阈值识别会话;②根据页面访问时间统计分布,确定相邻网页访问时间间隔阈值识别会话;③页面内容及站点结构确定页面重要程度识别会话。实验结果表明,相对于传统的单一方法进行会话识别的方法,该方法能够准确的识别会话,更为合理有效。
关键词
访问模式挖掘
数据预处理
会话识别
阈值
网站结构
Keywords
web
log
data
Mining
data
preparation
s
e
s
s
ion Identification
Thre
s
hold
web
s
ite
s
tructure
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Web日志挖掘中的数据预处理的研究
陆丽娜
杨怡玲
管旭东
魏恒义
《计算机工程》
EI
CAS
CSCD
北大核心
2000
57
下载PDF
职称材料
2
基于日志定制的Web使用数据挖掘预处理研究
易敏昕
张有仁
汪胜
《华东理工大学学报(自然科学版)》
CAS
CSCD
北大核心
2003
5
下载PDF
职称材料
3
Web日志挖掘中的数据预处理研究
卢健
刁雅静
《江苏科技大学学报(自然科学版)》
CAS
2012
4
下载PDF
职称材料
4
模糊C均值聚类算法在Web使用挖掘上的应用研究
吴瑛
王秋生
《计算机技术与发展》
2008
9
下载PDF
职称材料
5
Web日志挖掘的预处理过程及算法
靳风荣
郑雪峰
《微型电脑应用》
2004
5
下载PDF
职称材料
6
Web日志挖掘中数据预处理技术的研究
张沫
陈基漓
阮百尧
《计算机与数字工程》
2007
2
下载PDF
职称材料
7
基于WEB日志的数据挖掘研究
张治斌
姜亚南
《电脑与信息技术》
2009
1
下载PDF
职称材料
8
Web日志数据预处理
侯枫
《河南工程学院学报(自然科学版)》
2008
3
下载PDF
职称材料
9
Web日志挖掘中重构网站结构技术
王军
王涛
宋宝燕
《辽宁大学学报(自然科学版)》
CAS
2006
2
下载PDF
职称材料
10
应用模糊集理论的多因素兴趣度评价
李珊
云彩霞
白彦霞
张秋菊
李丽芬
《计算机工程与应用》
CSCD
北大核心
2009
4
下载PDF
职称材料
11
Wed使用挖掘数据预处理中的一种会话识别改进算法
周青
姚力文
黄龙军
肖燕
《科技广场》
2008
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部