-
题名Web使用挖掘的数据预处理
被引量:22
- 1
-
-
作者
刘立军
周军
梅红岩
-
机构
辽宁工学院计算机科学与工程学院
-
出处
《计算机科学》
CSCD
北大核心
2007年第5期200-201,204,共3页
-
基金
辽宁省优秀青年骨干教师基金资助项目
辽宁省教育厅基金资助项目(20031066)
-
文摘
Web使用挖掘的基本思想是将数据挖掘技术应用于Web使用数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web使用挖掘的数据源最主要的是Web日志,介绍了Web日志的具体内容,针对Web日志的特点,介绍预处理过程中一些特殊情况的处理方法,并在事务的识别阶段给出了一种新的最大向前引用序列挖掘算法——剪枝算法。
-
关键词
WEB使用挖掘
数据预处理
剪枝算法
最大向前引用
事务识别
-
Keywords
Web usage mining, Preprocessing, Pruning algorithm, Maximal forward references, Transaction recognition
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于Web使用挖掘的智能电子商务及其应用
被引量:4
- 2
-
-
作者
于小兵
郭顺生
黄小荣
-
机构
武汉理工大学机电学院
-
出处
《计算机集成制造系统》
EI
CSCD
北大核心
2010年第2期439-447,共9页
-
基金
国家科技部国际合作资助项目(2006DFA73180)
湖北省国际合作资助项目(2007CA008)~~
-
文摘
海量、异构的Web日志同时蕴含有巨大潜在价值的信息,为有效发现这些资源,并用于为用户提供更高效的服务,建立了智能电子商务模型,指出通过Web使用挖掘,发掘规律、模式和知识来支撑电子商务的智能。提出了细化最大向前引用模型算法,用于处理Web日志,获取用户事务序列,并与最大向前引用模型算法进行了比较,说明细化后的算法更能反映用户浏览习惯。将这些用户事务序列转换为二进制向量,并结合改进蚁群聚类算法,对它们进行了聚类操作,实现了用户簇聚。最后,建立了在线自动聚类的智能电子商务系统原型,并应用到了实际运营的Web系统中,验证了原型的合理性。
-
关键词
智能电子商务
WEB使用挖掘
最大向前引用模型
蚁群聚类算法
-
Keywords
intelligent e-commerce
Web usage mining
maximal forward reference model
ant colony clustering algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种新的基于交叉性Web日志的事务识别算法
被引量:3
- 3
-
-
作者
高卫华
谢康林
-
机构
上海交通大学计算机科学与工程系
-
出处
《计算机仿真》
CSCD
2005年第7期51-53,74,共4页
-
文摘
该文提出一种新的Web使用记录挖掘过程中的事务识别算法。该算法提出的背景是在采用基于最大向前引用和频繁遍历路径的方法进行Web用户访问模式挖掘时,通过对实验结果数据、源日志文件、用户使用互联网的特点以及互联网本身的局限进行了详细地分析和考察,发现了交叉性日志的存在。源数据新特性的出现,使得原算法在性能上有了明显的下降,因此,提出了新的基于有向图深度优先遍历的算法思想。该文设计了有针对性的模拟实验,实验结果无论从冗余事务的减少量或者事务的平均长度上都证明了新算法的优越性。
-
关键词
互联网使用记录挖掘
交叉性日志
最大向前引用
频繁遍历路径
-
Keywords
Web usage mining
Ahemately-recorded log file
Maximal forward references
Large reference sequences
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名个性化学习系统中Web日志挖掘的数据预处理
- 4
-
-
作者
金艳云
李红兵
-
机构
南通大学理学院
-
出处
《福建电脑》
2008年第12期157-157,178,共2页
-
文摘
在数据挖掘研究领域中,数据预处理起着十分重要的作用。Web使用挖掘的数据源最主要的是Web日志,本文介绍了Web日志的格式,针对Web日志的特点,介绍预处理过程中一些特殊情况的处理方法。
-
关键词
WEB使用挖掘
数据预处理
最大向前引用
事务识别
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
TP273.22
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于Web日志的数据预处理研究
被引量:2
- 5
-
-
作者
金述强
蒋外文
-
机构
中南大学信息科学与工程学院
-
出处
《现代计算机》
2008年第10期64-66,98,共4页
-
文摘
详细介绍Web日志挖掘的数据预处理过程。通过对预处理的结果用户会话文件进行处理,构造出扩展有向树模型,并从每个用户会话文件中发现该用户所有的最大向前引用路径,为实施Web日志挖掘算法提供数据基础。
-
关键词
数据预处理
用户会话
扩展有向树
最大向前引用路径
-
Keywords
Data Preprocessing
User Session
Extended Direction Tree
Maximal Forward Reference Path
-
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
-
-
题名并发分支模式在电子商务中的应用
- 6
-
-
作者
魏洪平
逄玉俊
-
机构
沈阳化工学院
-
出处
《微计算机信息》
北大核心
2007年第03X期181-182,174,共3页
-
基金
辽宁省教育厅科学研究计划资助项目(20040287)
-
文摘
以往的序列模式挖掘往往只考虑一些顺序的模式,而将一些重要的非顺序的模式忽略了。正是针对这些非顺序模式,介绍了并发分支模式的相关理论,提出了一种基于最大向前引用的并发分支模式挖掘方法,给出了相应的算法。同时讨论了该模式在电子商务中的几个应用点。
-
关键词
数据挖掘
并发分支模式
电子商务
最大向前引用事务
-
Keywords
Data Mining, Concurrent Branch Patterns, E- business, Maximum Forward Path
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-