题名 Web日志挖掘的预处理及路径补全算法的研究
被引量:11
1
作者
王岚
翟正军
机构
西北工业大学计算机学院
洛阳师范学院计算机科学系
出处
《微电子学与计算机》
CSCD
北大核心
2006年第8期113-116,共4页
文摘
Web日志挖掘是Web数据挖掘研究领域中一个最重要的应用方面。而数据预处理在Web日志挖掘过程中起着至关重要的作用。文章详细介绍了Web日志挖掘的预处理过程。通过实例分析了预处理方法,着重分析其中的路径补全方法,并给出了路径补全的算法实现。
关键词
WEB日志挖掘
数据预处理
路径 补全
算法
Keywords
Web log mining, Data preprocess, Path supplement, Algorithm
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
题名 一种基于个性化推荐的用户访问路径补全算法
被引量:1
2
作者
夏秀峰
王宇
机构
沈阳航空工业学院计算机学院
出处
《计算机应用与软件》
CSCD
2011年第2期179-183,共5页
文摘
路径补全是Web日志数据预处理的重要阶段,目前的路径补全技术大多基于静态网站结构实施。个性化推荐技术的广泛应用,使站点结构由静态结构转变为动态结构。针对目前各种路径补全算法无法解决动态站点结构下用户访问路径中页面缺失的问题,提出动态站点结构的概念、构造方法及站点结构的图结构存储策略。在此基础上,提出一种在动态站点结构下的基于页面类型的用户访问路径补全算法PCBPS(Path Complement Based on Page Sort)。实验证明在动态站点结构下,这种方法能较准确地恢复用户访问路径中的缺失页面,较好地提高了路径补全的准确率。
关键词
个性化推荐
路径 补全
动态站点结构
页面类型
Keywords
Personalized recommendation Path complement Dynamic site structure Page sort
分类号
TP309
[自动化与计算机技术—计算机系统结构]
题名 基于站点结构和浏览时间的路径补全算法
3
作者
崔晓靖
陈兴蜀
曾雪梅
机构
四川大学计算机学院
出处
《计算机工程与设计》
CSCD
北大核心
2014年第3期880-884,共5页
基金
国家自然科学基金面上基金项目(61272447)
文摘
路径补全旨在提高Web使用挖掘的准确性。在网页结构复杂的情况下,两个页面之间可以补充的路径可能有多条,传统的补充方式准确率较低。对此,分析了影响路径选择的因素,提出了用户浏览时间的概念,并结合动态站点结构提出一种基于站点结构和用户浏览时间的路径补全算法。该算法使用有向图结构存储了用户浏览时间和站点结构信息,并根据二者找出最合适的路径。实验结果表明,与传统方法相比,该方法提高了路径补充的准确率。
关键词
WEB使用挖掘
数据预处理
用户浏览时间
站点结构
路径 补全
Keywords
web use age mining
data processing
browsing time of user
structure of Web site
path completion
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 不确定性车辆路口的轨迹预测
被引量:8
4
作者
毛莺池
陈杨
机构
河海大学计算机与信息学院
出处
《计算机科学》
CSCD
北大核心
2018年第3期235-240,共6页
基金
国家重点研发计划项目(2016YFC0400910)
重大科技专项(2017ZX07104001)
+2 种基金
中央高校基本科研业务费专项资金(2015B22214
2017B16814
2017B20914)资助
文摘
在城市道路中,实时、准确、可靠地对移动车辆进行轨迹预测具有极高的应用价值,不仅可以提供准确的基于位置的服务,而且可以帮助过往车辆预知前方的交通状况。目前,移动车辆的轨迹预测方法主要基于历史轨迹的欧氏空间进行,并未考虑在受限路网中采用不确定性历史数据的车辆轨迹预测。针对这一问题,提出一种补全路径的基于马尔科夫链的轨迹预测方法,其优势在于:重新定义了补全路径算法,弥补了不确定性历史数据的不完整性,利用马尔科夫链低时间复杂度、高预测准确度的优势实现预测,避免了因频繁模式挖掘带来的查询时间过长而影响预测效率以及存在多余噪声影响轨迹预测准确率的问题。通过真实数据和实验分析表明:在参数设置相同的情况下,该方法比挖掘频繁轨迹模式算法的预测准确率平均提高了18.8%,预测时间平均缩减了80.4%。因此,该方法对于车辆路口的轨迹预测具有较高的预测准确率,并且能预测一系列的车辆未来轨迹。
关键词
受限路网
车辆轨迹预测
不确定性历史数据
补全路径
马尔科夫链
Keywords
Restricted road network
Vehicle trajectory prediction
Uncertainty historical data
Completion path
Markov chain
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 利用图片类日志信息改进会话识别质量
被引量:2
5
作者
范纯龙
姜宏飞
李华
机构
沈阳航空工业学院计算机学院
出处
《计算机应用》
CSCD
北大核心
2010年第4期1056-1058,共3页
基金
辽宁省教育厅基金资助项目(2009B140)
文摘
数据预处理是Web日志挖掘的基础,而会话识别则是数据预处理的关键步骤,其质量严重影响Web日志挖掘的结果。在分析现有会话识别方法的基础上,提出了利用数据预处理中废弃的图片等日志数据,并结合扩展Web图结构,从页面分组规则和路径补全算法两个方面改进会话识别质量,并通过实验证实该方法对改善会话识别质量是有效的。
关键词
会话识别
数据预处理
Web图结构
路径 补全
数据清洗
Keywords
session identification
data pre-processing
Web graph structure
path completion
data cleaning
分类号
TP393.09
[自动化与计算机技术—计算机应用技术]
题名 一种改进的Web日志数据预处理研究
被引量:4
6
作者
孙名松
王艳丽
唐亮
机构
哈尔滨理工大学计算机科学与技术学院
出处
《自动化技术与应用》
2008年第3期23-25,共3页
基金
黑龙江省自然科学基金项目(编号F0306)
文摘
Web日志中包含大量的冗余信息,这给挖掘带来了不便。数据预处理就是处理这些冗余信息,经过数据净化、用户识别、会话识别、路径补全操作后得到能够用于挖掘的数据。本文详细介绍了预处理过程,同时对传统的会话识别算法加以改进。本文提到的实际系统是基于SQL语句的,能够显著缩短预处理时间。
关键词
Web习志挖掘
用户识别
会话识别
路径 补全
Keywords
web log mining
user recognition
session recognition
pathway comolement
分类号
TP368
[自动化与计算机技术—计算机系统结构]