期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
Web日志挖掘中的会话识别算法 被引量:11
1
作者 蔡浩 贾宇波 +1 位作者 黄成伟 黄志强 《计算机工程与设计》 CSCD 北大核心 2009年第6期1321-1323,1390,共4页
会话识别是Web日志挖掘的关键步骤,然而很多方法所得到的会话不够精确。针对Web日志挖掘中的会话识别问题,在最常用的Timeout方法的基础上,提出了一种改进的基于平均时间阈值的识别方法。通过动态计算会话中请求记录间的平均时间间隔,... 会话识别是Web日志挖掘的关键步骤,然而很多方法所得到的会话不够精确。针对Web日志挖掘中的会话识别问题,在最常用的Timeout方法的基础上,提出了一种改进的基于平均时间阈值的识别方法。通过动态计算会话中请求记录间的平均时间间隔,个性化地调整页面的时间阈值,相对于传统的对所有用户页面使用单一的先验阈值,该方法能够更准确地识别出长对话。最后对生成的侯选会话集进行二次识别,使识别出的会话更为合理有效。实验结果表明,会话质量得到了提高。 展开更多
关键词 WEB挖掘 数据预处理 会话识别 时间阈值
下载PDF
Web使用挖掘中的一种改进的会话识别方法 被引量:27
2
作者 殷贤亮 张为 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第7期33-35,共3页
针对Web日志挖掘中的会话识别问题,提出了一种改进的基于时间间隔的识别方法.该方法通过使用访问时间间隔超出某个阈值来识别会话.统计结果表明页面的访问时间呈正态分布,改进的方法在此基础之上为页面设置访问时间阈值,并根据页面内容... 针对Web日志挖掘中的会话识别问题,提出了一种改进的基于时间间隔的识别方法.该方法通过使用访问时间间隔超出某个阈值来识别会话.统计结果表明页面的访问时间呈正态分布,改进的方法在此基础之上为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整.实验结果表明,相对于传统的对所有用户页面使用单一的先验阈值进行会话识别的方法,该方法能更准确地确定页面访问时间阈值,更为合理有效. 展开更多
关键词 WEB挖掘 会话 预处理 阈值
下载PDF
Web日志预处理中会话识别的优化 被引量:10
3
作者 朱晋华 陈俊杰 《太原理工大学学报》 CAS 北大核心 2008年第2期111-114,122,共5页
针对目前的各种会话识别方法,提出了一种优化的会话切分方法。该方法基于对用户下载时间、对页面的平均阅读时间及页面的链入、链出数等几个参数的综合,得到每个用户页面的访问时间阈值,根据该阈值来切分用户会话,得到会话侯选集合;然后... 针对目前的各种会话识别方法,提出了一种优化的会话切分方法。该方法基于对用户下载时间、对页面的平均阅读时间及页面的链入、链出数等几个参数的综合,得到每个用户页面的访问时间阈值,根据该阈值来切分用户会话,得到会话侯选集合;然后,根据用户对页面内容的兴趣度、浏览特性等来删除会话中的链接页面和不感兴趣的页面,生成一种最终有效的访问页面序列,从而为以后的模式发现提供良好的数据。实验结果表明,相对于所有用户使用单一先验阈值和使用统计方法结合页面内容确定阈值的方法,笔者提出的方法能更准确地确定页面访问时间阈值,得到更为合理有效的会话集合。 展开更多
关键词 日志挖掘 会话切分 阈值 兴趣度
下载PDF
Web日志会话的个性化识别方法的研究 被引量:7
4
作者 董志锋 陈俊杰 付裕峰 《计算机工程与应用》 CSCD 北大核心 2008年第8期179-182,共4页
会话识别是Web日志挖掘中的重要步骤。针对目前的各种会话识别方法,提出了一种改进的基于页面内容、下载时间等多个参数综合得到的针对每个用户的个性化识别方法。该方法通过使用访问时间间隔,判断是否在极大、极小两个阈值范围内来识... 会话识别是Web日志挖掘中的重要步骤。针对目前的各种会话识别方法,提出了一种改进的基于页面内容、下载时间等多个参数综合得到的针对每个用户的个性化识别方法。该方法通过使用访问时间间隔,判断是否在极大、极小两个阈值范围内来识别会话。根据页面内容、站点结构确定页面重要程度,通过页面的信息容量确定用户正常的阅读时间,通过Web日志中页面下载时间来确定起始阅读时间,对以上因素进行综合后对该阈值进行调整。实验结果表明,相对于目前的对所有用户页面使用单一先验阈值进行会话识别的方法及使用针对用户页面的阈值动态调整方法,提出的方法能更准确地个性化确定出页面访问时间阈值,更为合理有效。 展开更多
关键词 WEB挖掘 会话识别 预处理 阈值
下载PDF
Web日志预处理中优化的会话识别方法 被引量:11
5
作者 方元康 胡学钢 夏启寿 《计算机工程》 CAS CSCD 北大核心 2009年第7期49-51,共3页
针对Web日志数据预处理中会话识别这一重要环节,提出一种优化的会话识别算法。在用户识别后,通过过滤框架页面大幅度减少实验产生的有效页面数,为每个页面设置访问时间阈值,并根据页面重要程度对该阈值进行调整,页面的重要性由页面内容... 针对Web日志数据预处理中会话识别这一重要环节,提出一种优化的会话识别算法。在用户识别后,通过过滤框架页面大幅度减少实验产生的有效页面数,为每个页面设置访问时间阈值,并根据页面重要程度对该阈值进行调整,页面的重要性由页面内容及站点结构确定。实验数据显示,与对所有页面使用单一的先验阈值进行会话识别的方法相比较,该方法得到了真实性更强的会话集。 展开更多
关键词 WEB挖掘 数据预处理 阈值 Frame页面 会话识别
下载PDF
优化的Web日志会话识别方法 被引量:3
6
作者 方元康 王汝传 《计算机工程与设计》 CSCD 北大核心 2009年第7期1688-1690,共3页
关于Web使用挖掘中的会话识别问题,提出了一种改进的会话识别方法。统计每个页面的访问时间,并结合页面内容及站点结构生成页面访问时间阈值,再用页面访问时间阈值划分会话,然后对产生的会话集使用会话重组,即合并与断开的方法,对生成... 关于Web使用挖掘中的会话识别问题,提出了一种改进的会话识别方法。统计每个页面的访问时间,并结合页面内容及站点结构生成页面访问时间阈值,再用页面访问时间阈值划分会话,然后对产生的会话集使用会话重组,即合并与断开的方法,对生成的会话集进行进一步地优化。通过实验结果表明,该方法所得到的会话集更具有真实性。 展开更多
关键词 WEB挖掘 数据预处理 阈值 会话
下载PDF
改进的Web访问日志会话识别算法 被引量:8
7
作者 严奉华 刘建平 杨凡丁 《计算机工程与设计》 CSCD 北大核心 2008年第22期5685-5687,5690,共4页
针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界... 针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界定内容页,并针对内容页,提出了一些启发式规则,突破了"参引长度法"所固有的一个会话中只包含一个内容页的瓶颈。该方法提高了会话识别的准确度,实验结果表明是有效的。 展开更多
关键词 WEB日志挖掘 数据预处理 会话 内容页 时间阀值 启发式规则
下载PDF
Web日志挖掘中会话识别方法研究 被引量:4
8
作者 张毅 《计算机应用与软件》 CSCD 2010年第6期92-94,共3页
提出一种新的基于时间阈值会话识别算法,在时间阈值的计算上,既考虑了站点页面内容和结构的差异性,同时也考虑了访问者的个体差异性。相对于所有用户使用单一先验阈值和使用统计方法结合页面内容确定阈值的方法,方法能更准确地确定页面... 提出一种新的基于时间阈值会话识别算法,在时间阈值的计算上,既考虑了站点页面内容和结构的差异性,同时也考虑了访问者的个体差异性。相对于所有用户使用单一先验阈值和使用统计方法结合页面内容确定阈值的方法,方法能更准确地确定页面访问时间阈值,进行会话识别时具有更高的效率和真实性。 展开更多
关键词 WEB日志挖掘 会话识别 阈值 数据预处理
下载PDF
一种改进的Web日志会话识别方法 被引量:7
9
作者 方元康 胡学钢 夏启寿 《计算机技术与发展》 2008年第11期214-216,共3页
会话识别是Web日志挖掘中的数据预处理中的一个重要步骤。文中提出了一种改进的会话识别方法。首先,在用户识别后,进行框架页面的过滤,从而大大地减少了实验产生的有效页面,然后为页面设置访问时间阈值,并根据页面内容及站点结构确定的... 会话识别是Web日志挖掘中的数据预处理中的一个重要步骤。文中提出了一种改进的会话识别方法。首先,在用户识别后,进行框架页面的过滤,从而大大地减少了实验产生的有效页面,然后为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整。通过实验证明,相对于传统的对所有页面使用单一的先验阈值进行会话识别的方法,该方法所得到的会话集更具有真实性。 展开更多
关键词 WEB挖掘 数据预处理 阈值 Frame页面 会话识别
下载PDF
基于聚类的Web用户会话识别优化方法 被引量:1
10
作者 凌海峰 余笪 《计算机应用研究》 CSCD 北大核心 2012年第8期2862-2864,共3页
会话识别是用户访问行为分析的基础和关键工作,其质量对于识别和发现用户的信息需求具有决定性的影响。目前常用的是基于时间阈值的切分方法,但是该方法存在的主要问题是针对不同用户时间阈值难以准确地确定。提出了一种新的基于聚类技... 会话识别是用户访问行为分析的基础和关键工作,其质量对于识别和发现用户的信息需求具有决定性的影响。目前常用的是基于时间阈值的切分方法,但是该方法存在的主要问题是针对不同用户时间阈值难以准确地确定。提出了一种新的基于聚类技术的会话识别优化方法,首先建立了基于聚类的会话识别优化模型,然后采用改进的K-means算法进行会话识别。实验结果表明该方法与传统方法相比具有较好的效果。 展开更多
关键词 Web用户会话识别 K-MEANS算法 时间阈值
下载PDF
动态段阈值机制在P2Cast VoD系统中的应用
11
作者 鲁宏伟 宋玉磊 《计算机工程与科学》 CSCD 2007年第9期58-59,100,共3页
本文对一种新型的视频点播系统P2Cast视频点播系统的关键技术进行了研究,针对段阈值在系统的可扩展性方面以及视频服务质量方面所起的重要作用,结合补丁流算法和客户节点的请求速率提出了一种嵌入动态调节段阈值机制的BF改进算法。该算... 本文对一种新型的视频点播系统P2Cast视频点播系统的关键技术进行了研究,针对段阈值在系统的可扩展性方面以及视频服务质量方面所起的重要作用,结合补丁流算法和客户节点的请求速率提出了一种嵌入动态调节段阈值机制的BF改进算法。该算法在一定程度上提高了P2Cast视频点播系统的性能。 展开更多
关键词 P2Cast VOD BF算法 段阅值
下载PDF
Web日志挖掘中数据预处理技术研究 被引量:2
12
作者 方元康 胡学钢 夏启寿 《安庆师范学院学报(自然科学版)》 2008年第3期107-110,113,共5页
Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页... Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页与页面访问时间阈值相结合的会话识别方法,实验数据验证说明该方法可以显著地提高Web日志挖掘结果的兴趣性。 展开更多
关键词 WEB挖掘 数据预处理 阈值 Frame页面 会话识别
下载PDF
基于框架网页与页面阈值的会话识别算法
13
作者 方元康 胡学钢 +1 位作者 夏启寿 朱勇 《计算机应用与软件》 CSCD 2009年第1期18-19,27,共3页
会话识别是Web日志预处理过程中的一个重要环节,针对传统会话识别的不足,提出一种改进的会话识别算法。在识别出具体的用户之后,过滤大量的框架网页;然后根据每个页面的内容及网站结构,构造出相对合理的页面访问时间阈值,并以此阈值来... 会话识别是Web日志预处理过程中的一个重要环节,针对传统会话识别的不足,提出一种改进的会话识别算法。在识别出具体的用户之后,过滤大量的框架网页;然后根据每个页面的内容及网站结构,构造出相对合理的页面访问时间阈值,并以此阈值来进行用户的会话识别。最后通过实验数据,与几种传统的会话识别方法进行了比较,表明该算法更为合理有效。 展开更多
关键词 WEB挖掘 数据预处理 阈值 Frame页面 会话识别
下载PDF
基于时间密度的Web日志用户浏览行为分析
14
作者 庄力可 张长水 勒中坚 《计算机科学》 CSCD 北大核心 2004年第4期108-112,共5页
本文针对Web日志中用户会话识别阈值问题,给出一种基于时间密度的频度分析方法。文中首先将基于时间间隔参数刻度的用户访问频度定义为一个随机向量,给出了随机向量的切尾算法;然后建立频度与IP用户的相关矩阵,矩阵的列为访问频度,矩阵... 本文针对Web日志中用户会话识别阈值问题,给出一种基于时间密度的频度分析方法。文中首先将基于时间间隔参数刻度的用户访问频度定义为一个随机向量,给出了随机向量的切尾算法;然后建立频度与IP用户的相关矩阵,矩阵的列为访问频度,矩阵的行为用户IP,矩阵中的每一个值为某一时间间隔的访问频度。通过列向量的聚类分析,对不同类别用户的访问行为进行探讨。最后,对会话识别的阈值进行参数估计。并通过抽样对阈值进行检测和参数修正。 展开更多
关键词 INTERNET 网络行为 时间密度 WEB日志 频度分析方法
下载PDF
Web使用挖掘中的会话识别算法研究
15
作者 王新房 邓小刚 《计算机工程与设计》 CSCD 北大核心 2009年第7期1685-1687,1693,共4页
在Web使用挖掘的研究领域中,很多传统的会话识别算法效率不高,得到的会话往往也不是很精确,从而影响了最终的挖掘结果。针对这种现状,研究了Web使用挖掘中的数据预处理和会话识别过程,并提出一种Markov链模型结合动态时间阀值的会话识... 在Web使用挖掘的研究领域中,很多传统的会话识别算法效率不高,得到的会话往往也不是很精确,从而影响了最终的挖掘结果。针对这种现状,研究了Web使用挖掘中的数据预处理和会话识别过程,并提出一种Markov链模型结合动态时间阀值的会话识别新算法。实验结果表明,这种方法比其它传统的算法的表现有显著提高。 展开更多
关键词 WEB使用挖掘 数据预处理 会话识别 MARKOV链模型 动态时间阀值算法
下载PDF
web日志挖掘中会话识别方法 被引量:1
16
作者 袁艺 陈海光 《上海师范大学学报(自然科学版)》 2016年第5期593-598,共6页
通过对传统web会话识别方法分析和比较,改进了目前最常用的基于时间阈值会话识别方法,提出了一种基于动态阈值会话识别方法,该算法采用动态计算会话中请求记录间的平均时间间隔和动态计算会话中页面的平均大小相结合的方法,根据用户和... 通过对传统web会话识别方法分析和比较,改进了目前最常用的基于时间阈值会话识别方法,提出了一种基于动态阈值会话识别方法,该算法采用动态计算会话中请求记录间的平均时间间隔和动态计算会话中页面的平均大小相结合的方法,根据用户和网页的特点动态调整阈值,相对于传统单一的先验阈值,该方法可以根据不同的用户访问不同的页面生成动态的阈值,充分运用用户和网页信息.经过实验验证,该方法可以识别出更多的用户会话,且识别会话的准确率和查全率也比传统算法更高. 展开更多
关键词 WEB挖掘 会话识别 时间阈值 数据预处理
下载PDF
Web使用挖掘中的会话识别算法 被引量:1
17
作者 周方 周根宝 《内蒙古农业大学学报(自然科学版)》 CAS 北大核心 2010年第4期234-236,共3页
针对Web日志挖掘中的会话识别问题,在最常用的Timeout方法的基础上,提出了一种改进的基于平均时间阈值的识别方法。通过动态计算会话中请求记录间的平均时间间隔,个性化地调整页面的时间阈值,相对于传统的时所有用户页面使用单一的先验... 针对Web日志挖掘中的会话识别问题,在最常用的Timeout方法的基础上,提出了一种改进的基于平均时间阈值的识别方法。通过动态计算会话中请求记录间的平均时间间隔,个性化地调整页面的时间阈值,相对于传统的时所有用户页面使用单一的先验阈值,该方法能够更准确地识别出长对话。最后对生成的侯选会话集进行二次识别,使识别出的会话更为合理有效。实验结果表明,会话质量得到了提高。 展开更多
关键词 WEB挖掘 数据预处理 会话识别 时间阈值
下载PDF
改进的页面与时间阈值的会话识别法 被引量:1
18
作者 郑立山 滕少华 《计算机应用与软件》 CSCD 北大核心 2012年第10期197-199,275,共4页
会话识别是Web日志挖掘的基础,提高会话的识别率能为后续模式的挖掘提供准确可靠的数据,已有许多研究集中于此。在常用的计算时间阈值识别方法的基础上,提出一种改进的基于URL页面类型、页面信息量和停留时间的平均阈值识别方法。针对... 会话识别是Web日志挖掘的基础,提高会话的识别率能为后续模式的挖掘提供准确可靠的数据,已有许多研究集中于此。在常用的计算时间阈值识别方法的基础上,提出一种改进的基于URL页面类型、页面信息量和停留时间的平均阈值识别方法。针对不同的URL页面类型采用不同的阈值计算方法,并设置时间阈值。相对于已有的对所有用户访问页面使用单一的先验阈值和现有动态阈值计算,该方法能够更真实地反映用户会话的情况,且识别的准确率有了较大提高。 展开更多
关键词 WEB日志挖掘 数据预处理 用户会话识别 动态阈值
下载PDF
基于动态阈值分配的流媒体边缘云会话迁移策略 被引量:4
19
作者 姜同全 王子磊 奚宏生 《计算机工程》 CAS CSCD 北大核心 2017年第1期55-60,共6页
云模式下的流媒体服务系统需要有效与平滑的资源调度。传统的last-minute迁移大多只将负载信息用于迁移策略计算,但当流行度动态波动时,间接且单一的方法无法做出准确的策略调整。为此,将流行度分布应用于迁移模型中,提出一种基于动态... 云模式下的流媒体服务系统需要有效与平滑的资源调度。传统的last-minute迁移大多只将负载信息用于迁移策略计算,但当流行度动态波动时,间接且单一的方法无法做出准确的策略调整。为此,将流行度分布应用于迁移模型中,提出一种基于动态阈值分配的会话迁移策略,依据流行度分布,确定每台服务器上各类视频的会话分配阈值,通过分配阈值的指导性避免请求接入及会话迁移的盲目性。实验结果表明,该策略能有效改善请求接受率,并保持较低的迁移代价。 展开更多
关键词 流媒体边缘云 资源调度 会话迁移 流行度分布 动态阈值分配 迁移代价
下载PDF
基于簇结构的移动Ad Hoc网络的认证协议 被引量:2
20
作者 冯雪玲 于炯 +1 位作者 马俊 曹宏庆 《计算机技术与发展》 2008年第9期127-130,共4页
与传统网络比较,移动Ad Hoc网络具有拓扑结构不稳定、终端能源有限、有限带宽及自组织等特点,这使得Ad Hoc网络的安全问题成了一个极具挑战性的研究课题,而安全问题中认证是基础。文中提出一种基于分簇结构的移动Ad Hoc网络的认证协议,... 与传统网络比较,移动Ad Hoc网络具有拓扑结构不稳定、终端能源有限、有限带宽及自组织等特点,这使得Ad Hoc网络的安全问题成了一个极具挑战性的研究课题,而安全问题中认证是基础。文中提出一种基于分簇结构的移动Ad Hoc网络的认证协议,结合门限加密机制和分布式密钥管理方案,实现各级簇头及簇成员的分布式认证。有效防止了恶意节点对消息的截取、修改、伪造、监视和窃听等外部攻击和防范内部被攻破认证节点对分布式认证的干扰。 展开更多
关键词 移动AD HOC网络 簇头 认证 门限加密机制 会议密钥
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部