期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
23
篇文章
<
1
2
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
Web日志挖掘中的会话识别算法
被引量:
11
1
作者
蔡浩
贾宇波
+1 位作者
黄成伟
黄志强
《计算机工程与设计》
CSCD
北大核心
2009年第6期1321-1323,1390,共4页
会话识别是Web日志挖掘的关键步骤,然而很多方法所得到的会话不够精确。针对Web日志挖掘中的会话识别问题,在最常用的Timeout方法的基础上,提出了一种改进的基于平均时间阈值的识别方法。通过动态计算会话中请求记录间的平均时间间隔,...
会话识别是Web日志挖掘的关键步骤,然而很多方法所得到的会话不够精确。针对Web日志挖掘中的会话识别问题,在最常用的Timeout方法的基础上,提出了一种改进的基于平均时间阈值的识别方法。通过动态计算会话中请求记录间的平均时间间隔,个性化地调整页面的时间阈值,相对于传统的对所有用户页面使用单一的先验阈值,该方法能够更准确地识别出长对话。最后对生成的侯选会话集进行二次识别,使识别出的会话更为合理有效。实验结果表明,会话质量得到了提高。
展开更多
关键词
WEB挖掘
数据预处理
会话识别
时间阈值
下载PDF
职称材料
Web使用挖掘中的一种改进的会话识别方法
被引量:
27
2
作者
殷贤亮
张为
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2006年第7期33-35,共3页
针对Web日志挖掘中的会话识别问题,提出了一种改进的基于时间间隔的识别方法.该方法通过使用访问时间间隔超出某个阈值来识别会话.统计结果表明页面的访问时间呈正态分布,改进的方法在此基础之上为页面设置访问时间阈值,并根据页面内容...
针对Web日志挖掘中的会话识别问题,提出了一种改进的基于时间间隔的识别方法.该方法通过使用访问时间间隔超出某个阈值来识别会话.统计结果表明页面的访问时间呈正态分布,改进的方法在此基础之上为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整.实验结果表明,相对于传统的对所有用户页面使用单一的先验阈值进行会话识别的方法,该方法能更准确地确定页面访问时间阈值,更为合理有效.
展开更多
关键词
WEB挖掘
会话
预处理
阈值
下载PDF
职称材料
Web日志预处理中会话识别的优化
被引量:
10
3
作者
朱晋华
陈俊杰
《太原理工大学学报》
CAS
北大核心
2008年第2期111-114,122,共5页
针对目前的各种会话识别方法,提出了一种优化的会话切分方法。该方法基于对用户下载时间、对页面的平均阅读时间及页面的链入、链出数等几个参数的综合,得到每个用户页面的访问时间阈值,根据该阈值来切分用户会话,得到会话侯选集合;然后...
针对目前的各种会话识别方法,提出了一种优化的会话切分方法。该方法基于对用户下载时间、对页面的平均阅读时间及页面的链入、链出数等几个参数的综合,得到每个用户页面的访问时间阈值,根据该阈值来切分用户会话,得到会话侯选集合;然后,根据用户对页面内容的兴趣度、浏览特性等来删除会话中的链接页面和不感兴趣的页面,生成一种最终有效的访问页面序列,从而为以后的模式发现提供良好的数据。实验结果表明,相对于所有用户使用单一先验阈值和使用统计方法结合页面内容确定阈值的方法,笔者提出的方法能更准确地确定页面访问时间阈值,得到更为合理有效的会话集合。
展开更多
关键词
日志挖掘
会话切分
阈值
兴趣度
下载PDF
职称材料
Web日志会话的个性化识别方法的研究
被引量:
7
4
作者
董志锋
陈俊杰
付裕峰
《计算机工程与应用》
CSCD
北大核心
2008年第8期179-182,共4页
会话识别是Web日志挖掘中的重要步骤。针对目前的各种会话识别方法,提出了一种改进的基于页面内容、下载时间等多个参数综合得到的针对每个用户的个性化识别方法。该方法通过使用访问时间间隔,判断是否在极大、极小两个阈值范围内来识...
会话识别是Web日志挖掘中的重要步骤。针对目前的各种会话识别方法,提出了一种改进的基于页面内容、下载时间等多个参数综合得到的针对每个用户的个性化识别方法。该方法通过使用访问时间间隔,判断是否在极大、极小两个阈值范围内来识别会话。根据页面内容、站点结构确定页面重要程度,通过页面的信息容量确定用户正常的阅读时间,通过Web日志中页面下载时间来确定起始阅读时间,对以上因素进行综合后对该阈值进行调整。实验结果表明,相对于目前的对所有用户页面使用单一先验阈值进行会话识别的方法及使用针对用户页面的阈值动态调整方法,提出的方法能更准确地个性化确定出页面访问时间阈值,更为合理有效。
展开更多
关键词
WEB挖掘
会话识别
预处理
阈值
下载PDF
职称材料
Web日志预处理中优化的会话识别方法
被引量:
11
5
作者
方元康
胡学钢
夏启寿
《计算机工程》
CAS
CSCD
北大核心
2009年第7期49-51,共3页
针对Web日志数据预处理中会话识别这一重要环节,提出一种优化的会话识别算法。在用户识别后,通过过滤框架页面大幅度减少实验产生的有效页面数,为每个页面设置访问时间阈值,并根据页面重要程度对该阈值进行调整,页面的重要性由页面内容...
针对Web日志数据预处理中会话识别这一重要环节,提出一种优化的会话识别算法。在用户识别后,通过过滤框架页面大幅度减少实验产生的有效页面数,为每个页面设置访问时间阈值,并根据页面重要程度对该阈值进行调整,页面的重要性由页面内容及站点结构确定。实验数据显示,与对所有页面使用单一的先验阈值进行会话识别的方法相比较,该方法得到了真实性更强的会话集。
展开更多
关键词
WEB挖掘
数据预处理
阈值
Frame页面
会话识别
下载PDF
职称材料
优化的Web日志会话识别方法
被引量:
3
6
作者
方元康
王汝传
《计算机工程与设计》
CSCD
北大核心
2009年第7期1688-1690,共3页
关于Web使用挖掘中的会话识别问题,提出了一种改进的会话识别方法。统计每个页面的访问时间,并结合页面内容及站点结构生成页面访问时间阈值,再用页面访问时间阈值划分会话,然后对产生的会话集使用会话重组,即合并与断开的方法,对生成...
关于Web使用挖掘中的会话识别问题,提出了一种改进的会话识别方法。统计每个页面的访问时间,并结合页面内容及站点结构生成页面访问时间阈值,再用页面访问时间阈值划分会话,然后对产生的会话集使用会话重组,即合并与断开的方法,对生成的会话集进行进一步地优化。通过实验结果表明,该方法所得到的会话集更具有真实性。
展开更多
关键词
WEB挖掘
数据预处理
阈值
会话
下载PDF
职称材料
改进的Web访问日志会话识别算法
被引量:
8
7
作者
严奉华
刘建平
杨凡丁
《计算机工程与设计》
CSCD
北大核心
2008年第22期5685-5687,5690,共4页
针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界...
针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界定内容页,并针对内容页,提出了一些启发式规则,突破了"参引长度法"所固有的一个会话中只包含一个内容页的瓶颈。该方法提高了会话识别的准确度,实验结果表明是有效的。
展开更多
关键词
WEB日志挖掘
数据预处理
会话
内容页
时间阀值
启发式规则
下载PDF
职称材料
Web日志挖掘中会话识别方法研究
被引量:
4
8
作者
张毅
《计算机应用与软件》
CSCD
2010年第6期92-94,共3页
提出一种新的基于时间阈值会话识别算法,在时间阈值的计算上,既考虑了站点页面内容和结构的差异性,同时也考虑了访问者的个体差异性。相对于所有用户使用单一先验阈值和使用统计方法结合页面内容确定阈值的方法,方法能更准确地确定页面...
提出一种新的基于时间阈值会话识别算法,在时间阈值的计算上,既考虑了站点页面内容和结构的差异性,同时也考虑了访问者的个体差异性。相对于所有用户使用单一先验阈值和使用统计方法结合页面内容确定阈值的方法,方法能更准确地确定页面访问时间阈值,进行会话识别时具有更高的效率和真实性。
展开更多
关键词
WEB日志挖掘
会话识别
阈值
数据预处理
下载PDF
职称材料
一种改进的Web日志会话识别方法
被引量:
7
9
作者
方元康
胡学钢
夏启寿
《计算机技术与发展》
2008年第11期214-216,共3页
会话识别是Web日志挖掘中的数据预处理中的一个重要步骤。文中提出了一种改进的会话识别方法。首先,在用户识别后,进行框架页面的过滤,从而大大地减少了实验产生的有效页面,然后为页面设置访问时间阈值,并根据页面内容及站点结构确定的...
会话识别是Web日志挖掘中的数据预处理中的一个重要步骤。文中提出了一种改进的会话识别方法。首先,在用户识别后,进行框架页面的过滤,从而大大地减少了实验产生的有效页面,然后为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整。通过实验证明,相对于传统的对所有页面使用单一的先验阈值进行会话识别的方法,该方法所得到的会话集更具有真实性。
展开更多
关键词
WEB挖掘
数据预处理
阈值
Frame页面
会话识别
下载PDF
职称材料
基于聚类的Web用户会话识别优化方法
被引量:
1
10
作者
凌海峰
余笪
《计算机应用研究》
CSCD
北大核心
2012年第8期2862-2864,共3页
会话识别是用户访问行为分析的基础和关键工作,其质量对于识别和发现用户的信息需求具有决定性的影响。目前常用的是基于时间阈值的切分方法,但是该方法存在的主要问题是针对不同用户时间阈值难以准确地确定。提出了一种新的基于聚类技...
会话识别是用户访问行为分析的基础和关键工作,其质量对于识别和发现用户的信息需求具有决定性的影响。目前常用的是基于时间阈值的切分方法,但是该方法存在的主要问题是针对不同用户时间阈值难以准确地确定。提出了一种新的基于聚类技术的会话识别优化方法,首先建立了基于聚类的会话识别优化模型,然后采用改进的K-means算法进行会话识别。实验结果表明该方法与传统方法相比具有较好的效果。
展开更多
关键词
Web用户会话识别
K-MEANS算法
时间阈值
下载PDF
职称材料
动态段阈值机制在P2Cast VoD系统中的应用
11
作者
鲁宏伟
宋玉磊
《计算机工程与科学》
CSCD
2007年第9期58-59,100,共3页
本文对一种新型的视频点播系统P2Cast视频点播系统的关键技术进行了研究,针对段阈值在系统的可扩展性方面以及视频服务质量方面所起的重要作用,结合补丁流算法和客户节点的请求速率提出了一种嵌入动态调节段阈值机制的BF改进算法。该算...
本文对一种新型的视频点播系统P2Cast视频点播系统的关键技术进行了研究,针对段阈值在系统的可扩展性方面以及视频服务质量方面所起的重要作用,结合补丁流算法和客户节点的请求速率提出了一种嵌入动态调节段阈值机制的BF改进算法。该算法在一定程度上提高了P2Cast视频点播系统的性能。
展开更多
关键词
P2Cast
VOD
BF算法
段阅值
下载PDF
职称材料
Web日志挖掘中数据预处理技术研究
被引量:
2
12
作者
方元康
胡学钢
夏启寿
《安庆师范学院学报(自然科学版)》
2008年第3期107-110,113,共5页
Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页...
Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页与页面访问时间阈值相结合的会话识别方法,实验数据验证说明该方法可以显著地提高Web日志挖掘结果的兴趣性。
展开更多
关键词
WEB挖掘
数据预处理
阈值
Frame页面
会话识别
下载PDF
职称材料
基于框架网页与页面阈值的会话识别算法
13
作者
方元康
胡学钢
+1 位作者
夏启寿
朱勇
《计算机应用与软件》
CSCD
2009年第1期18-19,27,共3页
会话识别是Web日志预处理过程中的一个重要环节,针对传统会话识别的不足,提出一种改进的会话识别算法。在识别出具体的用户之后,过滤大量的框架网页;然后根据每个页面的内容及网站结构,构造出相对合理的页面访问时间阈值,并以此阈值来...
会话识别是Web日志预处理过程中的一个重要环节,针对传统会话识别的不足,提出一种改进的会话识别算法。在识别出具体的用户之后,过滤大量的框架网页;然后根据每个页面的内容及网站结构,构造出相对合理的页面访问时间阈值,并以此阈值来进行用户的会话识别。最后通过实验数据,与几种传统的会话识别方法进行了比较,表明该算法更为合理有效。
展开更多
关键词
WEB挖掘
数据预处理
阈值
Frame页面
会话识别
下载PDF
职称材料
基于时间密度的Web日志用户浏览行为分析
14
作者
庄力可
张长水
勒中坚
《计算机科学》
CSCD
北大核心
2004年第4期108-112,共5页
本文针对Web日志中用户会话识别阈值问题,给出一种基于时间密度的频度分析方法。文中首先将基于时间间隔参数刻度的用户访问频度定义为一个随机向量,给出了随机向量的切尾算法;然后建立频度与IP用户的相关矩阵,矩阵的列为访问频度,矩阵...
本文针对Web日志中用户会话识别阈值问题,给出一种基于时间密度的频度分析方法。文中首先将基于时间间隔参数刻度的用户访问频度定义为一个随机向量,给出了随机向量的切尾算法;然后建立频度与IP用户的相关矩阵,矩阵的列为访问频度,矩阵的行为用户IP,矩阵中的每一个值为某一时间间隔的访问频度。通过列向量的聚类分析,对不同类别用户的访问行为进行探讨。最后,对会话识别的阈值进行参数估计。并通过抽样对阈值进行检测和参数修正。
展开更多
关键词
INTERNET
网络行为
时间密度
WEB日志
频度分析方法
下载PDF
职称材料
Web使用挖掘中的会话识别算法研究
15
作者
王新房
邓小刚
《计算机工程与设计》
CSCD
北大核心
2009年第7期1685-1687,1693,共4页
在Web使用挖掘的研究领域中,很多传统的会话识别算法效率不高,得到的会话往往也不是很精确,从而影响了最终的挖掘结果。针对这种现状,研究了Web使用挖掘中的数据预处理和会话识别过程,并提出一种Markov链模型结合动态时间阀值的会话识...
在Web使用挖掘的研究领域中,很多传统的会话识别算法效率不高,得到的会话往往也不是很精确,从而影响了最终的挖掘结果。针对这种现状,研究了Web使用挖掘中的数据预处理和会话识别过程,并提出一种Markov链模型结合动态时间阀值的会话识别新算法。实验结果表明,这种方法比其它传统的算法的表现有显著提高。
展开更多
关键词
WEB使用挖掘
数据预处理
会话识别
MARKOV链模型
动态时间阀值算法
下载PDF
职称材料
web日志挖掘中会话识别方法
被引量:
1
16
作者
袁艺
陈海光
《上海师范大学学报(自然科学版)》
2016年第5期593-598,共6页
通过对传统web会话识别方法分析和比较,改进了目前最常用的基于时间阈值会话识别方法,提出了一种基于动态阈值会话识别方法,该算法采用动态计算会话中请求记录间的平均时间间隔和动态计算会话中页面的平均大小相结合的方法,根据用户和...
通过对传统web会话识别方法分析和比较,改进了目前最常用的基于时间阈值会话识别方法,提出了一种基于动态阈值会话识别方法,该算法采用动态计算会话中请求记录间的平均时间间隔和动态计算会话中页面的平均大小相结合的方法,根据用户和网页的特点动态调整阈值,相对于传统单一的先验阈值,该方法可以根据不同的用户访问不同的页面生成动态的阈值,充分运用用户和网页信息.经过实验验证,该方法可以识别出更多的用户会话,且识别会话的准确率和查全率也比传统算法更高.
展开更多
关键词
WEB挖掘
会话识别
时间阈值
数据预处理
下载PDF
职称材料
Web使用挖掘中的会话识别算法
被引量:
1
17
作者
周方
周根宝
《内蒙古农业大学学报(自然科学版)》
CAS
北大核心
2010年第4期234-236,共3页
针对Web日志挖掘中的会话识别问题,在最常用的Timeout方法的基础上,提出了一种改进的基于平均时间阈值的识别方法。通过动态计算会话中请求记录间的平均时间间隔,个性化地调整页面的时间阈值,相对于传统的时所有用户页面使用单一的先验...
针对Web日志挖掘中的会话识别问题,在最常用的Timeout方法的基础上,提出了一种改进的基于平均时间阈值的识别方法。通过动态计算会话中请求记录间的平均时间间隔,个性化地调整页面的时间阈值,相对于传统的时所有用户页面使用单一的先验阈值,该方法能够更准确地识别出长对话。最后对生成的侯选会话集进行二次识别,使识别出的会话更为合理有效。实验结果表明,会话质量得到了提高。
展开更多
关键词
WEB挖掘
数据预处理
会话识别
时间阈值
下载PDF
职称材料
改进的页面与时间阈值的会话识别法
被引量:
1
18
作者
郑立山
滕少华
《计算机应用与软件》
CSCD
北大核心
2012年第10期197-199,275,共4页
会话识别是Web日志挖掘的基础,提高会话的识别率能为后续模式的挖掘提供准确可靠的数据,已有许多研究集中于此。在常用的计算时间阈值识别方法的基础上,提出一种改进的基于URL页面类型、页面信息量和停留时间的平均阈值识别方法。针对...
会话识别是Web日志挖掘的基础,提高会话的识别率能为后续模式的挖掘提供准确可靠的数据,已有许多研究集中于此。在常用的计算时间阈值识别方法的基础上,提出一种改进的基于URL页面类型、页面信息量和停留时间的平均阈值识别方法。针对不同的URL页面类型采用不同的阈值计算方法,并设置时间阈值。相对于已有的对所有用户访问页面使用单一的先验阈值和现有动态阈值计算,该方法能够更真实地反映用户会话的情况,且识别的准确率有了较大提高。
展开更多
关键词
WEB日志挖掘
数据预处理
用户会话识别
动态阈值
下载PDF
职称材料
基于动态阈值分配的流媒体边缘云会话迁移策略
被引量:
4
19
作者
姜同全
王子磊
奚宏生
《计算机工程》
CAS
CSCD
北大核心
2017年第1期55-60,共6页
云模式下的流媒体服务系统需要有效与平滑的资源调度。传统的last-minute迁移大多只将负载信息用于迁移策略计算,但当流行度动态波动时,间接且单一的方法无法做出准确的策略调整。为此,将流行度分布应用于迁移模型中,提出一种基于动态...
云模式下的流媒体服务系统需要有效与平滑的资源调度。传统的last-minute迁移大多只将负载信息用于迁移策略计算,但当流行度动态波动时,间接且单一的方法无法做出准确的策略调整。为此,将流行度分布应用于迁移模型中,提出一种基于动态阈值分配的会话迁移策略,依据流行度分布,确定每台服务器上各类视频的会话分配阈值,通过分配阈值的指导性避免请求接入及会话迁移的盲目性。实验结果表明,该策略能有效改善请求接受率,并保持较低的迁移代价。
展开更多
关键词
流媒体边缘云
资源调度
会话迁移
流行度分布
动态阈值分配
迁移代价
下载PDF
职称材料
基于簇结构的移动Ad Hoc网络的认证协议
被引量:
2
20
作者
冯雪玲
于炯
+1 位作者
马俊
曹宏庆
《计算机技术与发展》
2008年第9期127-130,共4页
与传统网络比较,移动Ad Hoc网络具有拓扑结构不稳定、终端能源有限、有限带宽及自组织等特点,这使得Ad Hoc网络的安全问题成了一个极具挑战性的研究课题,而安全问题中认证是基础。文中提出一种基于分簇结构的移动Ad Hoc网络的认证协议,...
与传统网络比较,移动Ad Hoc网络具有拓扑结构不稳定、终端能源有限、有限带宽及自组织等特点,这使得Ad Hoc网络的安全问题成了一个极具挑战性的研究课题,而安全问题中认证是基础。文中提出一种基于分簇结构的移动Ad Hoc网络的认证协议,结合门限加密机制和分布式密钥管理方案,实现各级簇头及簇成员的分布式认证。有效防止了恶意节点对消息的截取、修改、伪造、监视和窃听等外部攻击和防范内部被攻破认证节点对分布式认证的干扰。
展开更多
关键词
移动AD
HOC网络
簇头
认证
门限加密机制
会议密钥
下载PDF
职称材料
题名
Web日志挖掘中的会话识别算法
被引量:
11
1
作者
蔡浩
贾宇波
黄成伟
黄志强
机构
浙江理工大学信息电子学院
出处
《计算机工程与设计》
CSCD
北大核心
2009年第6期1321-1323,1390,共4页
基金
浙江省教育厅科研计划基金项目(20060599)
浙江理工大学科学基金项目(111251A4Y04002)
文摘
会话识别是Web日志挖掘的关键步骤,然而很多方法所得到的会话不够精确。针对Web日志挖掘中的会话识别问题,在最常用的Timeout方法的基础上,提出了一种改进的基于平均时间阈值的识别方法。通过动态计算会话中请求记录间的平均时间间隔,个性化地调整页面的时间阈值,相对于传统的对所有用户页面使用单一的先验阈值,该方法能够更准确地识别出长对话。最后对生成的侯选会话集进行二次识别,使识别出的会话更为合理有效。实验结果表明,会话质量得到了提高。
关键词
WEB挖掘
数据预处理
会话识别
时间阈值
Keywords
web mining
data preparation
session
identification
threshold
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Web使用挖掘中的一种改进的会话识别方法
被引量:
27
2
作者
殷贤亮
张为
机构
华中科技大学计算机科学与技术学院
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2006年第7期33-35,共3页
文摘
针对Web日志挖掘中的会话识别问题,提出了一种改进的基于时间间隔的识别方法.该方法通过使用访问时间间隔超出某个阈值来识别会话.统计结果表明页面的访问时间呈正态分布,改进的方法在此基础之上为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整.实验结果表明,相对于传统的对所有用户页面使用单一的先验阈值进行会话识别的方法,该方法能更准确地确定页面访问时间阈值,更为合理有效.
关键词
WEB挖掘
会话
预处理
阈值
Keywords
Web mining
session
data pre-processing
threshold
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Web日志预处理中会话识别的优化
被引量:
10
3
作者
朱晋华
陈俊杰
机构
太原理工大学计算机与软件学院
出处
《太原理工大学学报》
CAS
北大核心
2008年第2期111-114,122,共5页
基金
国家自然科学基金资助项目(60773004)
山西省自然科学基金资助项目(2007011050)
文摘
针对目前的各种会话识别方法,提出了一种优化的会话切分方法。该方法基于对用户下载时间、对页面的平均阅读时间及页面的链入、链出数等几个参数的综合,得到每个用户页面的访问时间阈值,根据该阈值来切分用户会话,得到会话侯选集合;然后,根据用户对页面内容的兴趣度、浏览特性等来删除会话中的链接页面和不感兴趣的页面,生成一种最终有效的访问页面序列,从而为以后的模式发现提供良好的数据。实验结果表明,相对于所有用户使用单一先验阈值和使用统计方法结合页面内容确定阈值的方法,笔者提出的方法能更准确地确定页面访问时间阈值,得到更为合理有效的会话集合。
关键词
日志挖掘
会话切分
阈值
兴趣度
Keywords
Web log mining
session
identification
threshold
interesting degree
分类号
TP393.09 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Web日志会话的个性化识别方法的研究
被引量:
7
4
作者
董志锋
陈俊杰
付裕峰
机构
太原理工大学计算机与软件学院
山西省网络管理中心系统部
出处
《计算机工程与应用》
CSCD
北大核心
2008年第8期179-182,共4页
基金
山西省自然科学基金( the Natural Science Foundation of Shanxi Province of China under Grant No.2006011030, No.2007011050)
文摘
会话识别是Web日志挖掘中的重要步骤。针对目前的各种会话识别方法,提出了一种改进的基于页面内容、下载时间等多个参数综合得到的针对每个用户的个性化识别方法。该方法通过使用访问时间间隔,判断是否在极大、极小两个阈值范围内来识别会话。根据页面内容、站点结构确定页面重要程度,通过页面的信息容量确定用户正常的阅读时间,通过Web日志中页面下载时间来确定起始阅读时间,对以上因素进行综合后对该阈值进行调整。实验结果表明,相对于目前的对所有用户页面使用单一先验阈值进行会话识别的方法及使用针对用户页面的阈值动态调整方法,提出的方法能更准确地个性化确定出页面访问时间阈值,更为合理有效。
关键词
WEB挖掘
会话识别
预处理
阈值
Keywords
Web mining
session
data preprocessing
threshold
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Web日志预处理中优化的会话识别方法
被引量:
11
5
作者
方元康
胡学钢
夏启寿
机构
合肥工业大学计算机与信息学院
池州学院计算机中心
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第7期49-51,共3页
基金
国家自然科学基金资助项目(050504F)
池州学院自然科学基金资助项目(XK0829)
文摘
针对Web日志数据预处理中会话识别这一重要环节,提出一种优化的会话识别算法。在用户识别后,通过过滤框架页面大幅度减少实验产生的有效页面数,为每个页面设置访问时间阈值,并根据页面重要程度对该阈值进行调整,页面的重要性由页面内容及站点结构确定。实验数据显示,与对所有页面使用单一的先验阈值进行会话识别的方法相比较,该方法得到了真实性更强的会话集。
关键词
WEB挖掘
数据预处理
阈值
Frame页面
会话识别
Keywords
Web mining
data preprocessing
threshold
Frame page
session
identification
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
优化的Web日志会话识别方法
被引量:
3
6
作者
方元康
王汝传
机构
池州学院计算机系
南京邮电大学计算机科学与技术系
出处
《计算机工程与设计》
CSCD
北大核心
2009年第7期1688-1690,共3页
基金
国家自然科学基金项目(60573141
70271050)
+1 种基金
江苏省计算机信息处理技术重点实验室基金项目(kjs050001)
池州学院自然科学基金项目(2007XJ015)
文摘
关于Web使用挖掘中的会话识别问题,提出了一种改进的会话识别方法。统计每个页面的访问时间,并结合页面内容及站点结构生成页面访问时间阈值,再用页面访问时间阈值划分会话,然后对产生的会话集使用会话重组,即合并与断开的方法,对生成的会话集进行进一步地优化。通过实验结果表明,该方法所得到的会话集更具有真实性。
关键词
WEB挖掘
数据预处理
阈值
会话
Keywords
web mining
data preprocessing
threshold
session
s
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
改进的Web访问日志会话识别算法
被引量:
8
7
作者
严奉华
刘建平
杨凡丁
机构
浙江理工大学信息电子学院
出处
《计算机工程与设计》
CSCD
北大核心
2008年第22期5685-5687,5690,共4页
文摘
针对Web日志挖掘中的会话识别问题,分别对Timeout方法、参引长度法进行改进,提出了一种改进的会话识别方法。该方法运用网站的拓扑结构信息,动态设定各页面的时间间隔阀值,使页面时间间隔阀值同页面的重要程度结合起来。同时通过灵活界定内容页,并针对内容页,提出了一些启发式规则,突破了"参引长度法"所固有的一个会话中只包含一个内容页的瓶颈。该方法提高了会话识别的准确度,实验结果表明是有效的。
关键词
WEB日志挖掘
数据预处理
会话
内容页
时间阀值
启发式规则
Keywords
web log mining
data preprocessing
session
content page
time
threshold
heuristics rule
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Web日志挖掘中会话识别方法研究
被引量:
4
8
作者
张毅
机构
浙江万里学院
出处
《计算机应用与软件》
CSCD
2010年第6期92-94,共3页
基金
浙江省教育厅科研计划基金项目(200070733)
文摘
提出一种新的基于时间阈值会话识别算法,在时间阈值的计算上,既考虑了站点页面内容和结构的差异性,同时也考虑了访问者的个体差异性。相对于所有用户使用单一先验阈值和使用统计方法结合页面内容确定阈值的方法,方法能更准确地确定页面访问时间阈值,进行会话识别时具有更高的效率和真实性。
关键词
WEB日志挖掘
会话识别
阈值
数据预处理
Keywords
Web log mining
session
identification
threshold
Data pre-processing
分类号
TP274.2 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
一种改进的Web日志会话识别方法
被引量:
7
9
作者
方元康
胡学钢
夏启寿
机构
合肥工业大学计算机信息学院
池州学院计算机中心
出处
《计算机技术与发展》
2008年第11期214-216,共3页
基金
安徽省自然科学基金项目(KJ2008B116)
池州学院自然科学基金项目(XK0829)
文摘
会话识别是Web日志挖掘中的数据预处理中的一个重要步骤。文中提出了一种改进的会话识别方法。首先,在用户识别后,进行框架页面的过滤,从而大大地减少了实验产生的有效页面,然后为页面设置访问时间阈值,并根据页面内容及站点结构确定的页面重要程度对该阈值进行调整。通过实验证明,相对于传统的对所有页面使用单一的先验阈值进行会话识别的方法,该方法所得到的会话集更具有真实性。
关键词
WEB挖掘
数据预处理
阈值
Frame页面
会话识别
Keywords
Web mining
data preprocessing
threshold
frame page
session
ident ification
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于聚类的Web用户会话识别优化方法
被引量:
1
10
作者
凌海峰
余笪
机构
合肥工业大学管理学院
过程优化与智能决策教育部重点实验室
出处
《计算机应用研究》
CSCD
北大核心
2012年第8期2862-2864,共3页
基金
国家自然科学基金资助项目(71071047)
高等学校博士学科点专项科研基金资助项目(20090111110016)
+1 种基金
安徽省自然科学基金资助项目(1208085MG120)
合肥工业大学博士专项基金资助项目(2010HGBZ0301)
文摘
会话识别是用户访问行为分析的基础和关键工作,其质量对于识别和发现用户的信息需求具有决定性的影响。目前常用的是基于时间阈值的切分方法,但是该方法存在的主要问题是针对不同用户时间阈值难以准确地确定。提出了一种新的基于聚类技术的会话识别优化方法,首先建立了基于聚类的会话识别优化模型,然后采用改进的K-means算法进行会话识别。实验结果表明该方法与传统方法相比具有较好的效果。
关键词
Web用户会话识别
K-MEANS算法
时间阈值
Keywords
Web user
session
reconstruction
K-means algorithm
time
threshold
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
动态段阈值机制在P2Cast VoD系统中的应用
11
作者
鲁宏伟
宋玉磊
机构
华中科技大学计算机科学与技术学院
出处
《计算机工程与科学》
CSCD
2007年第9期58-59,100,共3页
文摘
本文对一种新型的视频点播系统P2Cast视频点播系统的关键技术进行了研究,针对段阈值在系统的可扩展性方面以及视频服务质量方面所起的重要作用,结合补丁流算法和客户节点的请求速率提出了一种嵌入动态调节段阈值机制的BF改进算法。该算法在一定程度上提高了P2Cast视频点播系统的性能。
关键词
P2Cast
VOD
BF算法
段阅值
Keywords
P2Cast VoD
BF algorithm
session threshold
分类号
TP37 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
Web日志挖掘中数据预处理技术研究
被引量:
2
12
作者
方元康
胡学钢
夏启寿
机构
合肥工业大学计算机信息学院
池州学院计算机中心
出处
《安庆师范学院学报(自然科学版)》
2008年第3期107-110,113,共5页
基金
安徽省教育厅自然科学基金资助(XK0829)
池州学院自然科学基金资助(2007XJ015)
文摘
Web日志挖掘的基本思想是将数据挖掘技术应用于Web日志数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web日志挖掘的数据源最主要的是Web日志,根据Web日志的特点,在预处理过程中的会话识别阶段给出一种基于过滤框架网页与页面访问时间阈值相结合的会话识别方法,实验数据验证说明该方法可以显著地提高Web日志挖掘结果的兴趣性。
关键词
WEB挖掘
数据预处理
阈值
Frame页面
会话识别
Keywords
web mining
data preprocessing
threshold
Frame page
session
reconstruction
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于框架网页与页面阈值的会话识别算法
13
作者
方元康
胡学钢
夏启寿
朱勇
机构
池州学院计算机中心
合肥工业大学计算机与信息学院
出处
《计算机应用与软件》
CSCD
2009年第1期18-19,27,共3页
基金
国家自然科学基金项目(050504F)
安徽省教育厅自然科学基金项目(XK0829)
安徽省教育厅自然科学基金项目(KJ2008B45ZC)
文摘
会话识别是Web日志预处理过程中的一个重要环节,针对传统会话识别的不足,提出一种改进的会话识别算法。在识别出具体的用户之后,过滤大量的框架网页;然后根据每个页面的内容及网站结构,构造出相对合理的页面访问时间阈值,并以此阈值来进行用户的会话识别。最后通过实验数据,与几种传统的会话识别方法进行了比较,表明该算法更为合理有效。
关键词
WEB挖掘
数据预处理
阈值
Frame页面
会话识别
Keywords
Web mining Data preprocessing
threshold
Frame page
session
identification
分类号
TP274.2 [自动化与计算机技术—检测技术与自动化装置]
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于时间密度的Web日志用户浏览行为分析
14
作者
庄力可
张长水
勒中坚
机构
清华大学智能技术与系统国家重点实验室
江西财经大学计算机系
出处
《计算机科学》
CSCD
北大核心
2004年第4期108-112,共5页
文摘
本文针对Web日志中用户会话识别阈值问题,给出一种基于时间密度的频度分析方法。文中首先将基于时间间隔参数刻度的用户访问频度定义为一个随机向量,给出了随机向量的切尾算法;然后建立频度与IP用户的相关矩阵,矩阵的列为访问频度,矩阵的行为用户IP,矩阵中的每一个值为某一时间间隔的访问频度。通过列向量的聚类分析,对不同类别用户的访问行为进行探讨。最后,对会话识别的阈值进行参数估计。并通过抽样对阈值进行检测和参数修正。
关键词
INTERNET
网络行为
时间密度
WEB日志
频度分析方法
Keywords
Web log mining, Time interval, Frequency distribution, Random vector,
threshold
of
session
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Web使用挖掘中的会话识别算法研究
15
作者
王新房
邓小刚
机构
西安理工大学计算机科学与工程学院
出处
《计算机工程与设计》
CSCD
北大核心
2009年第7期1685-1687,1693,共4页
文摘
在Web使用挖掘的研究领域中,很多传统的会话识别算法效率不高,得到的会话往往也不是很精确,从而影响了最终的挖掘结果。针对这种现状,研究了Web使用挖掘中的数据预处理和会话识别过程,并提出一种Markov链模型结合动态时间阀值的会话识别新算法。实验结果表明,这种方法比其它传统的算法的表现有显著提高。
关键词
WEB使用挖掘
数据预处理
会话识别
MARKOV链模型
动态时间阀值算法
Keywords
web usage mining
data preprocessing
session
reconstruction
Markov chain model
dynamic
threshold
s heuristics
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
web日志挖掘中会话识别方法
被引量:
1
16
作者
袁艺
陈海光
机构
上海师范大学信息与机电工程学院
出处
《上海师范大学学报(自然科学版)》
2016年第5期593-598,共6页
文摘
通过对传统web会话识别方法分析和比较,改进了目前最常用的基于时间阈值会话识别方法,提出了一种基于动态阈值会话识别方法,该算法采用动态计算会话中请求记录间的平均时间间隔和动态计算会话中页面的平均大小相结合的方法,根据用户和网页的特点动态调整阈值,相对于传统单一的先验阈值,该方法可以根据不同的用户访问不同的页面生成动态的阈值,充分运用用户和网页信息.经过实验验证,该方法可以识别出更多的用户会话,且识别会话的准确率和查全率也比传统算法更高.
关键词
WEB挖掘
会话识别
时间阈值
数据预处理
Keywords
web mining
session
identification
threshold
data preprocessing
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
Web使用挖掘中的会话识别算法
被引量:
1
17
作者
周方
周根宝
机构
内蒙古农业大学计算机与信息工程学院
出处
《内蒙古农业大学学报(自然科学版)》
CAS
北大核心
2010年第4期234-236,共3页
基金
内蒙古自治区自然科学基金(200408020110)
文摘
针对Web日志挖掘中的会话识别问题,在最常用的Timeout方法的基础上,提出了一种改进的基于平均时间阈值的识别方法。通过动态计算会话中请求记录间的平均时间间隔,个性化地调整页面的时间阈值,相对于传统的时所有用户页面使用单一的先验阈值,该方法能够更准确地识别出长对话。最后对生成的侯选会话集进行二次识别,使识别出的会话更为合理有效。实验结果表明,会话质量得到了提高。
关键词
WEB挖掘
数据预处理
会话识别
时间阈值
Keywords
web mining
data preparation
session
identification
threshold
分类号
TP301.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
改进的页面与时间阈值的会话识别法
被引量:
1
18
作者
郑立山
滕少华
机构
广东工业大学计算机学院
出处
《计算机应用与软件》
CSCD
北大核心
2012年第10期197-199,275,共4页
基金
广东省自然科学基金项目(06021484
9151009001000007)
文摘
会话识别是Web日志挖掘的基础,提高会话的识别率能为后续模式的挖掘提供准确可靠的数据,已有许多研究集中于此。在常用的计算时间阈值识别方法的基础上,提出一种改进的基于URL页面类型、页面信息量和停留时间的平均阈值识别方法。针对不同的URL页面类型采用不同的阈值计算方法,并设置时间阈值。相对于已有的对所有用户访问页面使用单一的先验阈值和现有动态阈值计算,该方法能够更真实地反映用户会话的情况,且识别的准确率有了较大提高。
关键词
WEB日志挖掘
数据预处理
用户会话识别
动态阈值
Keywords
Web log mining Data preprocessing User
session
identification Dynamic
threshold
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
基于动态阈值分配的流媒体边缘云会话迁移策略
被引量:
4
19
作者
姜同全
王子磊
奚宏生
机构
中国科学技术大学自动化系
出处
《计算机工程》
CAS
CSCD
北大核心
2017年第1期55-60,共6页
基金
国家"863"计划项目(2014AA06A503)
国家自然科学基金(61233003)
中央高校基本科研业务费专项资金项目(WK3500000002)
文摘
云模式下的流媒体服务系统需要有效与平滑的资源调度。传统的last-minute迁移大多只将负载信息用于迁移策略计算,但当流行度动态波动时,间接且单一的方法无法做出准确的策略调整。为此,将流行度分布应用于迁移模型中,提出一种基于动态阈值分配的会话迁移策略,依据流行度分布,确定每台服务器上各类视频的会话分配阈值,通过分配阈值的指导性避免请求接入及会话迁移的盲目性。实验结果表明,该策略能有效改善请求接受率,并保持较低的迁移代价。
关键词
流媒体边缘云
资源调度
会话迁移
流行度分布
动态阈值分配
迁移代价
Keywords
resource scheduling
session
migration
distribution of popularity
dynamic
threshold
allocation
migration cost
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于簇结构的移动Ad Hoc网络的认证协议
被引量:
2
20
作者
冯雪玲
于炯
马俊
曹宏庆
机构
新疆大学电气工程学院
新疆大学软件学院
出处
《计算机技术与发展》
2008年第9期127-130,共4页
基金
新疆自治区高校科研计划重点项目(XJEDU2004I03)
文摘
与传统网络比较,移动Ad Hoc网络具有拓扑结构不稳定、终端能源有限、有限带宽及自组织等特点,这使得Ad Hoc网络的安全问题成了一个极具挑战性的研究课题,而安全问题中认证是基础。文中提出一种基于分簇结构的移动Ad Hoc网络的认证协议,结合门限加密机制和分布式密钥管理方案,实现各级簇头及簇成员的分布式认证。有效防止了恶意节点对消息的截取、修改、伪造、监视和窃听等外部攻击和防范内部被攻破认证节点对分布式认证的干扰。
关键词
移动AD
HOC网络
簇头
认证
门限加密机制
会议密钥
Keywords
mobile Ad Hoc network
cluster head
attthentication
threshold
cryptography mechanism
session
key
分类号
TP393.08 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
Web日志挖掘中的会话识别算法
蔡浩
贾宇波
黄成伟
黄志强
《计算机工程与设计》
CSCD
北大核心
2009
11
下载PDF
职称材料
2
Web使用挖掘中的一种改进的会话识别方法
殷贤亮
张为
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2006
27
下载PDF
职称材料
3
Web日志预处理中会话识别的优化
朱晋华
陈俊杰
《太原理工大学学报》
CAS
北大核心
2008
10
下载PDF
职称材料
4
Web日志会话的个性化识别方法的研究
董志锋
陈俊杰
付裕峰
《计算机工程与应用》
CSCD
北大核心
2008
7
下载PDF
职称材料
5
Web日志预处理中优化的会话识别方法
方元康
胡学钢
夏启寿
《计算机工程》
CAS
CSCD
北大核心
2009
11
下载PDF
职称材料
6
优化的Web日志会话识别方法
方元康
王汝传
《计算机工程与设计》
CSCD
北大核心
2009
3
下载PDF
职称材料
7
改进的Web访问日志会话识别算法
严奉华
刘建平
杨凡丁
《计算机工程与设计》
CSCD
北大核心
2008
8
下载PDF
职称材料
8
Web日志挖掘中会话识别方法研究
张毅
《计算机应用与软件》
CSCD
2010
4
下载PDF
职称材料
9
一种改进的Web日志会话识别方法
方元康
胡学钢
夏启寿
《计算机技术与发展》
2008
7
下载PDF
职称材料
10
基于聚类的Web用户会话识别优化方法
凌海峰
余笪
《计算机应用研究》
CSCD
北大核心
2012
1
下载PDF
职称材料
11
动态段阈值机制在P2Cast VoD系统中的应用
鲁宏伟
宋玉磊
《计算机工程与科学》
CSCD
2007
0
下载PDF
职称材料
12
Web日志挖掘中数据预处理技术研究
方元康
胡学钢
夏启寿
《安庆师范学院学报(自然科学版)》
2008
2
下载PDF
职称材料
13
基于框架网页与页面阈值的会话识别算法
方元康
胡学钢
夏启寿
朱勇
《计算机应用与软件》
CSCD
2009
0
下载PDF
职称材料
14
基于时间密度的Web日志用户浏览行为分析
庄力可
张长水
勒中坚
《计算机科学》
CSCD
北大核心
2004
0
下载PDF
职称材料
15
Web使用挖掘中的会话识别算法研究
王新房
邓小刚
《计算机工程与设计》
CSCD
北大核心
2009
0
下载PDF
职称材料
16
web日志挖掘中会话识别方法
袁艺
陈海光
《上海师范大学学报(自然科学版)》
2016
1
下载PDF
职称材料
17
Web使用挖掘中的会话识别算法
周方
周根宝
《内蒙古农业大学学报(自然科学版)》
CAS
北大核心
2010
1
下载PDF
职称材料
18
改进的页面与时间阈值的会话识别法
郑立山
滕少华
《计算机应用与软件》
CSCD
北大核心
2012
1
下载PDF
职称材料
19
基于动态阈值分配的流媒体边缘云会话迁移策略
姜同全
王子磊
奚宏生
《计算机工程》
CAS
CSCD
北大核心
2017
4
下载PDF
职称材料
20
基于簇结构的移动Ad Hoc网络的认证协议
冯雪玲
于炯
马俊
曹宏庆
《计算机技术与发展》
2008
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部