期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
一种基于有向树挖掘Web日志中最大频繁访问模式的方法 被引量:9
1
作者 詹宇斌 殷建平 +2 位作者 张玲 龙军 程杰仁 《计算机应用》 CSCD 北大核心 2006年第7期1662-1665,共4页
提出了一种基于Apriori思想的挖掘最大频繁访问模式的s-Tree算法。该算法使用有向树表示用户会话,能挖掘出最大前向引用事务和用户的浏览偏爱路径;使用一种基于内容页面优先的支持度计算方法,能挖掘出传统算法不能发现的特定的用户访问... 提出了一种基于Apriori思想的挖掘最大频繁访问模式的s-Tree算法。该算法使用有向树表示用户会话,能挖掘出最大前向引用事务和用户的浏览偏爱路径;使用一种基于内容页面优先的支持度计算方法,能挖掘出传统算法不能发现的特定的用户访问模式;使用频繁模式树连接分层的频繁弧克服了图结构数据挖掘算法中直接连接两个频繁模式树要判断连接条件的缺点,同时采用预剪枝策略,降低了算法的开销。实验表明,s-Tree算法具有可扩展性,运行效率比直接采用图结构数据挖掘算法要高。 展开更多
关键词 WEB使用挖掘 最大频繁访问模式 有向树 WEB日志
下载PDF
Web挖掘中基于GITC算法发现用户频繁访问模式 被引量:1
2
作者 欧阳一鸣 郭维 +1 位作者 郭骏 孙超超 《计算机工程与应用》 CSCD 北大核心 2007年第7期191-194,共4页
用户频繁访问模式的发现是Web日志挖掘的重要研究内容。提出了一种先求两两用户访问模式的交集结果再生成候选频繁访问模式,然后扫描数据库,统计各个候选频繁访问模式的支持度计数的GITC算法。经过理论分析和实验验证,该算法能有效地发... 用户频繁访问模式的发现是Web日志挖掘的重要研究内容。提出了一种先求两两用户访问模式的交集结果再生成候选频繁访问模式,然后扫描数据库,统计各个候选频繁访问模式的支持度计数的GITC算法。经过理论分析和实验验证,该算法能有效地发现用户频繁访问模式。 展开更多
关键词 WEB日志挖掘 类Apriori算法 交集关系 最大前向引用 频繁访问模式
下载PDF
一种新的Web频繁访问模式挖掘算法 被引量:4
3
作者 章志明 余敏 黄明和 《微计算机信息》 北大核心 2007年第18期184-186,共3页
提出了一种基于有向图的从Web日志中挖掘用户频繁访问模式的新算法,与传统使用基于关联规则挖掘的序列模式挖掘技术相比,本算法采用有向图来记录Web访问序列和它的计数,在挖掘过程中只需要扫描数据库一次,不产生数量庞大的候选模式,即... 提出了一种基于有向图的从Web日志中挖掘用户频繁访问模式的新算法,与传统使用基于关联规则挖掘的序列模式挖掘技术相比,本算法采用有向图来记录Web访问序列和它的计数,在挖掘过程中只需要扫描数据库一次,不产生数量庞大的候选模式,即可直接挖掘出所有的Web频繁访问路径,大大提高了Web访问模式的发现效率。 展开更多
关键词 WEB挖掘 访问模式 频繁访问模式
下载PDF
存储系统中的频繁访问模式挖掘
4
作者 朱旭东 卜庆忠 +2 位作者 柯剑 那文武 许鲁 《高技术通讯》 EI CAS CSCD 北大核心 2009年第7期699-705,共7页
研究、分析了影响经典的模式挖掘方法挖掘频繁访问模式的效率,使其难以被存储系统接受的主要因素——噪音的产生原因和表现类型,提出一种具有噪音过滤能力,适应存储系统频繁访问序列模式挖掘的新方法——Z-Miner。Z-Miner使用全局分支... 研究、分析了影响经典的模式挖掘方法挖掘频繁访问模式的效率,使其难以被存储系统接受的主要因素——噪音的产生原因和表现类型,提出一种具有噪音过滤能力,适应存储系统频繁访问序列模式挖掘的新方法——Z-Miner。Z-Miner使用全局分支裁剪和分支聚类方法来过滤噪音,对实际系统工作负载的模拟结果显示,Z-Miner指导的预取可以使缓存失效率降低40%~66%,平均响应时间降低26%~66%。相对经典挖掘方法,Z-Miner的挖掘开销有1~2个数量级的下降,而预取优化效果提高了1倍。 展开更多
关键词 频繁访问模式 数据块关系 序列模式挖掘 聚类 预取
下载PDF
Web挖掘中基于RD_Apriori算法发现用户频繁访问模式 被引量:5
5
作者 陈敏 欧阳一鸣 刘红樱 《微电子学与计算机》 CSCD 北大核心 2005年第5期4-7,共4页
从Web日志数据中发现用户的频繁访问模式,可分为两步进行。首先把经过预处理后的日志数据转换为最大前向引用的集合,然后使用Apriori算法挖掘出频繁访问模式。本文针对挖掘的第二步提出了一种基于缩减数据库(ReducedDatabase)的RD_Apri... 从Web日志数据中发现用户的频繁访问模式,可分为两步进行。首先把经过预处理后的日志数据转换为最大前向引用的集合,然后使用Apriori算法挖掘出频繁访问模式。本文针对挖掘的第二步提出了一种基于缩减数据库(ReducedDatabase)的RD_Apriori算法,此算法能够准确、高效地挖掘各种长度不同的频繁访问模式。 展开更多
关键词 WEB挖掘 访问模式 频繁访问模式 相邻访问模式 连续度 相邻访问模式
下载PDF
Web挖掘中基于交集算法发现用户频繁访问模式
6
作者 郭维 欧阳一鸣 郭骏 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第12期1511-1515,共5页
文章提出了一种基于交集关系原理的算法叫做交集算法,它与类Apriori算法本质上互补。这种算法的最大优势是不需要产生大量的候选频繁访问模式,就可以直接生成最大频繁访问模式,因此在挖掘过程中也就不需要反复扫描原始数据库来计算各个... 文章提出了一种基于交集关系原理的算法叫做交集算法,它与类Apriori算法本质上互补。这种算法的最大优势是不需要产生大量的候选频繁访问模式,就可以直接生成最大频繁访问模式,因此在挖掘过程中也就不需要反复扫描原始数据库来计算各个候选频繁访问模式的支持度计数;经理论分析和试验证明,交集算法具有一定的理论意义和应用价值。 展开更多
关键词 WEB日志挖掘 类Apriori算法 交集算法 最大前向引用 频繁访问模式
下载PDF
基于BIPL的Web频繁访问模式挖掘
7
作者 吴雅双 张东站 《计算机工程与应用》 CSCD 北大核心 2008年第23期136-138,156,共4页
挖掘频繁访问模式是Web日志挖掘的一个重要任务。针对类Apriori算法和GITC算法的不足,提出了基于双亲链的单次扫描求交的Web频繁访问模式挖掘算法—BIPL,该算法首先对用户的访问模式两两进行交集运算,生成候选访问模式,并在求交集过程... 挖掘频繁访问模式是Web日志挖掘的一个重要任务。针对类Apriori算法和GITC算法的不足,提出了基于双亲链的单次扫描求交的Web频繁访问模式挖掘算法—BIPL,该算法首先对用户的访问模式两两进行交集运算,生成候选访问模式,并在求交集过程中保存各个候选访问模式的双亲模式,然后通过简单的求和运算,计算出各个候选访问模式的支持数。最后通过理论分析和实验验证,该算法是稳定的和高效的。 展开更多
关键词 WEB日志挖掘 交集关系 频繁访问模式
下载PDF
基于关联规则的用户频繁访问模式研究 被引量:2
8
作者 柴巧叶 《太原师范学院学报(自然科学版)》 2011年第2期87-89,共3页
Web挖掘是将数据挖掘和WWW两个领域中的多种技术和方法结合起来的热门研究课题.它的研究领域包括Web内容挖掘、Web结构挖掘和Web使用挖掘.关联规则算法已成为数据挖掘算法中的重要课题.通过对关联规则挖掘算法进行分析,指出了该算法存... Web挖掘是将数据挖掘和WWW两个领域中的多种技术和方法结合起来的热门研究课题.它的研究领域包括Web内容挖掘、Web结构挖掘和Web使用挖掘.关联规则算法已成为数据挖掘算法中的重要课题.通过对关联规则挖掘算法进行分析,指出了该算法存在的一些问题,并提出了一种用户频繁访问模式结构. 展开更多
关键词 关联规则 用户频繁访问模式 挖掘
下载PDF
一种基于Close模式发现用户频繁访问路径的方法 被引量:2
9
作者 陈敏 苗夺谦 《计算机工程》 CAS CSCD 北大核心 2007年第8期14-16,19,共4页
Web日志挖掘的一个主要任务是获得用户的浏览模式,这对Web站点的改进和为用户提供个性化服务提供了非常有价值的潜在信息。该文在分析用户访问模式的特点后,提出了Close模式的概念,基于此概念提出了一种挖掘用户频繁访问模式的Close算... Web日志挖掘的一个主要任务是获得用户的浏览模式,这对Web站点的改进和为用户提供个性化服务提供了非常有价值的潜在信息。该文在分析用户访问模式的特点后,提出了Close模式的概念,基于此概念提出了一种挖掘用户频繁访问模式的Close算法。该算法利用频繁访问模式的封闭特性,挖掘出既是频繁的又是封闭的访问模式,在一定程度上减少了下一阶段“寻找最大频繁访问模式”的工作量。用实际数据对算法的性能进行了验证和分析。 展开更多
关键词 WEB挖掘 频繁访问模式 访问模式的顺序子集 Close模式
下载PDF
Web日志挖掘中的用户访问模式识别 被引量:2
10
作者 刘沛骞 郭海儒 袁玲玲 《雁北师范学院学报》 2006年第2期23-25,共3页
本文探索了一种新的Web日志挖掘算法,以便更有效地捕获用户访问模式.该算法首先把原始的用户访问序列转换为一个最长前向访问序列的集合,在转换中过滤掉了用户的回退操作;算法的第二步是根据第一步所得到的结果求得一个用户频繁访问... 本文探索了一种新的Web日志挖掘算法,以便更有效地捕获用户访问模式.该算法首先把原始的用户访问序列转换为一个最长前向访问序列的集合,在转换中过滤掉了用户的回退操作;算法的第二步是根据第一步所得到的结果求得一个用户频繁访问模式.算法经实验模拟测试具有较为满意的时间复杂度和空间复杂度. 展开更多
关键词 WEB日志挖掘 访问序列 频繁访问模式
下载PDF
结合DL-safe规则发现日志本体频繁模式的方法 被引量:1
11
作者 孙明 陈波 周明天 《电子学报》 EI CAS CSCD 北大核心 2010年第2期376-381,共6页
为发现语义Web使用记录中所蕴含的有效信息,本文提出了一种挖掘日志本体频繁Web访问模式的方法.该方法引入应用访问规则集和观察集分别表示日志信息动态变化的语义规则和使用事实,并在DL安全的限定下将日志本体和应用访问规则集相结合... 为发现语义Web使用记录中所蕴含的有效信息,本文提出了一种挖掘日志本体频繁Web访问模式的方法.该方法引入应用访问规则集和观察集分别表示日志信息动态变化的语义规则和使用事实,并在DL安全的限定下将日志本体和应用访问规则集相结合构成一个推理过程可判定的混合知识库.在此基础上,利用日志本体中事件整分关系的语义构建访问模式学习的事务模型,并采用ILP的方法学习生成频繁用户访问模式树,解决了推理访问模式中非描述逻辑原子的问题.实验结果表明该方法的可用性和有效性. 展开更多
关键词 语义网使用挖掘 日志本体 频繁Web访问模式 DL-safe规则 归纳逻辑编程
下载PDF
Web日志中时态约束浏览模式挖掘算法研究 被引量:3
12
作者 宁慧 李红宇 吴培莲 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2008年第9期1474-1480,共7页
为了有效地从海量的Web日志中挖掘出有用的用户浏览模式,将顺序约束和时态约束加入到快速关联规则挖掘算法中,给出了一种基于时态约束的浏览模式挖掘算法FPMBTC.该算法简化了挖掘过程中候选模式的生成操作,对数据库扫描一次,求出所有事... 为了有效地从海量的Web日志中挖掘出有用的用户浏览模式,将顺序约束和时态约束加入到快速关联规则挖掘算法中,给出了一种基于时态约束的浏览模式挖掘算法FPMBTC.该算法简化了挖掘过程中候选模式的生成操作,对数据库扫描一次,求出所有事务的连续子序列集,利用集合交差运算求得支持度,同时逐步修正会话事务时间得到浏览模式的有效时间,根据网站结构及Web日志不断变化的特点,给出了增量更新挖掘算法.实验结果表明:与类Apriori算法相关工作相比,运行时间少,扩展性好,并且挖掘出的模式具有时效性,适合于不断变化的且有时态特点的Web日志信息的挖掘.此研究对于学习和研究Web挖掘技术具有很好的参考价值,对建造实际的Web挖掘系统具有重要的理论意义和实用价值. 展开更多
关键词 WEB日志挖掘 频繁访问模式 有效时间
下载PDF
基于Web日志的用户访问推荐系统的研究与实现
13
作者 魏榴花 《电脑知识与技术(过刊)》 2010年第30期8510-8512,共3页
近年来Internet飞速发展,WWW上的网页也以指数级在增长,面对如此庞大的Web信息,用户很难找到自己所需要的信息。这里给出了一个以日志分析为基础、结合关联规则的用户访问推荐系统(UARS)的框架及其实现,将数据挖掘技术应用于Web日志,通... 近年来Internet飞速发展,WWW上的网页也以指数级在增长,面对如此庞大的Web信息,用户很难找到自己所需要的信息。这里给出了一个以日志分析为基础、结合关联规则的用户访问推荐系统(UARS)的框架及其实现,将数据挖掘技术应用于Web日志,通过数据预处理、页面统计分析和用户统计分析,最终通过关联规则挖掘发现用户的频繁访问模式,为用户访问Web站点提供推荐,提高用户访问Web站点的效率。 展开更多
关键词 日志 关联规则 数据挖掘 频繁访问模式
下载PDF
一种Web事务识别的新模型及其频繁路径挖掘 被引量:1
14
作者 战立强 刘大昕 《哈尔滨工程大学学报》 EI CAS CSCD 北大核心 2005年第6期758-762,共5页
针对已有Web事务识别模型的缺点,提出一种识别Web事务的新模型———IPRC模型.该模型根据主索引页上的引用以及文档目录结构将网页分类,并以此作为识别Web事务的依据.在此基础上提出了一种挖掘频繁访问模式的算法WDHP,该算法继承了DHP... 针对已有Web事务识别模型的缺点,提出一种识别Web事务的新模型———IPRC模型.该模型根据主索引页上的引用以及文档目录结构将网页分类,并以此作为识别Web事务的依据.在此基础上提出了一种挖掘频繁访问模式的算法WDHP,该算法继承了DHP算法使用hash树过滤候选集以及裁剪数据库的基本方法,并以访问路径树的方式将数据库存储于内存,在内存中完成后继的挖掘,不仅减少了扫描数据库的次数,而且大大降低了算法的时间复杂性.实验表明WDHP算法不仅优于DHP算法,而且也优于典型的基于内存的WAP算法. 展开更多
关键词 频繁访问模式 AP-树 hash-表
下载PDF
Web挖掘中发现用户访问模式算法的改进与分析 被引量:2
15
作者 欧阳一鸣 陈敏 +1 位作者 刘红樱 胡学钢 《模式识别与人工智能》 EI CSCD 北大核心 2005年第6期728-734,共7页
Web日志挖掘的一个主要任务是获得用户的浏览模式,这对Web站点的改进和为用户提供个性化服务提供了有价值的潜在信息。本文提出了一种改进算法——RD_Close。该算法对数据挖掘中的Close方法进行了改进,并引入了RD_Apriori方法中缩减数... Web日志挖掘的一个主要任务是获得用户的浏览模式,这对Web站点的改进和为用户提供个性化服务提供了有价值的潜在信息。本文提出了一种改进算法——RD_Close。该算法对数据挖掘中的Close方法进行了改进,并引入了RD_Apriori方法中缩减数据库的思想。这种改进算法能有效发现用户频繁访问模式。最后,用实际数据对算法性能进行了充分验证和深入分析。 展开更多
关键词 WEB挖掘 频繁访问模式 访问模式的中心交集 访问模式的中心子集 封闭访问模式
原文传递
基于Web挖掘的过程模型及算法 被引量:2
16
作者 范敏 黄席樾 石为人 《计算机应用》 CSCD 北大核心 2005年第3期646-648,共3页
针对Web信息的结构特点设计了一个发现用户访问模式的PDAS系统,并以关联规则为理论基础提出了发现单一用户K 序列频繁访问模式的过程模型及算法。经实验证明,通过该算法获得的频繁访问模式对商业网站的营销决策有一定辅助意义。
关键词 电子商务 过程模型 频繁访问模式
下载PDF
基于关联规则的Web使用挖掘系统
17
作者 姚青山 张春霞 《河南科学》 2008年第3期329-332,共4页
通过分析Web日志记录来发现用户访问行为等,进而识别电子商务中的潜在客户,提高网络信息服务的质量,优化站点结构以及得到对于个性化系统有用的信息.提出一个Web使用挖掘系统的设计方案,包括系统的体系结构、功能结构及每个功能点的详... 通过分析Web日志记录来发现用户访问行为等,进而识别电子商务中的潜在客户,提高网络信息服务的质量,优化站点结构以及得到对于个性化系统有用的信息.提出一个Web使用挖掘系统的设计方案,包括系统的体系结构、功能结构及每个功能点的详细设计.为Web使用系统开发人员提供有价值的参考信息. 展开更多
关键词 WEB挖掘 WEB使用挖掘 关联规则 频繁访问模式
下载PDF
Web日志挖掘中GITC算法的改进 被引量:3
18
作者 郭维 《计算机工程》 CAS CSCD 北大核心 2008年第4期60-62,共3页
GITC算法和Tree-DM算法都是基于交集关系的挖掘算法。文章分析这2个算法的性能特点,提出一种GITC算法的改进算法:GI算法。该算法利用适当的数据结构来保存支持数信息,省去了扫描原数据库来统计支持数耗费的大量时间,并解决了Tree-DM算... GITC算法和Tree-DM算法都是基于交集关系的挖掘算法。文章分析这2个算法的性能特点,提出一种GITC算法的改进算法:GI算法。该算法利用适当的数据结构来保存支持数信息,省去了扫描原数据库来统计支持数耗费的大量时间,并解决了Tree-DM算法在二次求交、冗余求交等方面存在的问题。经过实验验证,较GITC算法而言,GI算法可以更高效地挖掘用户频繁访问模式。 展开更多
关键词 WEB日志挖掘 频繁访问模式 交集关系
下载PDF
基于Web使用挖掘的负载测试方法 被引量:1
19
作者 薛群群 张骏温 张大林 《计算机与现代化》 2017年第2期73-77,共5页
作为保证Web应用系统稳定性和可靠性的重要手段,Web负载测试逐渐成为软件开发生命周期中很重要的一个环节。然而,区别于传统的软件测试,Web应用系统的复杂性及其用户行为的不可预见性使得Web负载测试变得很困难。针对上述问题,提出一种... 作为保证Web应用系统稳定性和可靠性的重要手段,Web负载测试逐渐成为软件开发生命周期中很重要的一个环节。然而,区别于传统的软件测试,Web应用系统的复杂性及其用户行为的不可预见性使得Web负载测试变得很困难。针对上述问题,提出一种Web使用频繁模式子树挖掘算法,从用户的访问日志中挖掘出频繁访问的Web页面,分析用户的行为特征,使得负载环境尽可能与真实世界接近。最后利用性能测试工具LoadRunner对实际项目案例进行负载测试,验证了该方法的有效性和实用性。 展开更多
关键词 负载测试 WEB使用挖掘 频繁访问模式 LOADRUNNER
下载PDF
基于Web使用数据挖掘的个性化推荐系统设计 被引量:1
20
作者 何洁 《数字技术与应用》 2012年第7期141-142,共2页
Web使用挖掘是实现个性化推荐系统的有效途径。通过对网站日志数据进行挖掘发现频繁访问模式,再结合活动用户的访问页面序列来实现个性化的在线推荐。本文从体系架构及功能模块两个方面进行分析,提出了基于Web使用数据挖掘的个性化推荐... Web使用挖掘是实现个性化推荐系统的有效途径。通过对网站日志数据进行挖掘发现频繁访问模式,再结合活动用户的访问页面序列来实现个性化的在线推荐。本文从体系架构及功能模块两个方面进行分析,提出了基于Web使用数据挖掘的个性化推荐系统架构。它包括三个方面:数据预处理、频繁访问路径挖掘及在线推荐。 展开更多
关键词 个性化服务 WEB使用挖掘 频繁访问模式 在线推荐
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部