期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
从Web日志中挖掘用户浏览偏爱路径 被引量:87
1
作者 邢东山 沈钧毅 宋擒豹 《计算机学报》 EI CSCD 北大核心 2003年第11期1518-1523,共6页
eb日志中包含了大量的用户浏览信息 ,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题 .作者在分析目前用户浏览模式挖掘算法存在的问题的基础上 ,利用提出的支持 偏爱度的概念 ,设计了网站访问矩阵 ,并基于这个矩阵提出... eb日志中包含了大量的用户浏览信息 ,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题 .作者在分析目前用户浏览模式挖掘算法存在的问题的基础上 ,利用提出的支持 偏爱度的概念 ,设计了网站访问矩阵 ,并基于这个矩阵提出了用户浏览偏爱路径挖掘算法 :先利用Web日志建立以引用网页URL为行、浏览网页URL为列、路径访问频度为元素值的网站访问矩阵 .该矩阵为稀疏矩阵 ,将该矩阵用三元组法来进行表示 .然后 ,通过对该矩阵进行支持 偏爱度计算得到偏爱子路径 .最后进行合并生成浏览偏爱路径 .实验表明该算法能准确地反映用户浏览兴趣 ,而且系统可扩展性较好 .这可以应用于电子商务网站的站点优化和个性化服务等 . 展开更多
关键词 INTERNET 拓扑结构 WEB日志 数据挖掘 网页浏览频度 用户浏览偏爱路径 电子商务
下载PDF
基于偏爱路径的个性化推荐系统 被引量:2
2
作者 张海玉 刘晓霞 王新征 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第2期213-216,共4页
目的设计实现基于偏爱路径的个性化推荐系统原型。方法通过建立Web站点访问的一种矩阵表示模型,并据此挖掘用户浏览偏爱路径。结果分析了偏爱度与置信度的区别,提出了页面平均兴趣度的概念,改进了用户浏览偏爱路径算法。引入页面平均兴... 目的设计实现基于偏爱路径的个性化推荐系统原型。方法通过建立Web站点访问的一种矩阵表示模型,并据此挖掘用户浏览偏爱路径。结果分析了偏爱度与置信度的区别,提出了页面平均兴趣度的概念,改进了用户浏览偏爱路径算法。引入页面平均兴趣度的概念,给出了Web站点访问的一种矩阵表示模型,在此基础上挖掘用户浏览偏爱路径。结论该方法能准确地反映用户浏览兴趣,证明该系统具有较高的准确性。 展开更多
关键词 偏爱路径 个性化推荐系统 数据挖掘 页面兴趣度
下载PDF
基于云计算的用户浏览偏爱路径挖掘算法 被引量:6
3
作者 程苗 《计算机工程与应用》 CSCD 北大核心 2011年第29期85-89,共5页
从Web日志中挖掘用户浏览偏爱路径是一个重要的研究课题。目前的挖掘算法注重客观访问频度,忽略了用户对这一频繁访问路径是否感兴趣。在分析目前用户偏爱路径挖掘算法存在的问题的基础上,结合网站拓扑结构图修正基于频度的用户偏爱路... 从Web日志中挖掘用户浏览偏爱路径是一个重要的研究课题。目前的挖掘算法注重客观访问频度,忽略了用户对这一频繁访问路径是否感兴趣。在分析目前用户偏爱路径挖掘算法存在的问题的基础上,结合网站拓扑结构图修正基于频度的用户偏爱路径的衡量标准,提出了有用偏爱度的概念,从而剔除由于页面放置和链接等因素对挖掘的影响;针对目前基于单一节点的挖掘系统的计算能力不足的问题,利用云计算的分布式处理和虚拟化技术的优势,给出了一种基于云计算的数据处理方法,在此基础上挖掘用户浏览偏爱路径。实验表明,该算法针对大数据量的日志进行挖掘,准确率和效率比普通基于频度进行用户浏览偏爱路径挖掘的算法有所提高。 展开更多
关键词 浏览偏爱路径 云计算 WEB使用挖掘 WEB 日志
下载PDF
一种新的基于事物聚类Web浏览偏爱路径挖掘算法 被引量:1
4
作者 李晓静 王树森 《制造业自动化》 北大核心 2013年第4期65-67,86,共4页
目前的挖掘算法单纯考虑了用户的访问频度,而忽略了用户对访问路径的兴趣度。本文通过分析目前用户偏爱路径挖掘算法存在的问题,结合事物聚类算法,将雅克比系数与最长公共路径系数相乘,得到更准确地用户相似集,并基于一个三元组模型构... 目前的挖掘算法单纯考虑了用户的访问频度,而忽略了用户对访问路径的兴趣度。本文通过分析目前用户偏爱路径挖掘算法存在的问题,结合事物聚类算法,将雅克比系数与最长公共路径系数相乘,得到更准确地用户相似集,并基于一个三元组模型构造以页面兴趣度为元素值的网站浏览数据矩阵,采用改进的挖掘算法计算用户偏爱度和访问兴趣度,降低访问页面闲置及链接等因素对数据挖掘的影响;实验结果表明,该算法针对Web日志海量数据进行挖掘,具有较高的效率和准确率。 展开更多
关键词 事物聚类算法 数据挖掘 WEB日志 浏览偏爱路径
下载PDF
基于Web日志的频繁偏爱路径挖掘算法 被引量:3
5
作者 蔡俊 宋顺林 《计算机工程与设计》 CSCD 北大核心 2009年第24期5615-5617,5621,共4页
为了挖掘出更能如实反映Web用户兴趣偏好的使用模式,充分考虑了用户在页面的停留时间和点击次数两个因素,给出了频繁偏爱路径的定义,并提出了频繁偏爱路径的挖掘算法,该方法在求得最大向前路径的基础上,迭代产生更长的候选频繁偏爱路径... 为了挖掘出更能如实反映Web用户兴趣偏好的使用模式,充分考虑了用户在页面的停留时间和点击次数两个因素,给出了频繁偏爱路径的定义,并提出了频繁偏爱路径的挖掘算法,该方法在求得最大向前路径的基础上,迭代产生更长的候选频繁偏爱路径,通过计算候选路径的频繁偏爱支持度来判断其是否为频繁偏爱路径。利用真实日志数据进行实验,实验结果表明,该算法具有较高的覆盖率和准确性。 展开更多
关键词 数据挖掘 用户会话 频繁偏爱支持度 最大向前路径 频繁偏爱路径
下载PDF
一种从Web日志中挖掘用户浏览偏爱路径的算法 被引量:1
6
作者 杨旭东 《重庆理工大学学报(自然科学)》 CAS 2012年第10期82-88,共7页
针对当前Web站点设计与管理的复杂性以及优化其拓扑结构的需要,提出了一种从Web日志中挖掘用户浏览偏爱路径的算法。该算法引入反映页面浏览频率的访问矩阵与支持-偏爱度,得到访问矩阵行向量间的Hamming距离矩阵,将相似性阈值与其元素... 针对当前Web站点设计与管理的复杂性以及优化其拓扑结构的需要,提出了一种从Web日志中挖掘用户浏览偏爱路径的算法。该算法引入反映页面浏览频率的访问矩阵与支持-偏爱度,得到访问矩阵行向量间的Hamming距离矩阵,将相似性阈值与其元素值逐一比较,获得候选兴趣子路径2-项集,根据支持-偏爱度阈值,将子路径集中不符的子路径剔除,合并子路径,生成用户浏览偏爱路径。实验结果证明了该算法的有效性。 展开更多
关键词 浏览偏爱路径 站点访问矩阵 支持-偏爱 HAMMING距离 WEB日志挖掘
下载PDF
一种新的基于Web日志的挖掘用户浏览偏爱路径的方法 被引量:4
7
作者 任永功 付玉 +1 位作者 张亮 吕君义 《计算机科学》 CSCD 北大核心 2008年第10期192-196,共5页
提出了一种新的基于Web日志的挖掘用户浏览偏爱路径的方法。该方法首先在单元数组存储结构(存储矩阵)基础上建立以浏览兴趣度为基本元素的会话矩阵和路径矩阵。然后,在会话矩阵上采用两个页面向量夹角余弦作为相似用户的页面距离公式进... 提出了一种新的基于Web日志的挖掘用户浏览偏爱路径的方法。该方法首先在单元数组存储结构(存储矩阵)基础上建立以浏览兴趣度为基本元素的会话矩阵和路径矩阵。然后,在会话矩阵上采用两个页面向量夹角余弦作为相似用户的页面距离公式进行页面聚类,求得相似用户的相关页面集。最后,利用路径选择偏爱度在相似用户的路径矩阵上挖掘出相似用户的浏览偏爱路径。实验证明此方法是合理有效的,能够得到更准确的偏爱路径。 展开更多
关键词 浏览兴趣度 路径选择偏爱 WEB日志 矩阵 页面聚类
下载PDF
基于Web使用挖掘的用户有效偏爱浏览路径研究
8
作者 黄伟建 冯立娟 《科学技术与工程》 北大核心 2014年第9期222-226,共5页
在浏览偏爱路径研究的基础上提出了网络拓扑结构加权的方法,与用户浏览路径进行结合得到用户实际浏览偏爱路径。设定网络拓扑主干路径的权值小于远离主干路径的路径权值,远离主干路径的高频路径是网络拓扑设计者期望得到的有效信息,能... 在浏览偏爱路径研究的基础上提出了网络拓扑结构加权的方法,与用户浏览路径进行结合得到用户实际浏览偏爱路径。设定网络拓扑主干路径的权值小于远离主干路径的路径权值,远离主干路径的高频路径是网络拓扑设计者期望得到的有效信息,能够较好地用于改进网站设计,进而提高用户服务质量。最后与NPPMA算法在有效度方面进行了比较,以此证明算法的可取之处。 展开更多
关键词 使用挖掘 偏爱路径 浏览路径 网络拓扑
下载PDF
使用语言最小支持度和偏爱度挖掘偏爱的模糊浏览路径
9
作者 吴瑞 《小型微型计算机系统》 CSCD 北大核心 2007年第6期1098-1102,共5页
提出了使用语言最小支持度和偏爱度的web日志挖掘方法.表示用户兴趣和偏爱程度的支持度和偏爱度被刻画成相应的模糊语言变量,通过与最小语言支持度和偏爱度(模糊语言变量)比较,判定该网页是否是一个用户偏爱网页,这种语言的输入输出更... 提出了使用语言最小支持度和偏爱度的web日志挖掘方法.表示用户兴趣和偏爱程度的支持度和偏爱度被刻画成相应的模糊语言变量,通过与最小语言支持度和偏爱度(模糊语言变量)比较,判定该网页是否是一个用户偏爱网页,这种语言的输入输出更自然更易理解.此外,网页上的浏览时间也是反映用户兴趣和偏爱的一个重要因素,它也被表示成相应的模糊语言变量,既体现不同网页浏览时间的不同,也可以忽略它们之间的细微差别.所获得的带有模糊时间的用户偏爱浏览路径更能反映用户的兴趣和偏爱性. 展开更多
关键词 WEB使用挖掘 模糊语言变量 用户偏爱浏览路径 支持度 偏爱
下载PDF
基于Web日志挖掘用户偏爱浏览路径算法
10
作者 苏兰 陆济湘 《电脑知识与技术》 2016年第2Z期221-223,共3页
该文提出一种改进的基于Web日志挖掘用户偏爱浏览路径算法。通过引入站点拓扑结构图来建立用户的访问矩阵,使用夹角余弦公式求出访问矩阵的相似度矩阵,将相似度高的页面归为一类,称为基于相似度矩阵的用户偏爱浏览路径候选集,引入访问... 该文提出一种改进的基于Web日志挖掘用户偏爱浏览路径算法。通过引入站点拓扑结构图来建立用户的访问矩阵,使用夹角余弦公式求出访问矩阵的相似度矩阵,将相似度高的页面归为一类,称为基于相似度矩阵的用户偏爱浏览路径候选集,引入访问矩阵的权重矩阵来降低由于主干路径访问频度高而对挖掘结果造成的影响,结合访问权重利用有效偏爱度过滤上述的候选项集,得出基于权重的用户偏爱浏览路径项集,最后通过合并这些项集得到符合用户浏览习惯的偏爱路径。实验表明该算法更能反映用户真实的浏览兴趣与意图。 展开更多
关键词 偏爱浏览路径 相似度矩阵 权重矩阵 有效偏爱
下载PDF
基于Web日志挖掘用户的浏览兴趣路径 被引量:5
11
作者 王思宝 李银胜 《计算机应用与软件》 CSCD 北大核心 2012年第1期164-167,共4页
提出一种基于Web日志发现用户浏览偏爱路径算法。引入了支持-兴趣度概念。建立用户访问矩阵以表示用户浏览网页行为,并获得访问矩阵的海明距离矩阵。通过对距离矩阵与相似度阈值的计算获得偏爱路径的候选2项子路径,再利用支持-兴趣度对... 提出一种基于Web日志发现用户浏览偏爱路径算法。引入了支持-兴趣度概念。建立用户访问矩阵以表示用户浏览网页行为,并获得访问矩阵的海明距离矩阵。通过对距离矩阵与相似度阈值的计算获得偏爱路径的候选2项子路径,再利用支持-兴趣度对候选集做进一步的过滤,最后进行合并并生产浏览偏爱路径。实验表明该算法可以有效地反映用户的浏览兴趣。 展开更多
关键词 偏爱浏览路径 访问矩阵 海明距离 支持-兴趣度
下载PDF
一种挖掘用户浏览模式的新方法 被引量:6
12
作者 张海玉 刘晓霞 《计算机应用与软件》 CSCD 北大核心 2007年第2期143-144,150,共3页
提出了页面兴趣度的概念,并把它用一个三元组(页面的访问时间,页面的大小,页面访问次数)表示。这个概念准确地反映了用户对页面的访问情况。在此基础上建立了以引用网页URL为行、浏览网页URL为列,页面兴趣度为元素值的网站访问矩阵。通... 提出了页面兴趣度的概念,并把它用一个三元组(页面的访问时间,页面的大小,页面访问次数)表示。这个概念准确地反映了用户对页面的访问情况。在此基础上建立了以引用网页URL为行、浏览网页URL为列,页面兴趣度为元素值的网站访问矩阵。通过对该矩阵计算得到用户浏览偏爱路径。实验表明该算法能准确地反映用户浏览兴趣。 展开更多
关键词 浏览偏爱路径 支持偏爱 页面兴趣度
下载PDF
基于Web使用挖掘的个性化推荐系统 被引量:1
13
作者 黄河涛 刘重洋 《南阳师范学院学报》 CAS 2008年第9期54-57,共4页
Web使用模式挖掘是对用户浏览Web后在服务器日志上所留信息的数据挖掘。讨论了挖掘中常用技术及流程,并提出一种Web使用模式挖掘体系结构,介绍了系统的工作原理,对系统设计中的推荐算法等关键技术作了详细讨论。
关键词 偏爱路径 个性化推荐系统 数据挖掘
下载PDF
基于FLAAT模糊的WEB挖掘算法 被引量:2
14
作者 吴瑞 《武汉科技大学学报》 CAS 2005年第3期270-272,共3页
为了挖掘出较完全的兴趣模式,提出一种新的结构类型———FLAAT,它可发现那些被忽略的用户浏览偏爱路径。同时引进模糊集来处理停留在网页上的时间,以形成语义术语使挖掘出的用户浏览偏爱路径更自然、更易理解。实验表明,该算法能准确... 为了挖掘出较完全的兴趣模式,提出一种新的结构类型———FLAAT,它可发现那些被忽略的用户浏览偏爱路径。同时引进模糊集来处理停留在网页上的时间,以形成语义术语使挖掘出的用户浏览偏爱路径更自然、更易理解。实验表明,该算法能准确地反映用户的浏览兴趣,且系统的可扩展性较好。 展开更多
关键词 WEB日志 WEB挖掘 用户浏览偏爱路径 模糊集
下载PDF
基于FLAAT的模糊WEB挖掘算法
15
作者 吴瑞 张秀玲 《哈尔滨理工大学学报》 CAS 2005年第2期1-3,共3页
提出了一种新的结构类型——FLAAT(FrequentLinkAndAccessTree),它可以发现那些被忽略的用户浏览偏爱路径,同时引进了模糊集来处理停留在网页上的时间以形成语义术语,使挖掘出的用户浏览偏爱路径更自然、更易理解.实验表明,该算法能准... 提出了一种新的结构类型——FLAAT(FrequentLinkAndAccessTree),它可以发现那些被忽略的用户浏览偏爱路径,同时引进了模糊集来处理停留在网页上的时间以形成语义术语,使挖掘出的用户浏览偏爱路径更自然、更易理解.实验表明,该算法能准确反映用户的浏览兴趣,而且系统的可扩展性较好. 展开更多
关键词 WEB日志 用户浏览偏爱路径 模糊集
下载PDF
基于用户行为个性化学习研究 被引量:2
16
作者 陈小莉 《电脑知识与技术》 2009年第4期2779-2781,共3页
Web日志中包含了大量的用户浏览信息,对Web日志进行分析可以发现用户偏好路径容。本文提出了一种基于Web日志挖掘出用户浏览偏爱的路径,根据路径对应的文档内容提取用户偏爱的主题,并向用户推荐偏爱主题内容,从而为个性化学习服务。
关键词 WEB日志挖掘 浏览偏爱路径 浏览兴趣度
下载PDF
基于Web日志的用户访问模式挖掘 被引量:2
17
作者 徐海兰 崔荣一 《延边大学学报(自然科学版)》 CAS 2009年第2期164-166,共3页
利用相对访问率——支持-偏爱度的概念,设计了网站访问矩阵及时间矩阵,并利用这两个矩阵得到用户浏览偏爱路径.实验表明该算法能够准确地反映用户的浏览兴趣,可应用于个性化推荐服务中.
关键词 WEB挖掘 WEB日志 访问模式 浏览偏爱路径
下载PDF
基于Hadoop的Web日志挖掘 被引量:64
18
作者 程苗 陈华平 《计算机工程》 CAS CSCD 北大核心 2011年第11期37-39,共3页
基于单一节点的数据挖掘系统在挖掘Web海量数据源时存在计算瓶颈,针对该问题,利用云计算的分布式处理和虚拟化技术的优势,设计一种基于云计算的Hadoop集群框架的Web日志分析平台,提出一种能够在云计算环境中进行分布式处理的混合算法。... 基于单一节点的数据挖掘系统在挖掘Web海量数据源时存在计算瓶颈,针对该问题,利用云计算的分布式处理和虚拟化技术的优势,设计一种基于云计算的Hadoop集群框架的Web日志分析平台,提出一种能够在云计算环境中进行分布式处理的混合算法。为进一步验证该平台的高效性,在该平台上利用改进后的算法挖掘Web日志中用户的偏爱访问路径。实验结果表明,在集群中运用分布式算法处理大量的Web日志文件,可以明显提高Web数据挖掘的效率。 展开更多
关键词 云计算 Hadoop架构 Map/Reduce编程模式 WEB日志挖掘 遗传算法 偏爱访问路径
下载PDF
读者访问序列模式的探索
19
作者 郑慧霞 王丽娜 钱庆 《图书情报工作》 CSSCI 北大核心 2010年第S1期271-274,共4页
论述从网络日志数据中挖掘读者访问序列模式的数据准备和算法过程,初步构建了融合FS和NPPMA两种算法的Web访问序列挖掘模型。基于支持度的FS算法是网络访问序列挖掘的经典方法,但数据处理的过程和方法比较复杂,用时较长;而基于支持-偏... 论述从网络日志数据中挖掘读者访问序列模式的数据准备和算法过程,初步构建了融合FS和NPPMA两种算法的Web访问序列挖掘模型。基于支持度的FS算法是网络访问序列挖掘的经典方法,但数据处理的过程和方法比较复杂,用时较长;而基于支持-偏爱度的NPPMA算法,在序列模式的计算上,同时考虑了访问频度和偏爱度,比FS算法更能准确挖掘出读者浏览的兴趣模式,而且具有数据处理简单的优点,大大节约了时间。 展开更多
关键词 WEB日志挖掘 序列模式 数据预处理 频繁偏爱路径
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部