期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
19
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
从Web日志中挖掘用户浏览偏爱路径
被引量:
87
1
作者
邢东山
沈钧毅
宋擒豹
《计算机学报》
EI
CSCD
北大核心
2003年第11期1518-1523,共6页
eb日志中包含了大量的用户浏览信息 ,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题 .作者在分析目前用户浏览模式挖掘算法存在的问题的基础上 ,利用提出的支持 偏爱度的概念 ,设计了网站访问矩阵 ,并基于这个矩阵提出...
eb日志中包含了大量的用户浏览信息 ,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题 .作者在分析目前用户浏览模式挖掘算法存在的问题的基础上 ,利用提出的支持 偏爱度的概念 ,设计了网站访问矩阵 ,并基于这个矩阵提出了用户浏览偏爱路径挖掘算法 :先利用Web日志建立以引用网页URL为行、浏览网页URL为列、路径访问频度为元素值的网站访问矩阵 .该矩阵为稀疏矩阵 ,将该矩阵用三元组法来进行表示 .然后 ,通过对该矩阵进行支持 偏爱度计算得到偏爱子路径 .最后进行合并生成浏览偏爱路径 .实验表明该算法能准确地反映用户浏览兴趣 ,而且系统可扩展性较好 .这可以应用于电子商务网站的站点优化和个性化服务等 .
展开更多
关键词
INTERNET
拓扑结构
WEB日志
数据挖掘
网页浏览频度
用户浏览
偏爱路径
电子商务
下载PDF
职称材料
基于偏爱路径的个性化推荐系统
被引量:
2
2
作者
张海玉
刘晓霞
王新征
《西北大学学报(自然科学版)》
CAS
CSCD
北大核心
2007年第2期213-216,共4页
目的设计实现基于偏爱路径的个性化推荐系统原型。方法通过建立Web站点访问的一种矩阵表示模型,并据此挖掘用户浏览偏爱路径。结果分析了偏爱度与置信度的区别,提出了页面平均兴趣度的概念,改进了用户浏览偏爱路径算法。引入页面平均兴...
目的设计实现基于偏爱路径的个性化推荐系统原型。方法通过建立Web站点访问的一种矩阵表示模型,并据此挖掘用户浏览偏爱路径。结果分析了偏爱度与置信度的区别,提出了页面平均兴趣度的概念,改进了用户浏览偏爱路径算法。引入页面平均兴趣度的概念,给出了Web站点访问的一种矩阵表示模型,在此基础上挖掘用户浏览偏爱路径。结论该方法能准确地反映用户浏览兴趣,证明该系统具有较高的准确性。
展开更多
关键词
偏爱路径
个性化推荐系统
数据挖掘
页面兴趣度
下载PDF
职称材料
基于云计算的用户浏览偏爱路径挖掘算法
被引量:
6
3
作者
程苗
《计算机工程与应用》
CSCD
北大核心
2011年第29期85-89,共5页
从Web日志中挖掘用户浏览偏爱路径是一个重要的研究课题。目前的挖掘算法注重客观访问频度,忽略了用户对这一频繁访问路径是否感兴趣。在分析目前用户偏爱路径挖掘算法存在的问题的基础上,结合网站拓扑结构图修正基于频度的用户偏爱路...
从Web日志中挖掘用户浏览偏爱路径是一个重要的研究课题。目前的挖掘算法注重客观访问频度,忽略了用户对这一频繁访问路径是否感兴趣。在分析目前用户偏爱路径挖掘算法存在的问题的基础上,结合网站拓扑结构图修正基于频度的用户偏爱路径的衡量标准,提出了有用偏爱度的概念,从而剔除由于页面放置和链接等因素对挖掘的影响;针对目前基于单一节点的挖掘系统的计算能力不足的问题,利用云计算的分布式处理和虚拟化技术的优势,给出了一种基于云计算的数据处理方法,在此基础上挖掘用户浏览偏爱路径。实验表明,该算法针对大数据量的日志进行挖掘,准确率和效率比普通基于频度进行用户浏览偏爱路径挖掘的算法有所提高。
展开更多
关键词
浏览
偏爱路径
云计算
WEB使用挖掘
WEB
日志
下载PDF
职称材料
一种新的基于事物聚类Web浏览偏爱路径挖掘算法
被引量:
1
4
作者
李晓静
王树森
《制造业自动化》
北大核心
2013年第4期65-67,86,共4页
目前的挖掘算法单纯考虑了用户的访问频度,而忽略了用户对访问路径的兴趣度。本文通过分析目前用户偏爱路径挖掘算法存在的问题,结合事物聚类算法,将雅克比系数与最长公共路径系数相乘,得到更准确地用户相似集,并基于一个三元组模型构...
目前的挖掘算法单纯考虑了用户的访问频度,而忽略了用户对访问路径的兴趣度。本文通过分析目前用户偏爱路径挖掘算法存在的问题,结合事物聚类算法,将雅克比系数与最长公共路径系数相乘,得到更准确地用户相似集,并基于一个三元组模型构造以页面兴趣度为元素值的网站浏览数据矩阵,采用改进的挖掘算法计算用户偏爱度和访问兴趣度,降低访问页面闲置及链接等因素对数据挖掘的影响;实验结果表明,该算法针对Web日志海量数据进行挖掘,具有较高的效率和准确率。
展开更多
关键词
事物聚类算法
数据挖掘
WEB日志
浏览
偏爱路径
下载PDF
职称材料
基于Web日志的频繁偏爱路径挖掘算法
被引量:
3
5
作者
蔡俊
宋顺林
《计算机工程与设计》
CSCD
北大核心
2009年第24期5615-5617,5621,共4页
为了挖掘出更能如实反映Web用户兴趣偏好的使用模式,充分考虑了用户在页面的停留时间和点击次数两个因素,给出了频繁偏爱路径的定义,并提出了频繁偏爱路径的挖掘算法,该方法在求得最大向前路径的基础上,迭代产生更长的候选频繁偏爱路径...
为了挖掘出更能如实反映Web用户兴趣偏好的使用模式,充分考虑了用户在页面的停留时间和点击次数两个因素,给出了频繁偏爱路径的定义,并提出了频繁偏爱路径的挖掘算法,该方法在求得最大向前路径的基础上,迭代产生更长的候选频繁偏爱路径,通过计算候选路径的频繁偏爱支持度来判断其是否为频繁偏爱路径。利用真实日志数据进行实验,实验结果表明,该算法具有较高的覆盖率和准确性。
展开更多
关键词
数据挖掘
用户会话
频繁
偏爱
支持度
最大向前
路径
频繁
偏爱路径
下载PDF
职称材料
一种从Web日志中挖掘用户浏览偏爱路径的算法
被引量:
1
6
作者
杨旭东
《重庆理工大学学报(自然科学)》
CAS
2012年第10期82-88,共7页
针对当前Web站点设计与管理的复杂性以及优化其拓扑结构的需要,提出了一种从Web日志中挖掘用户浏览偏爱路径的算法。该算法引入反映页面浏览频率的访问矩阵与支持-偏爱度,得到访问矩阵行向量间的Hamming距离矩阵,将相似性阈值与其元素...
针对当前Web站点设计与管理的复杂性以及优化其拓扑结构的需要,提出了一种从Web日志中挖掘用户浏览偏爱路径的算法。该算法引入反映页面浏览频率的访问矩阵与支持-偏爱度,得到访问矩阵行向量间的Hamming距离矩阵,将相似性阈值与其元素值逐一比较,获得候选兴趣子路径2-项集,根据支持-偏爱度阈值,将子路径集中不符的子路径剔除,合并子路径,生成用户浏览偏爱路径。实验结果证明了该算法的有效性。
展开更多
关键词
浏览
偏爱路径
站点访问矩阵
支持-
偏爱
度
HAMMING距离
WEB日志挖掘
下载PDF
职称材料
一种新的基于Web日志的挖掘用户浏览偏爱路径的方法
被引量:
4
7
作者
任永功
付玉
+1 位作者
张亮
吕君义
《计算机科学》
CSCD
北大核心
2008年第10期192-196,共5页
提出了一种新的基于Web日志的挖掘用户浏览偏爱路径的方法。该方法首先在单元数组存储结构(存储矩阵)基础上建立以浏览兴趣度为基本元素的会话矩阵和路径矩阵。然后,在会话矩阵上采用两个页面向量夹角余弦作为相似用户的页面距离公式进...
提出了一种新的基于Web日志的挖掘用户浏览偏爱路径的方法。该方法首先在单元数组存储结构(存储矩阵)基础上建立以浏览兴趣度为基本元素的会话矩阵和路径矩阵。然后,在会话矩阵上采用两个页面向量夹角余弦作为相似用户的页面距离公式进行页面聚类,求得相似用户的相关页面集。最后,利用路径选择偏爱度在相似用户的路径矩阵上挖掘出相似用户的浏览偏爱路径。实验证明此方法是合理有效的,能够得到更准确的偏爱路径。
展开更多
关键词
浏览兴趣度
路径
选择
偏爱
度
WEB日志
矩阵
页面聚类
下载PDF
职称材料
基于Web使用挖掘的用户有效偏爱浏览路径研究
8
作者
黄伟建
冯立娟
《科学技术与工程》
北大核心
2014年第9期222-226,共5页
在浏览偏爱路径研究的基础上提出了网络拓扑结构加权的方法,与用户浏览路径进行结合得到用户实际浏览偏爱路径。设定网络拓扑主干路径的权值小于远离主干路径的路径权值,远离主干路径的高频路径是网络拓扑设计者期望得到的有效信息,能...
在浏览偏爱路径研究的基础上提出了网络拓扑结构加权的方法,与用户浏览路径进行结合得到用户实际浏览偏爱路径。设定网络拓扑主干路径的权值小于远离主干路径的路径权值,远离主干路径的高频路径是网络拓扑设计者期望得到的有效信息,能够较好地用于改进网站设计,进而提高用户服务质量。最后与NPPMA算法在有效度方面进行了比较,以此证明算法的可取之处。
展开更多
关键词
使用挖掘
偏爱路径
浏览
路径
网络拓扑
下载PDF
职称材料
使用语言最小支持度和偏爱度挖掘偏爱的模糊浏览路径
9
作者
吴瑞
《小型微型计算机系统》
CSCD
北大核心
2007年第6期1098-1102,共5页
提出了使用语言最小支持度和偏爱度的web日志挖掘方法.表示用户兴趣和偏爱程度的支持度和偏爱度被刻画成相应的模糊语言变量,通过与最小语言支持度和偏爱度(模糊语言变量)比较,判定该网页是否是一个用户偏爱网页,这种语言的输入输出更...
提出了使用语言最小支持度和偏爱度的web日志挖掘方法.表示用户兴趣和偏爱程度的支持度和偏爱度被刻画成相应的模糊语言变量,通过与最小语言支持度和偏爱度(模糊语言变量)比较,判定该网页是否是一个用户偏爱网页,这种语言的输入输出更自然更易理解.此外,网页上的浏览时间也是反映用户兴趣和偏爱的一个重要因素,它也被表示成相应的模糊语言变量,既体现不同网页浏览时间的不同,也可以忽略它们之间的细微差别.所获得的带有模糊时间的用户偏爱浏览路径更能反映用户的兴趣和偏爱性.
展开更多
关键词
WEB使用挖掘
模糊语言变量
用户
偏爱
浏览
路径
支持度
偏爱
度
下载PDF
职称材料
基于Web日志挖掘用户偏爱浏览路径算法
10
作者
苏兰
陆济湘
《电脑知识与技术》
2016年第2Z期221-223,共3页
该文提出一种改进的基于Web日志挖掘用户偏爱浏览路径算法。通过引入站点拓扑结构图来建立用户的访问矩阵,使用夹角余弦公式求出访问矩阵的相似度矩阵,将相似度高的页面归为一类,称为基于相似度矩阵的用户偏爱浏览路径候选集,引入访问...
该文提出一种改进的基于Web日志挖掘用户偏爱浏览路径算法。通过引入站点拓扑结构图来建立用户的访问矩阵,使用夹角余弦公式求出访问矩阵的相似度矩阵,将相似度高的页面归为一类,称为基于相似度矩阵的用户偏爱浏览路径候选集,引入访问矩阵的权重矩阵来降低由于主干路径访问频度高而对挖掘结果造成的影响,结合访问权重利用有效偏爱度过滤上述的候选项集,得出基于权重的用户偏爱浏览路径项集,最后通过合并这些项集得到符合用户浏览习惯的偏爱路径。实验表明该算法更能反映用户真实的浏览兴趣与意图。
展开更多
关键词
偏爱
浏览
路径
相似度矩阵
权重矩阵
有效
偏爱
度
下载PDF
职称材料
基于Web日志挖掘用户的浏览兴趣路径
被引量:
5
11
作者
王思宝
李银胜
《计算机应用与软件》
CSCD
北大核心
2012年第1期164-167,共4页
提出一种基于Web日志发现用户浏览偏爱路径算法。引入了支持-兴趣度概念。建立用户访问矩阵以表示用户浏览网页行为,并获得访问矩阵的海明距离矩阵。通过对距离矩阵与相似度阈值的计算获得偏爱路径的候选2项子路径,再利用支持-兴趣度对...
提出一种基于Web日志发现用户浏览偏爱路径算法。引入了支持-兴趣度概念。建立用户访问矩阵以表示用户浏览网页行为,并获得访问矩阵的海明距离矩阵。通过对距离矩阵与相似度阈值的计算获得偏爱路径的候选2项子路径,再利用支持-兴趣度对候选集做进一步的过滤,最后进行合并并生产浏览偏爱路径。实验表明该算法可以有效地反映用户的浏览兴趣。
展开更多
关键词
偏爱
浏览
路径
访问矩阵
海明距离
支持-兴趣度
下载PDF
职称材料
一种挖掘用户浏览模式的新方法
被引量:
6
12
作者
张海玉
刘晓霞
《计算机应用与软件》
CSCD
北大核心
2007年第2期143-144,150,共3页
提出了页面兴趣度的概念,并把它用一个三元组(页面的访问时间,页面的大小,页面访问次数)表示。这个概念准确地反映了用户对页面的访问情况。在此基础上建立了以引用网页URL为行、浏览网页URL为列,页面兴趣度为元素值的网站访问矩阵。通...
提出了页面兴趣度的概念,并把它用一个三元组(页面的访问时间,页面的大小,页面访问次数)表示。这个概念准确地反映了用户对页面的访问情况。在此基础上建立了以引用网页URL为行、浏览网页URL为列,页面兴趣度为元素值的网站访问矩阵。通过对该矩阵计算得到用户浏览偏爱路径。实验表明该算法能准确地反映用户浏览兴趣。
展开更多
关键词
浏览
偏爱路径
支持
偏爱
度
页面兴趣度
下载PDF
职称材料
基于Web使用挖掘的个性化推荐系统
被引量:
1
13
作者
黄河涛
刘重洋
《南阳师范学院学报》
CAS
2008年第9期54-57,共4页
Web使用模式挖掘是对用户浏览Web后在服务器日志上所留信息的数据挖掘。讨论了挖掘中常用技术及流程,并提出一种Web使用模式挖掘体系结构,介绍了系统的工作原理,对系统设计中的推荐算法等关键技术作了详细讨论。
关键词
偏爱路径
个性化推荐系统
数据挖掘
下载PDF
职称材料
基于FLAAT模糊的WEB挖掘算法
被引量:
2
14
作者
吴瑞
《武汉科技大学学报》
CAS
2005年第3期270-272,共3页
为了挖掘出较完全的兴趣模式,提出一种新的结构类型———FLAAT,它可发现那些被忽略的用户浏览偏爱路径。同时引进模糊集来处理停留在网页上的时间,以形成语义术语使挖掘出的用户浏览偏爱路径更自然、更易理解。实验表明,该算法能准确...
为了挖掘出较完全的兴趣模式,提出一种新的结构类型———FLAAT,它可发现那些被忽略的用户浏览偏爱路径。同时引进模糊集来处理停留在网页上的时间,以形成语义术语使挖掘出的用户浏览偏爱路径更自然、更易理解。实验表明,该算法能准确地反映用户的浏览兴趣,且系统的可扩展性较好。
展开更多
关键词
WEB日志
WEB挖掘
用户浏览
偏爱路径
模糊集
下载PDF
职称材料
基于FLAAT的模糊WEB挖掘算法
15
作者
吴瑞
张秀玲
《哈尔滨理工大学学报》
CAS
2005年第2期1-3,共3页
提出了一种新的结构类型——FLAAT(FrequentLinkAndAccessTree),它可以发现那些被忽略的用户浏览偏爱路径,同时引进了模糊集来处理停留在网页上的时间以形成语义术语,使挖掘出的用户浏览偏爱路径更自然、更易理解.实验表明,该算法能准...
提出了一种新的结构类型——FLAAT(FrequentLinkAndAccessTree),它可以发现那些被忽略的用户浏览偏爱路径,同时引进了模糊集来处理停留在网页上的时间以形成语义术语,使挖掘出的用户浏览偏爱路径更自然、更易理解.实验表明,该算法能准确反映用户的浏览兴趣,而且系统的可扩展性较好.
展开更多
关键词
WEB日志
用户浏览
偏爱路径
模糊集
下载PDF
职称材料
基于用户行为个性化学习研究
被引量:
2
16
作者
陈小莉
《电脑知识与技术》
2009年第4期2779-2781,共3页
Web日志中包含了大量的用户浏览信息,对Web日志进行分析可以发现用户偏好路径容。本文提出了一种基于Web日志挖掘出用户浏览偏爱的路径,根据路径对应的文档内容提取用户偏爱的主题,并向用户推荐偏爱主题内容,从而为个性化学习服务。
关键词
WEB日志挖掘
浏览
偏爱路径
浏览兴趣度
下载PDF
职称材料
基于Web日志的用户访问模式挖掘
被引量:
2
17
作者
徐海兰
崔荣一
《延边大学学报(自然科学版)》
CAS
2009年第2期164-166,共3页
利用相对访问率——支持-偏爱度的概念,设计了网站访问矩阵及时间矩阵,并利用这两个矩阵得到用户浏览偏爱路径.实验表明该算法能够准确地反映用户的浏览兴趣,可应用于个性化推荐服务中.
关键词
WEB挖掘
WEB日志
访问模式
浏览
偏爱路径
下载PDF
职称材料
基于Hadoop的Web日志挖掘
被引量:
64
18
作者
程苗
陈华平
《计算机工程》
CAS
CSCD
北大核心
2011年第11期37-39,共3页
基于单一节点的数据挖掘系统在挖掘Web海量数据源时存在计算瓶颈,针对该问题,利用云计算的分布式处理和虚拟化技术的优势,设计一种基于云计算的Hadoop集群框架的Web日志分析平台,提出一种能够在云计算环境中进行分布式处理的混合算法。...
基于单一节点的数据挖掘系统在挖掘Web海量数据源时存在计算瓶颈,针对该问题,利用云计算的分布式处理和虚拟化技术的优势,设计一种基于云计算的Hadoop集群框架的Web日志分析平台,提出一种能够在云计算环境中进行分布式处理的混合算法。为进一步验证该平台的高效性,在该平台上利用改进后的算法挖掘Web日志中用户的偏爱访问路径。实验结果表明,在集群中运用分布式算法处理大量的Web日志文件,可以明显提高Web数据挖掘的效率。
展开更多
关键词
云计算
Hadoop架构
Map/Reduce编程模式
WEB日志挖掘
遗传算法
偏爱
访问
路径
下载PDF
职称材料
读者访问序列模式的探索
19
作者
郑慧霞
王丽娜
钱庆
《图书情报工作》
CSSCI
北大核心
2010年第S1期271-274,共4页
论述从网络日志数据中挖掘读者访问序列模式的数据准备和算法过程,初步构建了融合FS和NPPMA两种算法的Web访问序列挖掘模型。基于支持度的FS算法是网络访问序列挖掘的经典方法,但数据处理的过程和方法比较复杂,用时较长;而基于支持-偏...
论述从网络日志数据中挖掘读者访问序列模式的数据准备和算法过程,初步构建了融合FS和NPPMA两种算法的Web访问序列挖掘模型。基于支持度的FS算法是网络访问序列挖掘的经典方法,但数据处理的过程和方法比较复杂,用时较长;而基于支持-偏爱度的NPPMA算法,在序列模式的计算上,同时考虑了访问频度和偏爱度,比FS算法更能准确挖掘出读者浏览的兴趣模式,而且具有数据处理简单的优点,大大节约了时间。
展开更多
关键词
WEB日志挖掘
序列模式
数据预处理
频繁
偏爱路径
原文传递
题名
从Web日志中挖掘用户浏览偏爱路径
被引量:
87
1
作者
邢东山
沈钧毅
宋擒豹
机构
中国科学院计算技术研究所
西安交通大学软件研究所
出处
《计算机学报》
EI
CSCD
北大核心
2003年第11期1518-1523,共6页
基金
国家自然科学基金 ( 60 173 0 5 8)
国家"八六三"高技术研究发展计划项目 ( 863 3 0 6 ZD 0 2 0 2 )资助
文摘
eb日志中包含了大量的用户浏览信息 ,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题 .作者在分析目前用户浏览模式挖掘算法存在的问题的基础上 ,利用提出的支持 偏爱度的概念 ,设计了网站访问矩阵 ,并基于这个矩阵提出了用户浏览偏爱路径挖掘算法 :先利用Web日志建立以引用网页URL为行、浏览网页URL为列、路径访问频度为元素值的网站访问矩阵 .该矩阵为稀疏矩阵 ,将该矩阵用三元组法来进行表示 .然后 ,通过对该矩阵进行支持 偏爱度计算得到偏爱子路径 .最后进行合并生成浏览偏爱路径 .实验表明该算法能准确地反映用户浏览兴趣 ,而且系统可扩展性较好 .这可以应用于电子商务网站的站点优化和个性化服务等 .
关键词
INTERNET
拓扑结构
WEB日志
数据挖掘
网页浏览频度
用户浏览
偏爱路径
电子商务
Keywords
Algorithms
Data mining
Electronic commerce
Matrix algebra
Websites
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
F713.36 [经济管理—产业经济]
下载PDF
职称材料
题名
基于偏爱路径的个性化推荐系统
被引量:
2
2
作者
张海玉
刘晓霞
王新征
机构
西北大学信息科学与技术学院
南阳师范学院计算机与信息技术学院
出处
《西北大学学报(自然科学版)》
CAS
CSCD
北大核心
2007年第2期213-216,共4页
基金
陕西省自然科学基础研究计划基金资助项目(2006F50)
航空科学基金资助项目(2006ZC31001)
文摘
目的设计实现基于偏爱路径的个性化推荐系统原型。方法通过建立Web站点访问的一种矩阵表示模型,并据此挖掘用户浏览偏爱路径。结果分析了偏爱度与置信度的区别,提出了页面平均兴趣度的概念,改进了用户浏览偏爱路径算法。引入页面平均兴趣度的概念,给出了Web站点访问的一种矩阵表示模型,在此基础上挖掘用户浏览偏爱路径。结论该方法能准确地反映用户浏览兴趣,证明该系统具有较高的准确性。
关键词
偏爱路径
个性化推荐系统
数据挖掘
页面兴趣度
Keywords
preferred browsing paths
recommendation system
data minding
page average interest
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于云计算的用户浏览偏爱路径挖掘算法
被引量:
6
3
作者
程苗
机构
中国科学技术大学管理学院
出处
《计算机工程与应用》
CSCD
北大核心
2011年第29期85-89,共5页
基金
博士点基金项目(No.200803580024)
创新研究群体科学基金(No.70821001)
文摘
从Web日志中挖掘用户浏览偏爱路径是一个重要的研究课题。目前的挖掘算法注重客观访问频度,忽略了用户对这一频繁访问路径是否感兴趣。在分析目前用户偏爱路径挖掘算法存在的问题的基础上,结合网站拓扑结构图修正基于频度的用户偏爱路径的衡量标准,提出了有用偏爱度的概念,从而剔除由于页面放置和链接等因素对挖掘的影响;针对目前基于单一节点的挖掘系统的计算能力不足的问题,利用云计算的分布式处理和虚拟化技术的优势,给出了一种基于云计算的数据处理方法,在此基础上挖掘用户浏览偏爱路径。实验表明,该算法针对大数据量的日志进行挖掘,准确率和效率比普通基于频度进行用户浏览偏爱路径挖掘的算法有所提高。
关键词
浏览
偏爱路径
云计算
WEB使用挖掘
WEB
日志
Keywords
preferred browsing paths
cloud computing
Web usage mining
Web log
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
一种新的基于事物聚类Web浏览偏爱路径挖掘算法
被引量:
1
4
作者
李晓静
王树森
机构
济源职业技术学院
出处
《制造业自动化》
北大核心
2013年第4期65-67,86,共4页
文摘
目前的挖掘算法单纯考虑了用户的访问频度,而忽略了用户对访问路径的兴趣度。本文通过分析目前用户偏爱路径挖掘算法存在的问题,结合事物聚类算法,将雅克比系数与最长公共路径系数相乘,得到更准确地用户相似集,并基于一个三元组模型构造以页面兴趣度为元素值的网站浏览数据矩阵,采用改进的挖掘算法计算用户偏爱度和访问兴趣度,降低访问页面闲置及链接等因素对数据挖掘的影响;实验结果表明,该算法针对Web日志海量数据进行挖掘,具有较高的效率和准确率。
关键词
事物聚类算法
数据挖掘
WEB日志
浏览
偏爱路径
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
基于Web日志的频繁偏爱路径挖掘算法
被引量:
3
5
作者
蔡俊
宋顺林
机构
江苏大学计算机学院
出处
《计算机工程与设计》
CSCD
北大核心
2009年第24期5615-5617,5621,共4页
文摘
为了挖掘出更能如实反映Web用户兴趣偏好的使用模式,充分考虑了用户在页面的停留时间和点击次数两个因素,给出了频繁偏爱路径的定义,并提出了频繁偏爱路径的挖掘算法,该方法在求得最大向前路径的基础上,迭代产生更长的候选频繁偏爱路径,通过计算候选路径的频繁偏爱支持度来判断其是否为频繁偏爱路径。利用真实日志数据进行实验,实验结果表明,该算法具有较高的覆盖率和准确性。
关键词
数据挖掘
用户会话
频繁
偏爱
支持度
最大向前
路径
频繁
偏爱路径
Keywords
data mining
user session
frequent and preferred support
maximum forward path
frequent and preferred path
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种从Web日志中挖掘用户浏览偏爱路径的算法
被引量:
1
6
作者
杨旭东
机构
吕梁学院计算机科学与技术系
出处
《重庆理工大学学报(自然科学)》
CAS
2012年第10期82-88,共7页
基金
吕梁学院校内自然科学基金资助项目(ZRXN201215)
文摘
针对当前Web站点设计与管理的复杂性以及优化其拓扑结构的需要,提出了一种从Web日志中挖掘用户浏览偏爱路径的算法。该算法引入反映页面浏览频率的访问矩阵与支持-偏爱度,得到访问矩阵行向量间的Hamming距离矩阵,将相似性阈值与其元素值逐一比较,获得候选兴趣子路径2-项集,根据支持-偏爱度阈值,将子路径集中不符的子路径剔除,合并子路径,生成用户浏览偏爱路径。实验结果证明了该算法的有效性。
关键词
浏览
偏爱路径
站点访问矩阵
支持-
偏爱
度
HAMMING距离
WEB日志挖掘
Keywords
preferred browsing paths
user access matrix
support-preference
Hamming distance
Web log mining
分类号
TP312 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
一种新的基于Web日志的挖掘用户浏览偏爱路径的方法
被引量:
4
7
作者
任永功
付玉
张亮
吕君义
机构
辽宁师范大学计算机与信息技术学院
辽河油田锦州工程技术处
出处
《计算机科学》
CSCD
北大核心
2008年第10期192-196,共5页
基金
国家自然科学基金项目(60603047)
辽宁省教育厅高等学校科研基金(2008341)
+1 种基金
辽宁省自然科学基金
大连市优秀青年科技人才基金(2008J23JH026)
文摘
提出了一种新的基于Web日志的挖掘用户浏览偏爱路径的方法。该方法首先在单元数组存储结构(存储矩阵)基础上建立以浏览兴趣度为基本元素的会话矩阵和路径矩阵。然后,在会话矩阵上采用两个页面向量夹角余弦作为相似用户的页面距离公式进行页面聚类,求得相似用户的相关页面集。最后,利用路径选择偏爱度在相似用户的路径矩阵上挖掘出相似用户的浏览偏爱路径。实验证明此方法是合理有效的,能够得到更准确的偏爱路径。
关键词
浏览兴趣度
路径
选择
偏爱
度
WEB日志
矩阵
页面聚类
Keywords
Browsing interest, Path choice-preference, Web log, Matrix, Page cluster
分类号
TP393.4 [自动化与计算机技术—计算机应用技术]
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于Web使用挖掘的用户有效偏爱浏览路径研究
8
作者
黄伟建
冯立娟
机构
河北工程大学信息与电气工程学院
经济管理学院管理科学与工程系
出处
《科学技术与工程》
北大核心
2014年第9期222-226,共5页
基金
河北省科学技术研究与发展计划项目(12213511D)资助
文摘
在浏览偏爱路径研究的基础上提出了网络拓扑结构加权的方法,与用户浏览路径进行结合得到用户实际浏览偏爱路径。设定网络拓扑主干路径的权值小于远离主干路径的路径权值,远离主干路径的高频路径是网络拓扑设计者期望得到的有效信息,能够较好地用于改进网站设计,进而提高用户服务质量。最后与NPPMA算法在有效度方面进行了比较,以此证明算法的可取之处。
关键词
使用挖掘
偏爱路径
浏览
路径
网络拓扑
Keywords
usage mining preferred path browsing path network topology
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
使用语言最小支持度和偏爱度挖掘偏爱的模糊浏览路径
9
作者
吴瑞
机构
山西师范大学数学与计算机学院
出处
《小型微型计算机系统》
CSCD
北大核心
2007年第6期1098-1102,共5页
文摘
提出了使用语言最小支持度和偏爱度的web日志挖掘方法.表示用户兴趣和偏爱程度的支持度和偏爱度被刻画成相应的模糊语言变量,通过与最小语言支持度和偏爱度(模糊语言变量)比较,判定该网页是否是一个用户偏爱网页,这种语言的输入输出更自然更易理解.此外,网页上的浏览时间也是反映用户兴趣和偏爱的一个重要因素,它也被表示成相应的模糊语言变量,既体现不同网页浏览时间的不同,也可以忽略它们之间的细微差别.所获得的带有模糊时间的用户偏爱浏览路径更能反映用户的兴趣和偏爱性.
关键词
WEB使用挖掘
模糊语言变量
用户
偏爱
浏览
路径
支持度
偏爱
度
Keywords
Web usage mining
fuzzy linguistic variable
users preferred browsing patterns ,support
preference
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于Web日志挖掘用户偏爱浏览路径算法
10
作者
苏兰
陆济湘
机构
武汉理工大学
出处
《电脑知识与技术》
2016年第2Z期221-223,共3页
文摘
该文提出一种改进的基于Web日志挖掘用户偏爱浏览路径算法。通过引入站点拓扑结构图来建立用户的访问矩阵,使用夹角余弦公式求出访问矩阵的相似度矩阵,将相似度高的页面归为一类,称为基于相似度矩阵的用户偏爱浏览路径候选集,引入访问矩阵的权重矩阵来降低由于主干路径访问频度高而对挖掘结果造成的影响,结合访问权重利用有效偏爱度过滤上述的候选项集,得出基于权重的用户偏爱浏览路径项集,最后通过合并这些项集得到符合用户浏览习惯的偏爱路径。实验表明该算法更能反映用户真实的浏览兴趣与意图。
关键词
偏爱
浏览
路径
相似度矩阵
权重矩阵
有效
偏爱
度
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于Web日志挖掘用户的浏览兴趣路径
被引量:
5
11
作者
王思宝
李银胜
机构
复旦大学软件学院
出处
《计算机应用与软件》
CSCD
北大核心
2012年第1期164-167,共4页
文摘
提出一种基于Web日志发现用户浏览偏爱路径算法。引入了支持-兴趣度概念。建立用户访问矩阵以表示用户浏览网页行为,并获得访问矩阵的海明距离矩阵。通过对距离矩阵与相似度阈值的计算获得偏爱路径的候选2项子路径,再利用支持-兴趣度对候选集做进一步的过滤,最后进行合并并生产浏览偏爱路径。实验表明该算法可以有效地反映用户的浏览兴趣。
关键词
偏爱
浏览
路径
访问矩阵
海明距离
支持-兴趣度
Keywords
Preferred browsing paths Access matrix Hamming distance Support-preference
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
一种挖掘用户浏览模式的新方法
被引量:
6
12
作者
张海玉
刘晓霞
机构
西北大学信息科学与技术学院
出处
《计算机应用与软件》
CSCD
北大核心
2007年第2期143-144,150,共3页
基金
陕西省自然科学基金项目(编号:2006F50)。
文摘
提出了页面兴趣度的概念,并把它用一个三元组(页面的访问时间,页面的大小,页面访问次数)表示。这个概念准确地反映了用户对页面的访问情况。在此基础上建立了以引用网页URL为行、浏览网页URL为列,页面兴趣度为元素值的网站访问矩阵。通过对该矩阵计算得到用户浏览偏爱路径。实验表明该算法能准确地反映用户浏览兴趣。
关键词
浏览
偏爱路径
支持
偏爱
度
页面兴趣度
Keywords
Preferred browsing paths Support-preference Page average interest
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于Web使用挖掘的个性化推荐系统
被引量:
1
13
作者
黄河涛
刘重洋
机构
南阳师范学院计算机与信息技术学院
重庆邮电大学通信与信息工程学院
出处
《南阳师范学院学报》
CAS
2008年第9期54-57,共4页
文摘
Web使用模式挖掘是对用户浏览Web后在服务器日志上所留信息的数据挖掘。讨论了挖掘中常用技术及流程,并提出一种Web使用模式挖掘体系结构,介绍了系统的工作原理,对系统设计中的推荐算法等关键技术作了详细讨论。
关键词
偏爱路径
个性化推荐系统
数据挖掘
Keywords
preferred browsing paths
recommendation system
data minding
分类号
TP274 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
基于FLAAT模糊的WEB挖掘算法
被引量:
2
14
作者
吴瑞
机构
山西师范大学数学与计算机学院
出处
《武汉科技大学学报》
CAS
2005年第3期270-272,共3页
文摘
为了挖掘出较完全的兴趣模式,提出一种新的结构类型———FLAAT,它可发现那些被忽略的用户浏览偏爱路径。同时引进模糊集来处理停留在网页上的时间,以形成语义术语使挖掘出的用户浏览偏爱路径更自然、更易理解。实验表明,该算法能准确地反映用户的浏览兴趣,且系统的可扩展性较好。
关键词
WEB日志
WEB挖掘
用户浏览
偏爱路径
模糊集
Keywords
web log
web mining
user browsing preferred path
fuzzy set
分类号
TP273.4 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
基于FLAAT的模糊WEB挖掘算法
15
作者
吴瑞
张秀玲
机构
山西师范大学数学与计算机学院
德州学院化学系
出处
《哈尔滨理工大学学报》
CAS
2005年第2期1-3,共3页
文摘
提出了一种新的结构类型——FLAAT(FrequentLinkAndAccessTree),它可以发现那些被忽略的用户浏览偏爱路径,同时引进了模糊集来处理停留在网页上的时间以形成语义术语,使挖掘出的用户浏览偏爱路径更自然、更易理解.实验表明,该算法能准确反映用户的浏览兴趣,而且系统的可扩展性较好.
关键词
WEB日志
用户浏览
偏爱路径
模糊集
Keywords
WEB log
user browsing preferred paths
fuzzy set
分类号
TP393.07 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于用户行为个性化学习研究
被引量:
2
16
作者
陈小莉
机构
重庆广播电视大学远程教育技术中心
出处
《电脑知识与技术》
2009年第4期2779-2781,共3页
文摘
Web日志中包含了大量的用户浏览信息,对Web日志进行分析可以发现用户偏好路径容。本文提出了一种基于Web日志挖掘出用户浏览偏爱的路径,根据路径对应的文档内容提取用户偏爱的主题,并向用户推荐偏爱主题内容,从而为个性化学习服务。
关键词
WEB日志挖掘
浏览
偏爱路径
浏览兴趣度
Keywords
Web log minig
path choice-preference
browsing interest
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于Web日志的用户访问模式挖掘
被引量:
2
17
作者
徐海兰
崔荣一
机构
延边大学工学院计算机科学与技术系智能信息处理研究室
出处
《延边大学学报(自然科学版)》
CAS
2009年第2期164-166,共3页
文摘
利用相对访问率——支持-偏爱度的概念,设计了网站访问矩阵及时间矩阵,并利用这两个矩阵得到用户浏览偏爱路径.实验表明该算法能够准确地反映用户的浏览兴趣,可应用于个性化推荐服务中.
关键词
WEB挖掘
WEB日志
访问模式
浏览
偏爱路径
Keywords
Web mining
Web log
visit pattern
browsing preference paths
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于Hadoop的Web日志挖掘
被引量:
64
18
作者
程苗
陈华平
机构
中国科学技术大学管理学院
中国科学技术大学计算机科学与技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第11期37-39,共3页
基金
博士点基金资助项目(200803580024)
创新研究群体科学基金资助项目(70821001)
文摘
基于单一节点的数据挖掘系统在挖掘Web海量数据源时存在计算瓶颈,针对该问题,利用云计算的分布式处理和虚拟化技术的优势,设计一种基于云计算的Hadoop集群框架的Web日志分析平台,提出一种能够在云计算环境中进行分布式处理的混合算法。为进一步验证该平台的高效性,在该平台上利用改进后的算法挖掘Web日志中用户的偏爱访问路径。实验结果表明,在集群中运用分布式算法处理大量的Web日志文件,可以明显提高Web数据挖掘的效率。
关键词
云计算
Hadoop架构
Map/Reduce编程模式
WEB日志挖掘
遗传算法
偏爱
访问
路径
Keywords
cloud computing
Hadoop frame
Map/Reduce
Weblog mining
genetic algorithm
preferred browsing path
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
读者访问序列模式的探索
19
作者
郑慧霞
王丽娜
钱庆
机构
中国医学科学院医学信息研究所
出处
《图书情报工作》
CSSCI
北大核心
2010年第S1期271-274,共4页
文摘
论述从网络日志数据中挖掘读者访问序列模式的数据准备和算法过程,初步构建了融合FS和NPPMA两种算法的Web访问序列挖掘模型。基于支持度的FS算法是网络访问序列挖掘的经典方法,但数据处理的过程和方法比较复杂,用时较长;而基于支持-偏爱度的NPPMA算法,在序列模式的计算上,同时考虑了访问频度和偏爱度,比FS算法更能准确挖掘出读者浏览的兴趣模式,而且具有数据处理简单的优点,大大节约了时间。
关键词
WEB日志挖掘
序列模式
数据预处理
频繁
偏爱路径
分类号
TP311.13 [自动化与计算机技术—计算机软件与理论]
原文传递
题名
作者
出处
发文年
被引量
操作
1
从Web日志中挖掘用户浏览偏爱路径
邢东山
沈钧毅
宋擒豹
《计算机学报》
EI
CSCD
北大核心
2003
87
下载PDF
职称材料
2
基于偏爱路径的个性化推荐系统
张海玉
刘晓霞
王新征
《西北大学学报(自然科学版)》
CAS
CSCD
北大核心
2007
2
下载PDF
职称材料
3
基于云计算的用户浏览偏爱路径挖掘算法
程苗
《计算机工程与应用》
CSCD
北大核心
2011
6
下载PDF
职称材料
4
一种新的基于事物聚类Web浏览偏爱路径挖掘算法
李晓静
王树森
《制造业自动化》
北大核心
2013
1
下载PDF
职称材料
5
基于Web日志的频繁偏爱路径挖掘算法
蔡俊
宋顺林
《计算机工程与设计》
CSCD
北大核心
2009
3
下载PDF
职称材料
6
一种从Web日志中挖掘用户浏览偏爱路径的算法
杨旭东
《重庆理工大学学报(自然科学)》
CAS
2012
1
下载PDF
职称材料
7
一种新的基于Web日志的挖掘用户浏览偏爱路径的方法
任永功
付玉
张亮
吕君义
《计算机科学》
CSCD
北大核心
2008
4
下载PDF
职称材料
8
基于Web使用挖掘的用户有效偏爱浏览路径研究
黄伟建
冯立娟
《科学技术与工程》
北大核心
2014
0
下载PDF
职称材料
9
使用语言最小支持度和偏爱度挖掘偏爱的模糊浏览路径
吴瑞
《小型微型计算机系统》
CSCD
北大核心
2007
0
下载PDF
职称材料
10
基于Web日志挖掘用户偏爱浏览路径算法
苏兰
陆济湘
《电脑知识与技术》
2016
0
下载PDF
职称材料
11
基于Web日志挖掘用户的浏览兴趣路径
王思宝
李银胜
《计算机应用与软件》
CSCD
北大核心
2012
5
下载PDF
职称材料
12
一种挖掘用户浏览模式的新方法
张海玉
刘晓霞
《计算机应用与软件》
CSCD
北大核心
2007
6
下载PDF
职称材料
13
基于Web使用挖掘的个性化推荐系统
黄河涛
刘重洋
《南阳师范学院学报》
CAS
2008
1
下载PDF
职称材料
14
基于FLAAT模糊的WEB挖掘算法
吴瑞
《武汉科技大学学报》
CAS
2005
2
下载PDF
职称材料
15
基于FLAAT的模糊WEB挖掘算法
吴瑞
张秀玲
《哈尔滨理工大学学报》
CAS
2005
0
下载PDF
职称材料
16
基于用户行为个性化学习研究
陈小莉
《电脑知识与技术》
2009
2
下载PDF
职称材料
17
基于Web日志的用户访问模式挖掘
徐海兰
崔荣一
《延边大学学报(自然科学版)》
CAS
2009
2
下载PDF
职称材料
18
基于Hadoop的Web日志挖掘
程苗
陈华平
《计算机工程》
CAS
CSCD
北大核心
2011
64
下载PDF
职称材料
19
读者访问序列模式的探索
郑慧霞
王丽娜
钱庆
《图书情报工作》
CSSCI
北大核心
2010
0
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部