-
题名从Web日志中挖掘用户浏览偏爱路径
被引量:87
- 1
-
-
作者
邢东山
沈钧毅
宋擒豹
-
机构
中国科学院计算技术研究所
西安交通大学软件研究所
-
出处
《计算机学报》
EI
CSCD
北大核心
2003年第11期1518-1523,共6页
-
基金
国家自然科学基金 ( 60 173 0 5 8)
国家"八六三"高技术研究发展计划项目 ( 863 3 0 6 ZD 0 2 0 2 )资助
-
文摘
eb日志中包含了大量的用户浏览信息 ,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题 .作者在分析目前用户浏览模式挖掘算法存在的问题的基础上 ,利用提出的支持 偏爱度的概念 ,设计了网站访问矩阵 ,并基于这个矩阵提出了用户浏览偏爱路径挖掘算法 :先利用Web日志建立以引用网页URL为行、浏览网页URL为列、路径访问频度为元素值的网站访问矩阵 .该矩阵为稀疏矩阵 ,将该矩阵用三元组法来进行表示 .然后 ,通过对该矩阵进行支持 偏爱度计算得到偏爱子路径 .最后进行合并生成浏览偏爱路径 .实验表明该算法能准确地反映用户浏览兴趣 ,而且系统可扩展性较好 .这可以应用于电子商务网站的站点优化和个性化服务等 .
-
关键词
INTERNET
拓扑结构
WEB日志
数据挖掘
网页浏览频度
用户浏览偏爱路径
电子商务
-
Keywords
Algorithms
Data mining
Electronic commerce
Matrix algebra
Websites
-
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
F713.36
[经济管理—产业经济]
-
-
题名基于云计算的用户浏览偏爱路径挖掘算法
被引量:6
- 2
-
-
作者
程苗
-
机构
中国科学技术大学管理学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2011年第29期85-89,共5页
-
基金
博士点基金项目(No.200803580024)
创新研究群体科学基金(No.70821001)
-
文摘
从Web日志中挖掘用户浏览偏爱路径是一个重要的研究课题。目前的挖掘算法注重客观访问频度,忽略了用户对这一频繁访问路径是否感兴趣。在分析目前用户偏爱路径挖掘算法存在的问题的基础上,结合网站拓扑结构图修正基于频度的用户偏爱路径的衡量标准,提出了有用偏爱度的概念,从而剔除由于页面放置和链接等因素对挖掘的影响;针对目前基于单一节点的挖掘系统的计算能力不足的问题,利用云计算的分布式处理和虚拟化技术的优势,给出了一种基于云计算的数据处理方法,在此基础上挖掘用户浏览偏爱路径。实验表明,该算法针对大数据量的日志进行挖掘,准确率和效率比普通基于频度进行用户浏览偏爱路径挖掘的算法有所提高。
-
关键词
浏览偏爱路径
云计算
WEB使用挖掘
WEB
日志
-
Keywords
preferred browsing paths
cloud computing
Web usage mining
Web log
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名一种新的基于事物聚类Web浏览偏爱路径挖掘算法
被引量:1
- 3
-
-
作者
李晓静
王树森
-
机构
济源职业技术学院
-
出处
《制造业自动化》
北大核心
2013年第4期65-67,86,共4页
-
文摘
目前的挖掘算法单纯考虑了用户的访问频度,而忽略了用户对访问路径的兴趣度。本文通过分析目前用户偏爱路径挖掘算法存在的问题,结合事物聚类算法,将雅克比系数与最长公共路径系数相乘,得到更准确地用户相似集,并基于一个三元组模型构造以页面兴趣度为元素值的网站浏览数据矩阵,采用改进的挖掘算法计算用户偏爱度和访问兴趣度,降低访问页面闲置及链接等因素对数据挖掘的影响;实验结果表明,该算法针对Web日志海量数据进行挖掘,具有较高的效率和准确率。
-
关键词
事物聚类算法
数据挖掘
WEB日志
浏览偏爱路径
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-
-
题名一种从Web日志中挖掘用户浏览偏爱路径的算法
被引量:1
- 4
-
-
作者
杨旭东
-
机构
吕梁学院计算机科学与技术系
-
出处
《重庆理工大学学报(自然科学)》
CAS
2012年第10期82-88,共7页
-
基金
吕梁学院校内自然科学基金资助项目(ZRXN201215)
-
文摘
针对当前Web站点设计与管理的复杂性以及优化其拓扑结构的需要,提出了一种从Web日志中挖掘用户浏览偏爱路径的算法。该算法引入反映页面浏览频率的访问矩阵与支持-偏爱度,得到访问矩阵行向量间的Hamming距离矩阵,将相似性阈值与其元素值逐一比较,获得候选兴趣子路径2-项集,根据支持-偏爱度阈值,将子路径集中不符的子路径剔除,合并子路径,生成用户浏览偏爱路径。实验结果证明了该算法的有效性。
-
关键词
浏览偏爱路径
站点访问矩阵
支持-偏爱度
HAMMING距离
WEB日志挖掘
-
Keywords
preferred browsing paths
user access matrix
support-preference
Hamming distance
Web log mining
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名使用语言最小支持度和偏爱度挖掘偏爱的模糊浏览路径
- 5
-
-
作者
吴瑞
-
机构
山西师范大学数学与计算机学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2007年第6期1098-1102,共5页
-
文摘
提出了使用语言最小支持度和偏爱度的web日志挖掘方法.表示用户兴趣和偏爱程度的支持度和偏爱度被刻画成相应的模糊语言变量,通过与最小语言支持度和偏爱度(模糊语言变量)比较,判定该网页是否是一个用户偏爱网页,这种语言的输入输出更自然更易理解.此外,网页上的浏览时间也是反映用户兴趣和偏爱的一个重要因素,它也被表示成相应的模糊语言变量,既体现不同网页浏览时间的不同,也可以忽略它们之间的细微差别.所获得的带有模糊时间的用户偏爱浏览路径更能反映用户的兴趣和偏爱性.
-
关键词
WEB使用挖掘
模糊语言变量
用户偏爱浏览路径
支持度
偏爱度
-
Keywords
Web usage mining
fuzzy linguistic variable
users preferred browsing patterns ,support
preference
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Web日志挖掘用户偏爱浏览路径算法
- 6
-
-
作者
苏兰
陆济湘
-
机构
武汉理工大学
-
出处
《电脑知识与技术》
2016年第2Z期221-223,共3页
-
文摘
该文提出一种改进的基于Web日志挖掘用户偏爱浏览路径算法。通过引入站点拓扑结构图来建立用户的访问矩阵,使用夹角余弦公式求出访问矩阵的相似度矩阵,将相似度高的页面归为一类,称为基于相似度矩阵的用户偏爱浏览路径候选集,引入访问矩阵的权重矩阵来降低由于主干路径访问频度高而对挖掘结果造成的影响,结合访问权重利用有效偏爱度过滤上述的候选项集,得出基于权重的用户偏爱浏览路径项集,最后通过合并这些项集得到符合用户浏览习惯的偏爱路径。实验表明该算法更能反映用户真实的浏览兴趣与意图。
-
关键词
偏爱浏览路径
相似度矩阵
权重矩阵
有效偏爱度
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Web日志挖掘用户的浏览兴趣路径
被引量:5
- 7
-
-
作者
王思宝
李银胜
-
机构
复旦大学软件学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2012年第1期164-167,共4页
-
文摘
提出一种基于Web日志发现用户浏览偏爱路径算法。引入了支持-兴趣度概念。建立用户访问矩阵以表示用户浏览网页行为,并获得访问矩阵的海明距离矩阵。通过对距离矩阵与相似度阈值的计算获得偏爱路径的候选2项子路径,再利用支持-兴趣度对候选集做进一步的过滤,最后进行合并并生产浏览偏爱路径。实验表明该算法可以有效地反映用户的浏览兴趣。
-
关键词
偏爱浏览路径
访问矩阵
海明距离
支持-兴趣度
-
Keywords
Preferred browsing paths Access matrix Hamming distance Support-preference
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-
-
题名一种挖掘用户浏览模式的新方法
被引量:6
- 8
-
-
作者
张海玉
刘晓霞
-
机构
西北大学信息科学与技术学院
-
出处
《计算机应用与软件》
CSCD
北大核心
2007年第2期143-144,150,共3页
-
基金
陕西省自然科学基金项目(编号:2006F50)。
-
文摘
提出了页面兴趣度的概念,并把它用一个三元组(页面的访问时间,页面的大小,页面访问次数)表示。这个概念准确地反映了用户对页面的访问情况。在此基础上建立了以引用网页URL为行、浏览网页URL为列,页面兴趣度为元素值的网站访问矩阵。通过对该矩阵计算得到用户浏览偏爱路径。实验表明该算法能准确地反映用户浏览兴趣。
-
关键词
浏览偏爱路径
支持偏爱度
页面兴趣度
-
Keywords
Preferred browsing paths Support-preference Page average interest
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于FLAAT模糊的WEB挖掘算法
被引量:2
- 9
-
-
作者
吴瑞
-
机构
山西师范大学数学与计算机学院
-
出处
《武汉科技大学学报》
CAS
2005年第3期270-272,共3页
-
文摘
为了挖掘出较完全的兴趣模式,提出一种新的结构类型———FLAAT,它可发现那些被忽略的用户浏览偏爱路径。同时引进模糊集来处理停留在网页上的时间,以形成语义术语使挖掘出的用户浏览偏爱路径更自然、更易理解。实验表明,该算法能准确地反映用户的浏览兴趣,且系统的可扩展性较好。
-
关键词
WEB日志
WEB挖掘
用户浏览偏爱路径
模糊集
-
Keywords
web log
web mining
user browsing preferred path
fuzzy set
-
分类号
TP273.4
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于FLAAT的模糊WEB挖掘算法
- 10
-
-
作者
吴瑞
张秀玲
-
机构
山西师范大学数学与计算机学院
德州学院化学系
-
出处
《哈尔滨理工大学学报》
CAS
2005年第2期1-3,共3页
-
文摘
提出了一种新的结构类型——FLAAT(FrequentLinkAndAccessTree),它可以发现那些被忽略的用户浏览偏爱路径,同时引进了模糊集来处理停留在网页上的时间以形成语义术语,使挖掘出的用户浏览偏爱路径更自然、更易理解.实验表明,该算法能准确反映用户的浏览兴趣,而且系统的可扩展性较好.
-
关键词
WEB日志
用户浏览偏爱路径
模糊集
-
Keywords
WEB log
user browsing preferred paths
fuzzy set
-
分类号
TP393.07
[自动化与计算机技术—计算机应用技术]
-
-
题名基于用户行为个性化学习研究
被引量:2
- 11
-
-
作者
陈小莉
-
机构
重庆广播电视大学远程教育技术中心
-
出处
《电脑知识与技术》
2009年第4期2779-2781,共3页
-
文摘
Web日志中包含了大量的用户浏览信息,对Web日志进行分析可以发现用户偏好路径容。本文提出了一种基于Web日志挖掘出用户浏览偏爱的路径,根据路径对应的文档内容提取用户偏爱的主题,并向用户推荐偏爱主题内容,从而为个性化学习服务。
-
关键词
WEB日志挖掘
浏览偏爱路径
浏览兴趣度
-
Keywords
Web log minig
path choice-preference
browsing interest
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Web日志的用户访问模式挖掘
被引量:2
- 12
-
-
作者
徐海兰
崔荣一
-
机构
延边大学工学院计算机科学与技术系智能信息处理研究室
-
出处
《延边大学学报(自然科学版)》
CAS
2009年第2期164-166,共3页
-
文摘
利用相对访问率——支持-偏爱度的概念,设计了网站访问矩阵及时间矩阵,并利用这两个矩阵得到用户浏览偏爱路径.实验表明该算法能够准确地反映用户的浏览兴趣,可应用于个性化推荐服务中.
-
关键词
WEB挖掘
WEB日志
访问模式
浏览偏爱路径
-
Keywords
Web mining
Web log
visit pattern
browsing preference paths
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-