-
题名从Web日志中挖掘用户浏览偏爱路径
被引量:87
- 1
-
-
作者
邢东山
沈钧毅
宋擒豹
-
机构
中国科学院计算技术研究所
西安交通大学软件研究所
-
出处
《计算机学报》
EI
CSCD
北大核心
2003年第11期1518-1523,共6页
-
基金
国家自然科学基金 ( 60 173 0 5 8)
国家"八六三"高技术研究发展计划项目 ( 863 3 0 6 ZD 0 2 0 2 )资助
-
文摘
eb日志中包含了大量的用户浏览信息 ,如何有效地从其中挖掘出用户浏览兴趣模式是一个重要的研究课题 .作者在分析目前用户浏览模式挖掘算法存在的问题的基础上 ,利用提出的支持 偏爱度的概念 ,设计了网站访问矩阵 ,并基于这个矩阵提出了用户浏览偏爱路径挖掘算法 :先利用Web日志建立以引用网页URL为行、浏览网页URL为列、路径访问频度为元素值的网站访问矩阵 .该矩阵为稀疏矩阵 ,将该矩阵用三元组法来进行表示 .然后 ,通过对该矩阵进行支持 偏爱度计算得到偏爱子路径 .最后进行合并生成浏览偏爱路径 .实验表明该算法能准确地反映用户浏览兴趣 ,而且系统可扩展性较好 .这可以应用于电子商务网站的站点优化和个性化服务等 .
-
关键词
INTERNET
拓扑结构
WEB日志
数据挖掘
网页浏览频度
用户浏览偏爱路径
电子商务
-
Keywords
Algorithms
Data mining
Electronic commerce
Matrix algebra
Websites
-
分类号
TP393.4
[自动化与计算机技术—计算机应用技术]
F713.36
[经济管理—产业经济]
-
-
题名使用语言最小支持度和偏爱度挖掘偏爱的模糊浏览路径
- 2
-
-
作者
吴瑞
-
机构
山西师范大学数学与计算机学院
-
出处
《小型微型计算机系统》
CSCD
北大核心
2007年第6期1098-1102,共5页
-
文摘
提出了使用语言最小支持度和偏爱度的web日志挖掘方法.表示用户兴趣和偏爱程度的支持度和偏爱度被刻画成相应的模糊语言变量,通过与最小语言支持度和偏爱度(模糊语言变量)比较,判定该网页是否是一个用户偏爱网页,这种语言的输入输出更自然更易理解.此外,网页上的浏览时间也是反映用户兴趣和偏爱的一个重要因素,它也被表示成相应的模糊语言变量,既体现不同网页浏览时间的不同,也可以忽略它们之间的细微差别.所获得的带有模糊时间的用户偏爱浏览路径更能反映用户的兴趣和偏爱性.
-
关键词
WEB使用挖掘
模糊语言变量
用户偏爱浏览路径
支持度
偏爱度
-
Keywords
Web usage mining
fuzzy linguistic variable
users preferred browsing patterns ,support
preference
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于FLAAT模糊的WEB挖掘算法
被引量:2
- 3
-
-
作者
吴瑞
-
机构
山西师范大学数学与计算机学院
-
出处
《武汉科技大学学报》
CAS
2005年第3期270-272,共3页
-
文摘
为了挖掘出较完全的兴趣模式,提出一种新的结构类型———FLAAT,它可发现那些被忽略的用户浏览偏爱路径。同时引进模糊集来处理停留在网页上的时间,以形成语义术语使挖掘出的用户浏览偏爱路径更自然、更易理解。实验表明,该算法能准确地反映用户的浏览兴趣,且系统的可扩展性较好。
-
关键词
WEB日志
WEB挖掘
用户浏览偏爱路径
模糊集
-
Keywords
web log
web mining
user browsing preferred path
fuzzy set
-
分类号
TP273.4
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于FLAAT的模糊WEB挖掘算法
- 4
-
-
作者
吴瑞
张秀玲
-
机构
山西师范大学数学与计算机学院
德州学院化学系
-
出处
《哈尔滨理工大学学报》
CAS
2005年第2期1-3,共3页
-
文摘
提出了一种新的结构类型——FLAAT(FrequentLinkAndAccessTree),它可以发现那些被忽略的用户浏览偏爱路径,同时引进了模糊集来处理停留在网页上的时间以形成语义术语,使挖掘出的用户浏览偏爱路径更自然、更易理解.实验表明,该算法能准确反映用户的浏览兴趣,而且系统的可扩展性较好.
-
关键词
WEB日志
用户浏览偏爱路径
模糊集
-
Keywords
WEB log
user browsing preferred paths
fuzzy set
-
分类号
TP393.07
[自动化与计算机技术—计算机应用技术]
-