-
题名基于Web日志的个性化搜索引擎模型的发现
被引量:6
- 1
-
-
作者
鲍钰
-
机构
华东师范大学软件学院
-
出处
《计算机应用研究》
CSCD
北大核心
2009年第5期1806-1809,共4页
-
基金
国家"973"计划资助项目(2005CB321904)
-
文摘
个性化搜索是指同样的关键字对不同的人返回其感兴趣的搜索结果。对于不同的用户个体,同样的关键字可能有不同含义,如关键字"apple"被爱好音乐的人士理解为Apple iPod,但也会被健康饮食的人士理解为apple fruit。每次用户搜索关键字的过程,都会被记录在网站服务器的后台日志中。通过若干挖掘算法,将Web原始日志信息进行用户识别,会话分组后,提取单一用户多次会话中的搜索关键字关联规则,为实现个性化搜索引擎提供参考。
-
关键词
WEB日志
个性化搜索
单用户搜索关键字关联规则发现算法
-
Keywords
Web logs
personal Web search
SUSKARD algorithm
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名挖掘最大频繁模式的新方法
被引量:15
- 2
-
-
作者
刘君强
孙晓莹
王勋
潘云鹤
-
机构
浙江工商大学计算机信息工程学院
浙江大学计算机科学与技术学院
-
出处
《计算机学报》
EI
CSCD
北大核心
2004年第10期1328-1334,共7页
-
基金
浙江省自然科学基金 (60 2 14 0 )
国家"八六三"高技术研究发展计划项目基金 (2 0 0 2AA12 10 64 )
浙江省教育厅科技计划基金 (2 0 0 2 0 63 5 )资助
-
文摘
由于其内在的计算复杂性 ,挖掘密集型数据集的频繁模式完全集非常困难 ,解决方案之一是挖掘最大频繁模式集 .该文在频繁模式完全集挖掘算法OpportuneProject基础上 ,提出了挖掘最大频繁模式的新算法MOP .它采用宽度与深度优先相结合的混合搜索策略 ,能恰当地选择不同的支持集表示和投影方法 ,将闭合性剪裁和一般性剪裁相结合 ,并适时前窥 ,实现搜索与剪裁效率最优化 .实验表明 ,MOP效率是MaxMiner的 2~ 8倍 ,比MAFIA高 2个数量级以上 .
-
关键词
知识发现
数据挖掘
最大频繁模式
关联规则
混合搜索策略
完全集挖掘算法
MOP
-
Keywords
knowledge discovery
data mining
maximal frequent patterns
association rules
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-