摘要
论述从网络日志数据中挖掘读者访问序列模式的数据准备和算法过程,初步构建了融合FS和NPPMA两种算法的Web访问序列挖掘模型。基于支持度的FS算法是网络访问序列挖掘的经典方法,但数据处理的过程和方法比较复杂,用时较长;而基于支持-偏爱度的NPPMA算法,在序列模式的计算上,同时考虑了访问频度和偏爱度,比FS算法更能准确挖掘出读者浏览的兴趣模式,而且具有数据处理简单的优点,大大节约了时间。
出处
《图书情报工作》
CSSCI
北大核心
2010年第S1期271-274,共4页
Library and Information Service