摘要
为了分析网络用户的浏览行为特征,实现科学平台的网络个性化服务,用广义频繁子序列挖掘算法,该算法挖掘Web服务器日志中的用户浏览路径,设计科学平台用户的浏览模式,为用户提供主动式信息服务。经过对日志文件的预处理,得到用户会话文件,然后采用广义频繁子序列挖掘算法对用户浏览模式进行识别。实际应用表明,这种广义频繁子序列识别方法能够有效地发现用户的兴趣所在,从而更好地为用户在线浏览提供帮助。
Web activity can be person al ized by analyzing user browsing behavior. This analysis can be used to improve t he performance of science platform. This paper introduces a method for providing active information services for science platform users by using Web log mining based on a frequent generalized subsequences algorithm. The data preparation pro duces user session files which are then mined using the frequent generalized sub sequences algorithm for browsing patterns. An example illustrates how this metho d of finding user navigation paths provides better online service for the users.
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2003年第7期873-875,共3页
Journal of Tsinghua University(Science and Technology)
基金
国家自然科学基金重点资助项目(69934010)
国家教育振兴计划项目
关键词
数据挖掘
数据库
科学平台
WEB服务器日志
广义序列
用户浏览
广义频繁子序列
database theory and system
science platform
Web logs
generalized sequenc es
data mining
frequent subsequences
browsing pattern