摘要
针对Web挖掘中异构数据源和半结构化的特点,提出了基于XML的Web挖掘框架模型实现用户兴趣数据的挖掘。分析了该模型的工作流程,重点讨论了实现该模型的关键技术:XML文档统一模型、Web内容预处理模块和Web内容挖掘模块。
Aiming at the characteristics of web mining in the different data source and half structure, propose a web mining frame model based on XML realizing user interest data mine. Analyze the workflow of the model. Discuss the technologies of this model with emphasis: XML documents unification model, Web content pretreatment module and web data mining module.
出处
《仪器仪表学报》
EI
CAS
CSCD
北大核心
2006年第z3期2613-2614,共2页
Chinese Journal of Scientific Instrument
基金
金华职业技术学院信息工程学院科研(XX2005-15-13)资助项目