摘要
从Web上异质的、非结构化的数据中发现有用的知识或者模式是目前数据挖掘研究中的一个重要内容。Web挖掘就是从Web文档和Web活动中抽取感兴趣的、潜在的有用模式和隐藏的信息。介绍了Web挖掘基本情况,在此基础上对基于Web的文本挖掘进行了分析研究,给出了一个基于Web的文本挖掘的结构模型图。重点介绍了网页聚类算法,实现了远程教学的按需学习和因材施教的要求。提出了一个基于Web挖掘的智能化、个性化的现代远程教育系统结构模型。
It's an important content to discover.useful knowledge or pattern from heterogenous non-structure data on Web in the research of data mining. 'Web mining is a process that takes out interesting useful pattern and latent information from Web text and Web activity. Firstly the basic things is introduced of Web mining, then analyzed the text-mining based on Web. A structure chart is proposed about the text mining based on Web. At last, a modern
出处
《科学技术与工程》
2007年第5期742-746,共5页
Science Technology and Engineering
关键词
WEB挖掘
文本挖掘
现代远程教育
个性化
聚类
Web mining text mining modern distance education individuation clustering