摘要
随着网络信息的大量积累 ,如何充分利用网络资源已成为一个亟待解决的问题 ,将数据库技术应用到Web数据中是一种较好的解决办法 ,而其中则牵涉到Web数据的结构抽取以及采用什么形式描述这种结构 .基于上述情况 ,提出了如何将一个典型的半结构化数据 (HTML网页 )经过模式抽取并转换为XIDM描述形式的方法 。
A method was proposed to solve the schema extraction of a typical semi-structured data (a web page written by HTML) and the schema transformation to XIDM format so as to achieve the integration of the file systems and panorama. A multi-database system was designed.
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2002年第8期18-20,共3页
Journal of Huazhong University of Science and Technology(Natural Science Edition)