摘要
由于DC元数据描述网络资源的优越性,基于DC元数据的搜索引擎系统能够克服传统搜索引擎无法理解网页描述语义、检索效率低的缺点。设计该系统最首要的模块就是自动搜集模块,如何自动搜集含DC元数据的网页,如何自动提取其中的DC元数据信息,并加以分析和处理,文章详细介绍了该模块的设计思路和具体的实现方法,并给出部分设计源代码。
Due to the DC metadata description of network resources superiority, the search engine system based on the DC metadata can overcome the faults of traditional search engines that can not understand the semantic web description and retrieval is inefficient. The primary of the system design is automatically searching module, how to be collected automatically WEB pages in- eluding DC metadata, how to extract automatically information of DC metadata, and to analyz and process, the paper introduces in detail the design and realization method, and gives some design code.
出处
《重庆教育学院学报》
2010年第3期9-13,24,共6页
Journal of Chongqing College of Education
基金
重庆市教委科学技术研究项目"利用DC元数据组织和检索网络信息资源的系统设计及应用"(项目编号:KJ081504)的研究成果之一