期刊文献+

自动抓取元数据标签中DC元数据的模块设计 被引量:1

Module design for automatically grabbing DC metadata in the metadata tags
下载PDF
导出
摘要 由于DC元数据描述网络资源的优越性,基于DC元数据的搜索引擎系统能够克服传统搜索引擎无法理解网页描述语义、检索效率低的缺点。设计该系统最首要的模块就是自动搜集模块,如何自动搜集含DC元数据的网页,如何自动提取其中的DC元数据信息,并加以分析和处理,文章详细介绍了该模块的设计思路和具体的实现方法,并给出部分设计源代码。 Due to the DC metadata description of network resources superiority, the search engine system based on the DC metadata can overcome the faults of traditional search engines that can not understand the semantic web description and retrieval is inefficient. The primary of the system design is automatically searching module, how to be collected automatically WEB pages in- eluding DC metadata, how to extract automatically information of DC metadata, and to analyz and process, the paper introduces in detail the design and realization method, and gives some design code.
出处 《重庆教育学院学报》 2010年第3期9-13,24,共6页 Journal of Chongqing College of Education
基金 重庆市教委科学技术研究项目"利用DC元数据组织和检索网络信息资源的系统设计及应用"(项目编号:KJ081504)的研究成果之一
关键词 自动抓取 元数据标签 DC元数据 crawl automatically metadata tags DC metadata
  • 相关文献

参考文献3

二级参考文献14

  • 1吴冰芝.网络环境下主题语言的应用[J].河南图书馆学刊,2004,24(3):65-67. 被引量:4
  • 2魏丽敏.网络信息资源组织创新研究述评[J].现代情报,2005,25(4):76-78. 被引量:4
  • 3Arvind Arasu,Jasmine Novak,Andrew Tomkins,et al.PageRank computation and the structure of the web:Experiments and algorithms[C].IBM Almaden Research Center.11th International World Wide Web Conference,2002:3-8.
  • 4Allan Borodin,Gareth O Roberts,Jeffrey S Rosenthal,et al.Finding authorities and hubs from link structures on the world wide web[C].Proc 10th International WWW Conference,2001:13-18.
  • 5Lempel R,Moran S.The stochastic approach for link-structure analysis (SALSA) and the TKC effect[J].Computer Networks,2000,33(1-6):387-401.
  • 6Alberto Mendelzon,Davood Rafiei.What do the neighbours think?[J].Computing Web Page Reputations IEEE Data Engineering Bulletin,2000,23(3):9-16.
  • 7Baeza-Yates R,Ribeiro-Neto B.Moderm information retrieval[M].lst ed:New York:Addison Wesley,1999:1-2.
  • 8Matthew Richardson,Pedro Domingos.The intelligent surfer:Probabilistic combination of link and content information in PageRank[C].Cambridge,MA:MIT Press,2002:7-12.
  • 9Taher H Haveliwala.Topic-sensitive PageRank[C].11th International World Wide Web Conference,2002:517-526.
  • 10http://new.xinhuanet.com/it/2006-01/24/content_4092570.htm[EB].

共引文献22

同被引文献10

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部