期刊文献+

探究ID3分类算法的深度网络爬虫设计方法

下载PDF
导出
摘要 随着网络技术不断的发展,互联网作为海量信息的载体已全面渗透到经济社会的各个领域,推动着我国向信息化社会发展。搜索引擎技术正在从以移动互联网为标志的个人需求精准搜索向以物联网为标志的实体搜索发展。本文探讨了一种按照ID3算法分类的深度网络爬虫设计方法,该方法按照ID3算法对页面进行收集、分析、处理和分类,从而提取深度表单数据,能够使搜索引擎减少搜索盲区,有效的改善和优化搜索结果。
作者 王芳芳
出处 《数字技术与应用》 2015年第3期114-114,共1页 Digital Technology & Application
  • 相关文献

参考文献6

二级参考文献39

  • 1夏天,樊孝忠,刘林.利用JNI实现ICTCLAS系统的Java调用[J].计算机应用,2004,24(B12):177-178. 被引量:24
  • 2陈士杰,张玥杰.基于Lucene的英汉跨语言信息检索[J].计算机工程,2005,31(13):62-64. 被引量:12
  • 3Bergman M K.The deep web:surfacing hidden value[J].BrightPlanet In Journal of Electronic Publishing,2001,7(1)
  • 4Chang K C C,He B,Li C,et al.Structured databases on the web:observations and Implications[J].SIGMOD Record,2004:61-70
  • 5Alexandros Ntoulas,Petros Zerfos,Junghoo Cho.Downloading textual hidden web content through keyword queries[J].JCDL'05,Denver,Colorado,USA,2005
  • 6McCallum A,Nigam K,Rennie J,et al.Building domainspecific search engines with machine learning technique[C].In Procs.of AAAI Spring Symposium on Intelligents Engine in Cyberspace,1999
  • 7Maedche A.Ontology learning for the semantic web[M].Boston:Kluwer Academi Publishers,2002
  • 8Jakarta Lucene Home Page.[2006-04-30].http://Jakarta.apache.org/lucene/.
  • 9张华平.Chinese lexical analyzer ICTCLAS API manual.[2006-05- 12].http://sewm.pku.edu.cn/QAIreference/ICTCLASI ICTCLAS_API.htm.
  • 10Thanaa M.Ghanem,Walid G.Aref.Databases deepen the Web[J].IEEE Computer,2004,73(1):116-117.

共引文献53

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部