期刊文献+

利用机器学习技术获取WEB页面中的匹配数 被引量:1

下载PDF
导出
摘要 匹配数是搜索引擎给出的信息查询结果数据。匹配数可以反映搜索关键字的出现频率和搜索引擎的数据库规模,也可以集成在应用程序中。不同的搜索引擎中匹配数出现的方式是复杂和不确定的。决策树算法是机器学习中应用最广的归纳推理算法之一,适用于不确定数的判定。本文提出了一种适用于多种搜索引擎的获取匹配数的方法,利用两棵顺序决策树来进行匹配数的判定。实验证明准确率较高,在本实验中达到93%。
作者 孙晨
出处 《中国科教创新导刊》 2007年第23期187-189,共3页 CHINA EDUCATION INNOVATION HERALD
  • 相关文献

参考文献4

  • 1[1]King-Lup Liu,Clement T.Yu,Weiyi Meng,and Adrian Santoso.Discovering the representative of a search engine.In CIKM,pages 577-579,2001.
  • 2[2]Ian H.Witten and Eibe Frank.Data Mining:Practical machine learning tools and techniaues(2nd edition).Morgan Kaufmann,San Francisco,2005.
  • 3[4]Hongkun Zhao,Weiyi Meng,Zonghuan Wu,Vijay Raghavan,and Clement T.Yu.Fully automatic wrapper generation for search engines.In WWW,pages 2005:66-75.
  • 4[5]Bing Liu,Robert L.Grossman,and Yanhong Zhai.Mining web pages for data records.IEEE Intelligent Systems,2004,19(6):49-55.

同被引文献13

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部