期刊文献+

基于页面标签的网页分类研究 被引量:2

下载PDF
导出
摘要 针对Html网页结构的特点,网页的不同标记信息所辖的特征项包含不同的类别信息,通过抽取网页不同标记信息内的特征项并赋予不同权重来表明其重要程度。实验证明该方法比单独依赖网页内容信息的分类在效果上有所提高。
出处 《商场现代化》 2009年第19期100-101,共2页
基金 国家自然科学基金No.10671045~~
  • 相关文献

参考文献4

二级参考文献30

  • 1李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量:95
  • 2谌志群,张国煊.文本挖掘研究进展[J].模式识别与人工智能,2005,18(1):65-74. 被引量:49
  • 3任纪生,王作英.基于特征有序对量化表示的文本分类方法[J].清华大学学报(自然科学版),2006,46(4):527-529. 被引量:4
  • 4李桂芳,刘培玉.一种基于改进遗传算法的文本特征选择方法[J].山东师范大学学报(自然科学版),2007,22(2):17-19. 被引量:4
  • 5Nick Craswell and David Hawking.Overview of the TREC-2002 Web Track.The 10th Text Retrieval Conference,Gaithersburg,2002
  • 6Nick Craswell and David Hawking.Overview of the TREC-2003 Web Track.The 10th Text Retrieval Conference,Gaithersburg,2003
  • 7Min Zhang,etc.THU TREC 2002: Web track experiments.In: Proceedings of Text Retrieval Conference,2002.586
  • 8Shuang Liu,Clement Yu,Wensheng Wu.UIC at TREC 2002: Web Track.In: Proceedings of Text Retrieval Conference,2002.658
  • 9Vo Ngoc Anh,Alistair Moffat.Homepage finding and topic distillation using a common retrieval strategy.In: Proceedings of Text Retrieval Conference,2002.733
  • 10Einat Amitay,David Carmel,Adam Darlow.Topic distillation with knowledge agents.In: Proceedings of Text Retrieval Conference,2002.263

共引文献32

同被引文献22

引证文献2

二级引证文献4

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部