期刊文献+

网络店铺信息自动提取

下载PDF
导出
摘要 以国内C2C行业最具代表性的交易平台--淘宝网为例,设计了针对网络店铺的信息自动提取流程,并利用Python语言实现了对网络店铺信息的自动采集和结构化输出。
出处 《福建电脑》 2011年第2期24-25,37,共3页 Journal of Fujian Computer
基金 厦门理工学院高层次人才项目(YSK09004R)资助
  • 相关文献

参考文献6

二级参考文献12

  • 1吕碧波,赵军.基于相关文档池建模的查询扩展[J].中文信息学报,2006,20(3):78-83. 被引量:7
  • 2丁国栋,白硕,王斌.一种基于局部共现的查询扩展方法[J].中文信息学报,2006,20(3):84-91. 被引量:44
  • 3Yi Lan,Liu Bing.Web Page Cleaning for Web Mining through Feature Weighting[C].In:the proceedings of Eighteenth International Joint Conference on Artificial Intelligence (IJCAI-03),Acapulco,Mexico,2003-08
  • 4Bar-Yossef Z,Rajagopalan S.Template Detection via Data Mining and its Applications[C].In:the proceedings of 11th World Wide Web conference (WWW 2002),Hawaii,USA,2002-05
  • 5Lin S-H,Ho J-M.Discovering Informative Content Blocks from Web Documents[C].In:the proceedings of the ACM SIGKDD International Conference on Knowledge Discovery & Data Mining (SIGKDD'02),Alberta,Canada,2002
  • 6Deng Cai,Yu Shipeng,Wen Jirong et al.VIPS:a vision-based page segmentation algorithm[R].Microsoft Technical Report,MSR-TR-2003-79,2003
  • 7Gupta S,Kaiser G,Neistadt D et al.DOM based Content Extraction of HTML Documents[C].In:the proceedings of the 12th World Wide Web conference (WWW 2003),Budapest,Hungary,2003-05
  • 8Aidan Finn,Nicholas Kushmerick,Barry Smyth.Fact or fiction:Content Classification for digital libraries[C].In:Joint DELOS-NSF Workshop on Personalisation and Recommender Systems in Digital Libraries,Dublin,2001
  • 9CyberNeko HTML Parser.http://www.apache.org/~andyc/neko/doc/html/index.html
  • 10黄萱菁 等.基于向量空间模型的文本过滤系统[A]..中国中文信息学会二十周年学术会议[C].,2001.12-13.

共引文献19

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部