网络店铺信息自动提取
摘要
以国内C2C行业最具代表性的交易平台--淘宝网为例,设计了针对网络店铺的信息自动提取流程,并利用Python语言实现了对网络店铺信息的自动采集和结构化输出。
出处
《福建电脑》
2011年第2期24-25,37,共3页
Journal of Fujian Computer
基金
厦门理工学院高层次人才项目(YSK09004R)资助
参考文献6
-
1郑长松.Web信息智能抽取技术的研究与实现[D].电子科技大学.2009.
-
2刘艳敏,刘飚,封化民,宋国森,方勇.Web页面主题信息抽取研究与实现[J].计算机工程与应用,2006,42(21):146-148. 被引量:11
-
3于海燕,陈晓江,冯健,房鼎益.Web文本内容过滤方法的研究[J].微电子学与计算机,2006,23(9):51-54. 被引量:9
-
4宋吉广译.Pych011核心鳊程(第二版)[M].北京:人民邮电出版社.2008.
-
5王云,黄建.文本搜索的一种间接方法[J].四川兵工学报,2010,31(1):127-128. 被引量:2
-
6周水庚等.基于文件实例的中文信息检索.小型微型计算机系统,:14-16.
二级参考文献12
-
1吕碧波,赵军.基于相关文档池建模的查询扩展[J].中文信息学报,2006,20(3):78-83. 被引量:7
-
2丁国栋,白硕,王斌.一种基于局部共现的查询扩展方法[J].中文信息学报,2006,20(3):84-91. 被引量:44
-
3Yi Lan,Liu Bing.Web Page Cleaning for Web Mining through Feature Weighting[C].In:the proceedings of Eighteenth International Joint Conference on Artificial Intelligence (IJCAI-03),Acapulco,Mexico,2003-08
-
4Bar-Yossef Z,Rajagopalan S.Template Detection via Data Mining and its Applications[C].In:the proceedings of 11th World Wide Web conference (WWW 2002),Hawaii,USA,2002-05
-
5Lin S-H,Ho J-M.Discovering Informative Content Blocks from Web Documents[C].In:the proceedings of the ACM SIGKDD International Conference on Knowledge Discovery & Data Mining (SIGKDD'02),Alberta,Canada,2002
-
6Deng Cai,Yu Shipeng,Wen Jirong et al.VIPS:a vision-based page segmentation algorithm[R].Microsoft Technical Report,MSR-TR-2003-79,2003
-
7Gupta S,Kaiser G,Neistadt D et al.DOM based Content Extraction of HTML Documents[C].In:the proceedings of the 12th World Wide Web conference (WWW 2003),Budapest,Hungary,2003-05
-
8Aidan Finn,Nicholas Kushmerick,Barry Smyth.Fact or fiction:Content Classification for digital libraries[C].In:Joint DELOS-NSF Workshop on Personalisation and Recommender Systems in Digital Libraries,Dublin,2001
-
9CyberNeko HTML Parser.http://www.apache.org/~andyc/neko/doc/html/index.html
-
10黄萱菁 等.基于向量空间模型的文本过滤系统[A]..中国中文信息学会二十周年学术会议[C].,2001.12-13.
共引文献19
-
1邓林,余刘琅,韩江洪.网络干扰性信息过滤对通信效率的影响[J].计算机工程,2007,33(17):190-192.
-
2焦黎冰,封化民,何文才,李雪龙.一种改进的基于Web的新闻视频内容语义分析方法[J].江西师范大学学报(自然科学版),2008,32(2):148-152. 被引量:1
-
3左黎明,汤鹏志.基于WFP系统的网络反黄系统过滤驱动研究[J].华东交通大学学报,2008,25(3):74-77. 被引量:1
-
4高波.网页元素结构化模型的研究[J].常州工学院学报,2008,21(3):43-45.
-
5赵洋,马建斌,刘博,王春山.基于Internet的农业信息资源采集系统[J].农机化研究,2008,30(10):139-141.
-
6焦黎冰,封化民,何文才,李雪龙.一种Web新闻视频内容语义分析[J].北京电子科技学院学报,2008,16(4):43-48.
-
7胡亮,袁芳,齐芸芸.农业垂直搜索引擎信息抽取的研究[J].计算机工程与设计,2009,30(5):1115-1118. 被引量:4
-
8孟军,刘秋水,王秀坤.节点频度和语义距离相结合的网页正文信息抽取[J].计算机工程与应用,2009,45(1):140-143. 被引量:3
-
9沈凤仙,朱巧明,刘钊.基于Netfilter的实时网页内容过滤器的设计与实现[J].微电子学与计算机,2009,26(7):198-201. 被引量:2
-
10苏志芳,张建中,胡惠芳.基于模糊综合评判的中文社科图书“核心作者”决策研究[J].图书情报工作,2010,54(1):42-45. 被引量:14
-
1闫妍.网络店铺的供应链管理模式研究[J].中国科技纵横,2013(21):275-276.
-
2易波.网络店铺的个性化设计[J].湖南包装,2011,26(1):20-22. 被引量:3
-
3大河蟹.增加水印 在图片上写签名[J].网友世界,2009(3):95-95.
-
4鄂尔多斯开展互联网销售业务[J].毛麻科技信息,2011(2):7-7.
-
5网络时代 你的店铺如何开[J].科技创业月刊(创富指南),2010(2):22-31.
-
6姚栋.基于.NET的网络店铺管理系统设计[J].科技广场,2012(1):123-126.
-
7宋继武,李康雷.开网店,迈出创业第一步[J].村委主任,2013(8).
-
8数字热词[J].电脑爱好者,2007(19):18-18.
-
9陈凯.HTML的创意[J].中国信息技术教育,2008(3):29-29.
-
10李浩光.关于网络店铺装饰的研究[J].电脑编程技巧与维护,2013(16):57-58.