摘要
电子商务网站中可以挖掘中大量有价值信息。本文通过数据库与web挖掘技术相结合,对电子商务网站进行挖掘。通过开源的爬虫框架heritrx,对购物网站进行爬取,使用htmlparse对网页进行抽取,对抽取后的数据进行清洗存入数据库中。最后对数据库中的数据进行分析、挖掘,找出有价值的信息,对用户进行推荐等。通过web内容挖掘和数据库技术相结合,所挖掘出来的信息具有较高的可信度,具有一定的价值。
出处
《电子世界》
2014年第19期17-17,共1页
Electronics World
基金
安徽省高校自然科学研究重点项目(编号:KJ2013A217)
安徽省级质量工程项目--精品资源共享课程(2012gxk085)《数据库原理》.