期刊文献+

基于Scrapy的房产信息爬取系统设计 被引量:1

下载PDF
导出
摘要 房价评估系统的模型训练需要海量的数据集,基于Scrapy框架设计并实现了一个房产信息爬取系统,用于爬取网站的房产信息。系统先爬取列表页,获取详情页的URL并入库,然后批量爬取详情页,解析详情页里的房产信息。通过校验数据格式、补全缺失项、去除重复数据、检测异常数据等方式进行数据清洗,得到符合条件的房产数据,系统通过设置抓取频率以及改变User-Agent、IP等方式,降低服务器压力、防止拒绝访问。
出处 《电脑编程技巧与维护》 2022年第12期26-28,共3页 Computer Programming Skills & Maintenance
基金 省级政府项目:基于人工智能技术的房价批量评估模型及其应用平台研究(2021ZDZX3036)。
  • 相关文献

参考文献3

二级参考文献4

共引文献13

同被引文献5

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部