专栏名称: 菜鸟学Python
简简单单的Python教程,从入门,进阶技巧,爬虫数据分析,数据可视化等,以及经验和技巧的总结,趣味原创文章:破解九宫格,破解Google面试题,情人节选对象,微软面试题,弹球游戏,聊天机器人等,欢迎关注
今天看啥  ›  专栏  ›  菜鸟学Python

介绍一款能取代 Scrapy 的爬虫框架 - feapder

菜鸟学Python  · 公众号  · Python  · 2021-04-21 08:44

文章预览

1. 前言 众所周知,Python 最流行的爬虫框架是 Scrapy,它主要用于爬取网站结构性数据 今天推荐一款更加简单、轻量级,且功能强大的爬虫框架:feapder 项目地址: https://github.com/Boris-code/feapder 2. 介绍及安装 和 Scrapy 类似,feapder 支持轻量级爬虫、分布式爬虫、批次爬虫、爬虫报警机制等功能 内置的 3 种爬虫如下: AirSpider 轻量级爬虫,适合简单场景、数据量少的爬虫 Spider 分布式爬虫,基于 Redis,适用于海量数据,并且支持断点续爬、自动数据入库等功能 BatchSpider 分布式批次爬虫,主要用于需要周期性采集的爬虫 在实战之前,我们在虚拟环境下安装对应的依赖库 # 安装依赖库 pip3  install feapder 3. 实战一下 我们以最简单的 AirSpider 来爬取一些简单的数据 目标网站: aHR0 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览