PHP培训之Beanbun--PHP 编写的多进程网络爬虫框架,Beanbun 是一个简单可扩展的爬虫框架,支持分布式,支持守护进程模式与普通模式,守护进程模式基于Workerman ,下载器基于Guzzle 。
特点:
支持守护进程与普通两种模式(守护进程模式只支持 Linux 服务器)
默认使用 guzzle 进行爬取
支持分布式
支持内存、Redis 等多种队列方式
支持自定义URI过滤
支持广度优先和深度优先两种爬取方式
遵循 PSR-4 标准
爬取网页分为多步,每步均支持自定义动作(如添加代理、修改 user-agent 等)
灵活的扩展机制,可方便的为框架制作插件:自定义队列、自定义爬取方式...
关于Beanbun--PHP 编写的多进程网络爬虫框架就先为大家说这些,PHP作为开发类的一个语言,现在受到越来越多人的关注,选择PHP培训,轻轻松松做IT高薪白领。