#无头浏览器
spider - 快速并发的网络爬虫和索引工具
Github开源项目网络爬虫并发流式处理Spider无头浏览器
Spider是一个开源的网络爬虫和索引工具,以其快速并发能力著称。它提供流式处理、去中心化、Headless Chrome渲染等功能,支持HTTP代理和定时任务。Spider具备智能模式、黑白名单管理、深度控制等特性,并支持动态AI提示脚本和CSS选择器抓取。这些功能使Spider成为适用于多种网络数据采集和处理场景的强大工具。
browserless - 基于Docker的云端无头浏览器自动化平台
Github开源项目DockerPlaywright无头浏览器Puppeteerbrowserless
Browserless是一个基于Docker的云端无头浏览器自动化平台。该项目支持Puppeteer和Playwright等主流库,并提供REST API接口。Browserless解决了字体缺失、性能优化等常见问题,支持文件下载和会话管理。开发者可在云端或本地部署使用,适合遇到资源或技术障碍的无头浏览器自动化需求。非商业用途可免费使用。