#Playwright
Contoso Real Estate学习资料汇总 - 企业级JavaScript参考架构
llm-scraper入门指南 - 基于LLM的网页结构化数据提取工具
Bananalyzer: 开源AI代理评估框架为网络任务而生
Contoso Real Estate: 企业级JavaScript参考架构解析
LLM Scraper: 利用人工智能技术将网页转化为结构化数据
LLM-Scraper:利用大语言模型将网页转化为结构化数据的强大工具
llm-scraper
LLM Scraper 是一个 TypeScript 库,使用 LLM 从网页提取结构化数据。支持本地和多种 AI 提供商,提供代码生成功能,基于 Playwright 框架,支持四种格式模式。使用 Zod 定义模式,确保全面的类型安全性。适用于需要高效数据提取和代码生成的开发者。
contoso-real-estate
介绍Contoso Real Estate项目:一种基于JavaScript的企业级参考架构,集成了OpenAI智能、Azure Developer CLI模板以及Playwright测试。该架构展示了构建云原生应用及现代可组合前端的最佳实践和模式,支持Azure部署的JavaScript应用,以及从支付到实时通知的多种功能。
playwright
Playwright框架支持Web测试自动化,单一API覆盖Chromium、Firefox和WebKit。特性包括自动等待、网页断言和跟踪,降低测试不稳定性。支持多标签页、多域名和多用户场景,提供隔离浏览器环境。内置代码生成、检查器和跟踪查看器等工具,助力提高开发效率。
MediaCrawler
MediaCrawler是一款开源的社交媒体数据爬虫工具,支持小红书、抖音、快手等多个主流平台。该工具可采集视频、图片、评论等内容,提供关键词搜索、指定ID爬取等功能。项目采用Playwright技术简化逆向过程,并集成了登录态缓存、IP代理等实用特性。MediaCrawler为社交媒体数据分析提供了便捷的数据采集解决方案。
bananalyzer
Bananalyzer是一个专注于网页任务的开源AI评估框架。它利用Playwright保存网站快照,构建多样化数据集。通过CLI工具,Bananalyzer可对示例网站进行多种评估,包括信息获取和链接抓取。该项目致力于整合现有网页任务数据集,为结构化信息检索提供评估标准,旨在推动AI在Web环境中的应用研究。
playwright-python
Playwright是一个Python跨浏览器自动化测试库,支持Chromium、Firefox和WebKit。通过统一API实现简单高效的自动化测试,具备稳定性、功能性和高性能特点。该库适用于多种Web自动化场景,支持同步和异步编程,并提供完善的文档和API参考。
Octomind
Octomind为web应用提供AI驱动的自动化端到端测试服务。该平台能自动发现、生成和执行Playwright测试用例,支持并行运行和高性能托管。无需访问源代码,可与主流CI/CD管道集成,有效提升测试效率并降低维护成本。
browserless
Browserless是一个基于Docker的云端无头浏览器自动化平台。该项目支持Puppeteer和Playwright等主流库,并提供REST API接口。Browserless解决了字体缺失、性能优化等常见问题,支持文件下载和会话管理。开发者可在云端或本地部署使用,适合遇到资源或技术障碍的无头浏览器自动化需求。非商业用途可免费使用。