autotab-starter 项目介绍
autotab-starter 是一个使用人工智能简化浏览器自动化的工具,能够让用户通过简单的点击记录操作快速生成可审查的自动化脚本。该项目适用于需要快速实现网页自动化的用户,例如重复性任务自动化或网站抓取等。
项目背景
在使用 autotab 的过程中,用户通过浏览器中的演示操作可以瞬间生成执行这些操作的活码。这一过程不需要依赖其他软件或工具,大大降低了用户实施自动化的门槛。项目目前处于 alpha 阶段,开发者也在不断添加新功能和修复可能存在的问题。
快速入门
环境准备
要开始使用 autotab-starter,通常只需 5-10 分钟即可完成设置。用户需要提前安装 Chrome 浏览器,并建议创建一个独立的 Python 虚拟环境。具体步骤如下:
git clone https://github.com/Planetary-Computers/autotab-starter.git
cd autotab-starter
# 推荐:设置一个Python虚拟环境
make install
brew install --cask chromedriver
配置
用户需根据示例 .example.autotab.yaml
文件创建一个 .autotab.yaml
文件以配置凭证。这一步约需时 3 分钟。
使用指南
录制自动化
-
启动录制:通过运行
autotab record
打开一个新的浏览器窗口以开始录制操作。在这一步中,自动化过程将使用.autotab.yaml
文件中的autotab_api_key
自动登录 autotab。用户必须通过 autotab API 密钥进行登录。 -
操作模式:
- 用户可以在侧边栏中使用记录模式记录点击和输入操作(
Command - E
)。 - 使用选择模式(
Command - I
)选择元素以悬停、复制到剪贴板或输入文本。
- 用户可以在侧边栏中使用记录模式记录点击和输入操作(
-
保存代码:结束录制后,用户需要复制生成的代码。autotab 会在
agents/
文件夹中创建一个<agent_name>.py
文件,其中包含了示例代码。用户需将生成的代码粘贴至此文件并修饰格式,即可准备运行。
运行自动化
若用户希望运行已经完成的自动化,可以通过 autotab play --agent <agent_name>
命令实现。默认情况下,此操作会执行 agents/agent.py
脚本。用户可以像调试其他 Python 脚本一样对其进行调试。如果运行中出现交互失败的现象,多是由于 Chrome 窗口未被聚焦。开发团队正在构建一个可以在云端运行的无头版本,以解决这一问题。
注意事项
- 安装依赖:运行
make install
将安装所有必需的依赖项以及本地包,从而启用autotab record
和autotab play
命令。 - 存储凭证:自动化首次登录 Google 时,可能需要进行双重身份验证。相关的 cookies 会自动保存,以便后续避免重复验证。用户需谨慎处理
google_cookies.json
文件,以免敏感信息泄露。 - 免责声明:本项目不提供任何担保,用户在使用代码前需仔细检查。遵循网站使用指南及服务条款,勿从事任何违法或未经授权的活动。默认情况下,autotab 会记录用户数据,用户可以在设置中禁用这些记录选项。
autotab-starter 提供了一个便利的平台,让用户能够快速实现网页自动化。这不仅提升了效率,还为非专业程序员创造了简便的工具使用体验。