🤖 Chrome-GPT: 一个实验性的 AutoGPT 代理,与 Chrome 互动
⚠️这是一个实验性的 AutoGPT 代理,可能会采取错误的行动并导致严重后果。请自行斟酌使用⚠️
Chrome-GPT 是一个使用 Langchain 和 Selenium 的 AutoGPT 实验,使 AutoGPT 代理能够控制整个 Chrome 会话。通过交互式滚动、点击和在网页上输入文本,AutoGPT 代理可以导航和操作网页内容。
🖥️ 演示
输入提示:找一个可以在 4 月 30 日晚上举办 20 人活动的酒吧,如果他们有联系表格,请填写以下信息:姓名 Richard,邮箱 he@hrichard.com。
演示由 Richard He 制作
🔮 功能
- 🌎 谷歌搜索
- 🧠 长期和短期记忆管理
- 🔨 Chrome 操作:描述网页、滚动到元素、点击按钮/链接、输入表单、切换标签
- 🤖 支持多种代理类型:Zero-shot、BabyAGI 和 Auto-GPT
- 🔥 (进行中) Chrome 插件支持
🧱 已知限制
- 网络爬取功能有限,有时按钮和输入字段无法在提示中显示。
- 响应时间较慢,每个操作需要 1-10 秒完成。
- 有时,langchain 代理无法解析 GPT 输出(参考 langchain 讨论: https://github.com/hwchase17/langchain/discussions/4065)。如果遇到这种情况,请尝试指定不同的代理;如:`python -m chromegpt -a auto-gpt -v -t "{your request}"`
要求
- Chrome
- Python >3.8
- 安装 Poetry
🛠️ 设置
- 设置你的 OpenAI API 密钥 并添加
OPENAI_API_KEY
环境变量 - 通过 poetry 安装 Python 依赖
poetry install
- 打开一个 poetry shell
poetry shell
- 通过
python -m chromegpt
运行 chromegpt
你可以在你的代码空间开始:
🧠 使用
- GPT-3.5 使用(默认):
python -m chromegpt -v -t "{your request}"
- GPT-4 使用(推荐,需要 GPT-4 访问权限):
python -m chromegpt -v -a auto-gpt -m gpt-4 -t "{your request}"
- 获取帮助:
python -m chromegpt --help
用法: python -m chromegpt [选项]
运行 ChromeGPT:一个与 Chrome 互动的 AutoGPT 代理
选项:
-t, --task 文本 要执行的任务 [必需]
-a, --agent [auto-gpt|baby-agi|zero-shot]
要使用的代理类型
-m, --model 文本 要使用的模型
--headless 以无头模式运行
-v, --verbose 以详细模式运行
--human-in-loop 在环内人类模式下运行,仅在使用 auto-gpt 代理时可用
--help 显示此消息并退出
或只是更新 .env 并运行
source .env && docker-compose up