项目介绍:Fuji-Web
Fuji-Web 是一个基于人工智能技术的全浏览器自动化工具。它能够智能理解用户意图,提供自主导航,执行任务,并在执行过程中详细解释每一个步骤。这个项目的设计初衷是成为用户的智能小伙伴,帮助用户在网上更高效地完成各种任务。
工作原理
Fuji-Web 使用先进的AI技术,能够自动浏览网站并执行任务。用户指示它需要完成的任务后,该工具便会自动执行,并逐步解释其执行步骤,帮助用户理解整个过程。
安装与使用
浏览器中下载和安装扩展
- 访问 Fuji-Web 的 GitHub 发布页面,找到最新版本的扩展程序,并下载
fuji-extension.zip
文件。 - 解压下载的文件。
- 在 Chrome 浏览器中加载扩展:
- 打开浏览器并导航到
chrome://extensions/
- 切换到
开发者模式
- 点击
加载未打包的扩展程序
- 选择解压缩后的文件夹
- 打开浏览器并导航到
使用扩展
可能需要刷新页面以使扩展正常工作。找到浏览器右上角的 Fuji 图标并点击打开侧边栏。在侧边栏中,创建或访问现有的 OpenAI API Key 或 Anthropic API key,并将其粘贴到提供的输入框中。密钥将被存储在浏览器中,不会上传至第三方。最后,导航至希望使用 Fuji-Web 操作的网页,并输入你期望工具执行的任务。
构建扩展
若希望从源码构建扩展,应按以下步骤操作:
- 确保安装了 Node.js(开发环境为 Node v20,但部分低版本可能也兼容)。
- 克隆此仓库。
- 全局安装
pnpm
:npm install -g pnpm
- 执行
pnpm install
- 执行
pnpm dev
启动开发服务器,或运行pnpm build
构建扩展。
加载扩展时,需要加载由构建过程创建的 dist
文件夹。
项目计划
Fuji-Web 未来的发展方向包括:
- 提供API接口,以便于与浏览器自动化框架(如 Puppeteer、Playwright、Selenium)的集成。
- 支持更复杂的跨标签页操作流程。
- 增强浏览行为功能,如选择下拉菜单、提取整个页面内容等。
- 支持保存和共享工作流程及说明。
- 创建类似维基百科的知识库,用户可以共同创建知识,提升 Fuji-Web 的性能。
问题解决
有关常见问题的帮助信息,请参考我们的问题解决指南。
贡献
如果您对Fuji-Web感兴趣并希望贡献自己的力量,我们欢迎您的加入!请查阅我们的贡献指南,了解如何贡献、报告问题、提议增强等更多信息。我们还在 Discord 上设立了专门的频道,用于 Fuji-Web 的反馈交流。
致谢
Fuji-Web 的图像注释方法受到微软的 UFO 论文启发。作为一个侧边工具的设想来自于 TaxyAI 的浏览器扩展项目,我们也借鉴了一部分他们的 UI 代码。Chrome 扩展设置使用了 Jonghakseo/chrome-extension-boilerplate-react-vite 的优秀模板项目。Fuji 的 Logo 则来源于 Toss Face 的 Emoji 设计套件。