WebcamGPT-Vision
WebcamGPT-Vision 是一个轻量级的 Web 应用程序,使用户能够使用 OpenAI 的 GPT-4 Vision API 处理来自其网络摄像头的图像。该应用程序从用户的网络摄像头捕获图像,将它们发送到 GPT-4 Vision API,并显示描述性结果。
该项目有三个版本:PHP、Node.js 和 Python/Flask。
https://github.com/bdekraker/WebcamGPT-Vision/assets/81277770/9e5ed14b-bb8e-4475-9921-471b9d42d009
功能
- 网络摄像头集成用于实时图像捕获。
- 使用 OpenAI 的 GPT-4 Vision API 处理图像。
- 显示 AI 生成的图像描述。
- 简单直观的用户界面。
先决条件
在开始之前,请确保您满足以下要求:
- 您有一个现代的 Web 浏览器。
- 对于 PHP 版本:您有支持 PHP 和启用 cURL 的服务器。
- 对于 Node.js 版本:您已安装 Node.js 和 npm。
- 对于 Python/Flask 版本:您已安装 Python 和 Flask。
- 您已从 OpenAI 获得用于 GPT-4 Vision API 的 API 密钥。
安装
要安装 WebcamGPT-Vision,请按照正确版本的以下步骤进行操作(全部包含在内):
PHP 版本
- 将存储库克隆到您的本地机器或服务器:
git clone https://github.com/bdekraker/webcamgpt-vision.git
- 导航到
php-version
目录。 - 在
process_image.php
文件中用您的实际 OpenAI API 密钥替换YOUR_DEFAULT_API_KEY
。 - 将代码上传到支持 PHP 的服务器。
- 在您的 Web 浏览器中打开
index.html
以开始使用该应用程序。
Node.js 版本
- 克隆存储库:
git clone https://github.com/bdekraker/webcamgpt-vision.git
- 导航到
js-version
目录。 - 运行
npm install
安装依赖项。 - 在
js-version
目录的根目录中创建一个.env
文件并添加您的 OpenAI API 密钥:OPENAI_API_KEY=YOUR_DEFAULT_API_KEY
- 使用
node server.js
启动服务器。 - 在您的 Web 浏览器中通过
http://localhost:3000
(或您配置的端口)访问该应用程序。
Python/Flask 版本
- 克隆存储库:
git clone https://github.com/bdekraker/webcamgpt-vision.git
- 导航到
python-version
目录。 - 运行
pip install -r requirements.txt
安装依赖项。 - 将您的 OpenAI API 密钥设置为环境变量:
export YOUR_DEFAULT_API_KEY='your_actual_api_key_here'
- 使用
python process_image.py
启动 Flask 服务器。 - 在您的 Web 浏览器中通过
http://localhost:5000
访问该应用程序。
使用
对于所有版本,使用方法如下:
- 确保您有一个正常工作的网络摄像头,并允许浏览器使用。
- 在您的 Web 浏览器中打开
index.html
页面。 - 点击“捕捉”按钮从您的网络摄像头拍摄快照。
- 该应用程序将处理图像并在网络摄像头供稿下方显示描述。
贡献
欢迎对 WebcamGPT-Vision 的贡献。请遵守以下指南:
- 分叉存储库并为您的功能或修复创建一个新分支。
- 编写清晰简洁的提交消息。
- 确保您的代码符合现有风格。
- 打开一个带有详细更改描述的拉取请求。
支持
如果您有任何问题或反馈,请在存储库中打开一个问题,维护人员会尽快回复您。
许可证
该项目根据 MIT 许可证 授权 - 请查看 LICENSE.md
文件以了解详细信息。
鸣谢
- 感谢 OpenAI 提供 GPT-4 Vision API。
- 该项目的灵感来源于 AI 在图像处理和理解方面的能力。
联系
如果您需要联系该项目的维护人员,请访问 Benjamin De Kraker。
免责声明
该应用程序与 OpenAI 无关,使用 GPT-4 Vision API 需遵守 OpenAI 的条款和条件。确保您遵循 OpenAI 的使用指南,并拥有适当的权限使用该 API。