WebcamGPT-Vision 项目介绍
WebcamGPT-Vision 是一个轻量级的网页应用,用户可以使用 OpenAI 的 GPT-4 Vision API 处理来自摄像头的图像。该应用可以捕捉用户摄像头中的画面,将其发送到 GPT-4 Vision API,然后展示由人工智能生成的图像描述。
项目版本
WebcamGPT-Vision 项目有三个版本:PHP、Node.js 和 Python/Flask。
功能特点
- 摄像头集成:支持通过摄像头实时捕捉图像。
- 图像处理:利用 OpenAI GPT-4 Vision API 进行图像分析。
- 结果显示:展示AI生成的图像描述。
- 用户界面简洁直观:设计友好,使用简单。
使用前提
在开始使用之前,请确保满足以下要求:
- 使用的是现代网页浏览器。
- 如果使用 PHP 版本:您的服务器支持 PHP 且启用了 cURL。
- 如果使用 Node.js 版本:已安装 Node.js 和 npm。
- 如果使用 Python/Flask 版本:已安装 Python 和 Flask。
- 拿到了 OpenAI 的 GPT-4 Vision API 的 API 密钥。
安装指南
根据您使用的版本,按照以下步骤安装 WebcamGPT-Vision(以下步骤面向所有版本):
PHP 版本
- 克隆项目代码到本地机器或服务器:
git clone https://github.com/bdekraker/webcamgpt-vision.git
- 进入
php-version
目录。 - 在
process_image.php
文件中替换YOUR_DEFAULT_API_KEY
为您实际的 OpenAI API 密钥。 - 将代码上传到支持 PHP 的服务器。
- 打开
index.html
即可开始使用。
Node.js 版本
- 克隆项目代码:
git clone https://github.com/bdekraker/webcamgpt-vision.git
- 进入
js-version
目录。 - 运行
npm install
安装依赖包。 - 在
js-version
目录下创建.env
文件,并添加 OpenAI API 密钥:OPENAI_API_KEY=YOUR_DEFAULT_API_KEY
- 使用
node server.js
启动服务器。 - 在浏览器中访问
http://localhost:3000
(或您设置的其他端口)。
Python/Flask 版本
- 克隆项目代码:
git clone https://github.com/bdekraker/webcamgpt-vision.git
- 进入
python-version
目录。 - 运行
pip install -r requirements.txt
安装依赖包。 - 将您的 OpenAI API 密钥设为环境变量:
export YOUR_DEFAULT_API_KEY='your_actual_api_key_here'
- 使用
python process_image.py
启动 Flask 服务器。 - 在浏览器中访问
http://localhost:5000
。
使用方法
对于所有版本,使用步骤如下:
- 确保连接了能够正常工作且被浏览器允许使用的摄像头。
- 在浏览器中打开
index.html
页面。 - 点击 "Capture" 按钮,从摄像头拍摄快照。
- 应用将处理图像并在摄像头视图下方显示描述。
贡献
欢迎对 WebcamGPT-Vision 项目的贡献。请遵循以下指南:
- 叉当前仓库,并为您的功能或修复创建新分支。
- 撰写清晰简洁的提交信息。
- 确保您的代码符合现有风格。
- 提交一个详细描述您所做更改的拉取请求。
支持
如果您有任何问题或反馈,请在仓库中提交问题,维护人员将尽快回复。
许可证
该项目使用 MIT 许可证 - 详情见 LICENSE.md
文件。
致谢
- 感谢 OpenAI 提供 GPT-4 Vision API。
- 本项目灵感来源于 AI 在图像处理和理解方面的能力。
联系方式
如需联系本项目的维护者,请联系 Benjamin De Kraker。
免责声明
此应用不隶属于 OpenAI,使用 GPT-4 Vision API 需遵循 OpenAI 的条款与条件。请确保遵循 OpenAI 的使用指南,并获得适当的权限使用 API。