视觉 AI 解决方案加速器
本仓库是一个丰富的资源,提供了大量合成图像生成、操作和推理的示例。利用 Azure 机器学习、计算机视觉、OpenAI 以及广受赞誉的开源框架如 Stable Diffusion,它为用户提供了在图像处理领域应用这些强大工具的实用见解。
内容
- 🆕 引导式图像生成
- 🆕 使用 GPT4-Vision 和视频增强功能查找和分析视频
- 创建引人入胜的头像视频
- 创建交互式头像体验
- 在 Azure 机器学习上使用 Stable Diffusion XL
- Azure 计算机视觉一日工作坊
- 探索 OpenAI DALL E-2 API
- 使用 Azure OpenAI DALL E-2 API 创建图像
- 使用 Florence 基础模型删除图像背景
- 使用 Segment Anything、DALLE-2 和 Stable Diffusion 进行精确修复
- 使用 Dreambooth 为图像生成模型添加自定义对象和风格
- 使用 Stable Diffusion 和 Florence 向量搜索创建和查找图像
- 使用认知搜索向量存储管理图像嵌入
入门指南
本仓库中的代码已在 Github Codespaces 计算和 Azure 机器学习计算实例 上进行了测试。虽然使用 GPU 不是必需的,但如果您打算使用 Stable Diffusion 生成大量样本图像,强烈建议使用 GPU。
按照以下步骤开始:
- 在您首选的计算环境中克隆此仓库,使用以下命令:
git clone https://github.com/Azure/gen-cv.git
- 创建 Python 环境并安装必要的依赖项。我们的开发使用了 Conda。您可以使用以下命令执行相同操作:
conda create -n gen-cv python=3.10
conda activate gen-cv
pip install -r requirements.txt
- 从上面提供的列表中选择一个示例笔记本。选择后,将 Jupyter 笔记本配置为使用与您在步骤 2 中设置的环境相关联的内核。
- 将
.env.template
文件复制到.env
以存储您的参数:
cp .env.template .env
- 在
.env
文件中添加服务所需的参数和密钥。
贡献
本项目欢迎贡献和建议。大多数贡献都要求您同意贡献者许可协议(CLA),声明您有权并且确实授予我们使用您贡献的权利。有关详细信息,请访问 https://cla.opensource.microsoft.com 。
当您提交拉取请求时,CLA 机器人会自动确定您是否需要提供 CLA,并适当地修饰 PR(例如,状态检查、评论)。只需按照机器人提供的说明操作即可。您只需在所有使用我们 CLA 的仓库中执行一次此操作。
本项目已采用 Microsoft 开源行为准则。 有关更多信息,请参阅 行为准则常见问题解答,或联系 opencode@microsoft.com 提出任何其他问题或意见。
商标
本项目可能包含项目、产品或服务的商标或标志。Microsoft 商标或标志的授权使用必须遵守 Microsoft 的商标和品牌指南。 在本项目的修改版本中使用 Microsoft 商标或标志不得引起混淆或暗示 Microsoft 赞助。 任何第三方商标或标志的使用都受这些第三方的政策约束。