什么是 QualityScaler?
QualityScaler 是一款由 AI 技术支持的 Windows 应用,用于增强、放大和去噪照片和视频。
其他 AI 项目。🤓
- https://github.com/Djdefrag/RealScaler / RealScaler - 图片/视频 AI 放大工具 (Real-ESRGAN)
- https://github.com/Djdefrag/FluidFrames.RIFE / FluidFrames.RIFE - 视频 AI 帧生成
致谢。
- BSRGAN - https://github.com/cszn/BSRGAN
- Real-ESRGAN - https://github.com/xinntao/Real-ESRGAN
- IRCNN - https://github.com/lipengFu/IRCNN
引用。 ❤
- https://80.lv/articles/80-level-digest-great-ai-powered-tools-for-upscaling-images/
- https://timesavervfx.com/ai-upscale/
如何制作。 🛠
QualityScaler 完全用 Python 编写,从后端到前端。 外部软件包如下:
- AI -> torch / onnxruntime-directml
- GUI -> customtkinter
- 图像/视频 -> OpenCV / moviepy
- 打包 -> Pyinstaller
自行工作。 👨💻
先决条件。
- 在您的电脑上安装 Python,从这里下载(https://www.python.org/downloads/release/python-3119/)
- 在您的电脑上安装 VSCode,从这里下载(https://code.visualstudio.com/)
开始。
- 首先,您需要将项目下载到您的电脑上(绿色按钮 Code > Download ZIP)
- 从 .zip 提取项目目录
- 现在您需要下载 AI 模型(因为文件太大,GitHub 不允许我直接上传它们)
- 在 "AI-onnx" 文件夹中,有下载 AI 模型的链接,下载 .zip 并将文件解压到 AI-onnx 目录中
- 使用 VSCode 打开项目(只需将项目目录拖放到 VSCode 上)
- 从左侧栏中点击 QualityScaler.py(VSCode 会要求您安装一些插件,请继续)
- 现在,您需要安装依赖项。在 VSCode 中有一个 "终端" 面板,点击那里并执行命令 "pip install -r requirements"
- 关闭 VSCode 并重新打开(这将刷新所有已安装的依赖项)
- 只需点击 VSCode 右上角的 "播放按钮"
- 现在应用程序应该可以工作了
要求。 🤓
- Windows 11 / Windows 10
- RAM >= 8GB
- 任何兼容 Directx12 的 GPU,且 VRAM >= 4GB
特点。
- 易于使用的 GUI
- 图像和视频放大
- 多种 AI 模型
- 自动图像平铺和合并以避免 GPU VRAM 限制
- 在 AI 放大前调整图像/视频大小
- 原始图像/视频与放大图像/视频之间的插值
- 兼容的图像格式 - png、jpeg、bmp、webp、tif
- 兼容的视频格式 - mp4、webm、gif、mkv、flv、avi、mov、qt
下一步。 🤫
- 1.X 版本
- 转移到 Pytorch-directml 以支持所有 Directx12 兼容 GPU(AMD、Intel、Nvidia)
- 采用 Windows 11 风格的新 GUI
- 包括放大视频的音频
- 优化视频帧调整和提取速度
- 多 GPU 支持(适用于拥有双 GPU 的电脑,集成 + 独立)
- Python 3.10(预计性能提高约 10%)
- 2.X 版本
- 基于 @customtkinter 全新设计的图形界面
- 同时放大图像和视频(目前可以放大图像或单个视频)
- 同时放大多个视频
- 选择放大视频的扩展名
- 原始图像/视频与放大图像/视频之间的插值
- 更多插值级别(低、中、高)
- 显示完成视频放大的剩余时间
- 支持 SRVGGNetCompact AI 架构
- 从原始文件提取和应用元数据到放大文件(通过 exiftool)
- 支持 SAFMN AI 架构
- 3.X 版本
- 由 onnxruntime-directml 提供动力的新 AI 引擎(https://pypi.org/project/onnxruntime-directml/)
- Python 3.11(性能改进约 10%)
- 在 GUI 中显示图像/视频的放大分辨率
- FFMPEG 7(最新版本)
- 视频多线程 AI 放大
- Python 3.12
- 用户选项保存
- 视频放大暂停和继续功能