MFLUX: 在Mac上本地运行强大的FLUX模型

Ray

MFLUX简介

MFLUX(MacFLUX)是一个基于Apple MLX框架的FLUX模型实现,旨在让用户能够在Mac电脑上本地运行强大的FLUX图像生成模型。FLUX模型由Black Forest Labs开发,是一种先进的文本到图像生成模型。

MFLUX的核心理念是保持代码简洁明了,同时优先考虑可读性而非通用性和性能。它是Hugging Face Diffusers库中FLUX实现的逐行移植版本,使用Apple MLX框架重新实现。

MFLUX logo

MFLUX的主要特点

  • 支持FLUX.1-Schnell和FLUX.1-Dev两种模型
  • 代码简洁,网络架构硬编码,最小化依赖
  • 除tokenizer外,所有模型都使用MLX从头实现
  • 支持4位和8位量化,可大幅提升生成速度和降低内存占用
  • 提供灵活的命令行参数,方便调整生成参数

安装和使用

安装步骤

  1. 克隆MFLUX仓库:
git clone git@github.com:filipstrand/mflux.git
  1. 进入项目目录并创建虚拟环境:
cd mflux && python3 -m venv .venv && source .venv/bin/activate
  1. 安装依赖:
pip install -r requirements.txt

生成图像

MFLUX提供了简单的命令行接口用于生成图像。以下是使用Schnell模型生成图像的示例:

python main.py --model schnell --prompt "Luxury food photograph" --steps 2 --seed 2

对于更强大但速度较慢的Dev模型,可以增加时间步数:

python main.py --model dev --prompt "Luxury food photograph" --steps 25 --seed 2

⚠️ 注意:如果模型尚未下载,程序会自动开始下载模型权重(Schnell或Dev模型约34GB)。可以使用量化版本来减小模型体积。

命令行参数

MFLUX提供了丰富的命令行参数,允许用户灵活调整生成过程:

  • --prompt: 生成图像的文本描述(必填)
  • --model-m: 使用的模型,可选"schnell"或"dev"(必填)
  • --output: 输出图像文件名(默认为"image.png")
  • --seed: 随机数种子(默认基于时间)
  • --height: 输出图像高度(默认1024像素)
  • --width: 输出图像宽度(默认1024像素)
  • --steps: 推理步数(默认4步)
  • --guidance: 引导系数(仅用于"dev"模型,默认3.5)
  • --path: 本地模型路径
  • --quantize-q: 量化级别(4位或8位)

性能对比

MFLUX在不同Mac设备上的图像生成速度各不相同。以下是使用Schnell模型,2个时间步,1024x1024分辨率生成图像的性能数据:

设备用户报告时间备注
M3 Max@karpathy~20s
M2 Ultra@awni<15s
2023 M2 Max (96GB)@explorigin~25s
2021 M1 Pro (16GB)@qw-in~175s可能会导致Mac卡顿
2023 M3 Pro (36GB)@kush-gupt~80s
2020 M1 (8GB)@mbvillaverde~335s512x512分辨率
2022 M1 MAX (64GB)@BosseParra~55s
2021 M1 Pro (32GB)@filipstrand~160s
2023 M2 Max (32GB)@filipstrand~70s

高级功能:量化

MFLUX支持4位和8位量化模式,可以显著提升生成速度并降低内存占用。以下是使用8位量化模式生成图像的示例:

python main.py \
    --model schnell \
    --steps 2 \
    --seed 2 \
    --quantize 8 \
    --height 1920 \
    --width 1024 \
    --prompt "Tranquil pond in a bamboo forest at dawn, the sun is barely starting to peak over the horizon, panda practices Tai Chi near the edge of the pond, atmospheric perspective through the mist of morning dew, sunbeams, its movements are graceful and fluid — creating a sense of harmony and balance, the pond's calm waters reflecting the scene, inviting a sense of meditation and connection with nature, style of Howard Terpning and Jessica Rossier" 

量化效果对比

量化不仅可以加速生成过程,还能大幅减少模型占用的磁盘空间:

4 位8 位原始 (16 位)
9.85GB18.16GB33.73GB

保存和加载量化模型

MFLUX允许用户将量化后的模型保存到本地磁盘,以便后续快速加载使用:

python save.py \
    --path "/Users/username/Desktop/schnell_8bit" \
    --model schnell \
    --quantize 8

加载并使用保存的量化模型:

python main.py \
    --path "/Users/username/Desktop/schnell_8bit" \
    --model schnell \
    --steps 2 \
    --seed 2 \
    --height 1920 \
    --width 1024 \
    --prompt "Your prompt here"

结语

MFLUX为Mac用户提供了在本地运行强大FLUX模型的便捷方式。通过简洁的实现和灵活的配置选项,用户可以轻松生成高质量图像,同时得益于Apple MLX框架的优化,实现较快的生成速度。量化功能进一步增强了MFLUX的实用性,使其能够在资源受限的设备上高效运行。

尽管MFLUX目前仍有一些限制,如一次只能生成一张图像、不支持负面提示词等,但项目团队正在积极开发新功能,如LoRA适配器、LoRA微调以及前端界面支持等。随着持续的改进和社区贡献,MFLUX有望成为Mac平台上强大而灵活的图像生成工具。

🔗 相关链接:

avatar
0
0
0
相关项目
Project Cover

flux

Flux是Black Forest Labs开发的开源AI框架,用于文本到图像和图像到图像的转换。该项目提供pro、dev和schnell三个模型版本,满足不同性能需求。Flux支持本地部署、API调用及Diffusers集成,具有良好的灵活性。其代码简洁,接口直观,便于创意工作者和开发者使用。

Project Cover

mflux

mflux是基于Apple MLX框架的FLUX模型开源实现,为Mac设备优化的AI图像生成工具。它支持本地运行FLUX.1-Schnell模型,可生成1024x1024分辨率图像,无需云服务。项目代码简洁,专注于模型表达,适合学习和开发。未来计划支持更多FLUX模型和功能。

Project Cover

3D_Render_for_Flux

基于Flux技术,探索高质量3D渲染和图像生成的潜力。利用特定关键词,可生成逼真的人物、动物及自然景观。无论是构建真实场景还是创作多彩角色,该项目提供了明确的指引满足创作者需求。基础模型由Black Forest Labs开发,并可遵循Apache-2.0许可证下载使用。

Project Cover

AWPortrait-FL

AWPortrait-FL是一款基于FLUX.1-dev优化的AI肖像生成模型。该模型结合了AWPortrait-XL的训练数据和2000余张高品质时尚摄影作品,显著提升了图像的构图和细节表现,尤其在皮肤质感和纹理细节方面更加精细逼真。用户可通过Diffusers库进行模型调用,同时提供LoRA版本以优化内存占用。需注意,AWPortrait-FL遵循flux-1-dev非商用许可协议,生成的图像仅限非商业用途。

Project Cover

Midjourney

该项目利用FLUX.1-dev模型创建Midjourney风格的AI图像。其特点在于能将文本转换为艺术性强、细节丰富的图像,适用于人物、动物、室内等多种场景。模型通过特定触发词启动,支持多样化主题的图像生成。模型权重以Safetensors格式提供,可从Files & versions页面下载使用。

Project Cover

mlx-FLUX.1-schnell

项目在DiffusionKit MLX中提供文本到图像生成能力,适用于创意设计师及内容创作者。通过简单的命令行操作即可生成高细节图像,渲染出逼真的视觉效果。基于Apache 2.0许可证,确保广泛应用和可扩展性。

Project Cover

flux-tarot-v1

该模型是基于FLUX.1-dev训练的LoRA模型,使用1920年Raider Waite塔罗牌数据集进行训练。通过触发词可生成具有典型塔罗牌艺术特征的图像,支持多种场景创作。模型能够输出复古塔罗风格的AI图像,可应用于需要塔罗牌艺术风格的创意工作中。

Project Cover

FLUX.1-schnell-gguf

FLUX.1-schnell-gguf是一个基于black-forest-labs/FLUX.1-schnell模型的GGUF格式转换项目,通过与ComfyUI-GGUF自定义节点集成实现文本到图像的生成。模型支持多种量化类型,安装时需将文件放置于ComfyUI/models/unet目录。该项目采用Apache-2.0开源协议发布,可用于图像生成相关的开发和研究工作。

Project Cover

flux-controlnet-depth-v3

FLUX.1-dev模型的Depth ControlNet控制器,专注于1024x1024分辨率的图像生成控制。v3版本在真实度方面有显著提升,集成ComfyUI支持,提供训练脚本、配置文件和推理演示。项目支持通过GitHub仓库和ComfyUI工作流快速部署使用。

最新项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号