#M1/M2设备

SlowLlama: 在资源受限设备上微调大型语言模型的创新方法

3 个月前

slowllama Llama2 CodeLLama M1/M2设备 GPU Github 开源项目

3 个月前

相关项目

slowllama

slowllama是一个专注于微调Llama2和CodeLLama模型的开源项目，支持70B/35B模型版本，并可在Apple M1/M2设备（如Macbook Air、Mac Mini）或消费级nVidia GPU上运行。通过将模型部分数据转储到SSD或主内存，该项目避免使用量化技巧，优化正向和反向传递性能。采用LoRA方法限制参数更新，操作步骤详尽，包括依赖安装、模型下载和配置脚本，是在资源有限环境下进行大模型微调的理想选择。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com