热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#Rocket 3B
rocket-3B-llamafile - 提供多操作系统兼容的高效量化模型文件格式
开源项目
DPO
模型兼容性
模型
Huggingface
Rocket 3B
llamafile
量化
Github
项目提供了Rocket 3B模型的llamafile格式文件,支持在多平台上进行高效的GPU和CPU推理。由Mozilla Ocho引入的llamafile格式结合Cosmopolitan Libc,能将LLM权重转化为适用于各大操作系统的llama.cpp二进制文件。项目提供多种量化选项,用户可以根据需求选择不同的llamafile进行加载与运行,并通过如llama-cpp-python、ctransformers等工具享受GPU加速的便利。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号