#Grok-1

grok-1 - 314B参数语言模型支持混合专家系统和8位量化

Grok-1大型语言模型混合专家模型开源权重模型规格Github开源项目

Grok-1是一个开源的大型语言模型，拥有314B参数和8,192个token的最大序列长度。它采用混合专家系统架构，每个token使用2个专家，包含64层结构。模型具有48个查询注意力头和8个键/值注意力头，嵌入维度为6,144。Grok-1支持激活分片和8位量化。项目提供JAX示例代码用于加载和运行模型，并可通过种子链接或Hugging Face下载权重。

Grok-1-GGUF - Grok-1 GGUF量化支持llama.cpp的最新特性

模型下载huggingfacellama.cpp量化HuggingfaceGithub开源项目Grok-1模型

Grok-1 GGUF量化文件提供对llama.cpp的支持，通过简化的流程提升模型运行效率。可通过llama.cpp从Huggingface直接下载和运行分片文件，支持包括Q2_K、IQ3_XS、Q4_K和Q6_K在内的多种版本，推荐使用IQ3_XS版本。

相关文章

Article Cover

Grok-1: xAI的开创性大语言模型

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号