#Grok-1
grok-1 - 314B参数语言模型 支持混合专家系统和8位量化
Grok-1大型语言模型混合专家模型开源权重模型规格Github开源项目
Grok-1是一个开源的大型语言模型,拥有314B参数和8,192个token的最大序列长度。它采用混合专家系统架构,每个token使用2个专家,包含64层结构。模型具有48个查询注意力头和8个键/值注意力头,嵌入维度为6,144。Grok-1支持激活分片和8位量化。项目提供JAX示例代码用于加载和运行模型,并可通过种子链接或Hugging Face下载权重。
Grok-1-GGUF - Grok-1 GGUF量化支持llama.cpp的最新特性
模型下载huggingfacellama.cpp量化HuggingfaceGithub开源项目Grok-1模型
Grok-1 GGUF量化文件提供对llama.cpp的支持,通过简化的流程提升模型运行效率。可通过llama.cpp从Huggingface直接下载和运行分片文件,支持包括Q2_K、IQ3_XS、Q4_K和Q6_K在内的多种版本,推荐使用IQ3_XS版本。