相关项目
grok-1
Grok-1是一个开源的大型语言模型,拥有314B参数和8,192个token的最大序列长度。它采用混合专家系统架构,每个token使用2个专家,包含64层结构。模型具有48个查询注意力头和8个键/值注意力头,嵌入维度为6,144。Grok-1支持激活分片和8位量化。项目提供JAX示例代码用于加载和运行模型,并可通过种子链接或Hugging Face下载权重。
Grok-1-GGUF
Grok-1 GGUF量化文件提供对llama.cpp的支持,通过简化的流程提升模型运行效率。可通过llama.cpp从Huggingface直接下载和运行分片文件,支持包括Q2_K、IQ3_XS、Q4_K和Q6_K在内的多种版本,推荐使用IQ3_XS版本。