#Large Model Collider

llama.go: 纯Go语言实现的LLaMA模型推理框架

3 个月前

Large Model Collider LLaMA Golang 多线程跨平台兼容 Github 开源项目

3 个月前

相关项目

llama.go

llama.go是一个基于Golang的LLM推理项目，旨在通过纯Golang编写的张量数学与多线程优化，实现高效的LLaMA模型推理，替代C++实现。支持LLaMA V1和V2模型架构，兼容Mac、Linux和Windows，涵盖INT8量化、AVX2加速等高级功能。未来计划扩展支持Nvidia GPU、AVX512和INT4量化，并提供内置REST API，适用于真实项目中的服务器模式。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com