llm-engine
LLM Engine是一款Python库、CLI和Helm图表,能够在Scale托管基础设施或自有Kubernetes云中自定义和部署基础模型。支持LLaMA、MPT和Falcon等开源基础模型的API部署和服务,并允许在自有数据上微调以优化性能。该引擎优化推理功能和开源集成,提高部署和微调效率,未来还将提供K8s安装文档和快速冷启动时间。