#ChatLLM.cpp

ChatLLM.cpp: 高效的CPU大语言模型推理框架

3 个月前

ChatLLM.cpp ggml GPT模型量化模型 CPU推理 Github 开源项目

3 个月前

chatllm.cpp学习资料汇总 - 纯C++实现的大型语言模型推理框架

2 个月前

ChatLLM.cpp ggml GPT模型量化模型 CPU推理 Github 开源项目

2 个月前

相关项目

chatllm.cpp

ChatLLM.cpp项目支持从1B到300B多种模型的高效推理，适用于本地电脑的实时聊天。通过优化的KV缓存和并行计算提升内存使用效率，并提供int4/int8量化以减少内存占用。该项目基于ggml库实现，支持Retrieval Augmented Generation、LoRA以及Python和JavaScript绑定等功能。发布了多种最新模型和工具调用，适合深度学习和自监督学习研究者。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com