llama_cpp-rs

Rust绑定库实现GGUF大语言模型CPU运行

llama_cpp-rs Rust绑定大语言模型 GGUF CPU运行 Github 开源项目

llama_cpp-rs是一个Rust绑定库，用于在CPU上运行GGUF大语言模型。它提供简洁的API，支持快速模型加载和文本生成。该项目兼容CUDA、Vulkan等后端，并包含内存预测功能。llama_cpp-rs简化了大语言模型的使用流程，适合各层级开发者。

llama-node - 支持多语言大模型推理的Node.js库

GithubLLaMA NodeNode.js安装开源项目推理库模型支持

llama-node是一个支持多种大语言模型推理的Node.js库，兼容LLaMA、RWKV等模型。它基于llm、llama.cpp、rwkv.cpp，使用napi-rs实现消息传递。支持模型包括Alpaca、GPT4All等，适用于多平台如macOS、Linux和Windows。项目处于早期阶段，API可能会更新。

Llama-3.2-3B-Instruct-uncensored-GGUF - 量化的语言模型版本，促进文本生成与信息获取

GithubHugging FaceHuggingfaceLlama-3.2-3B-Instruct-uncensored内幕交易开源项目文本生成模型量化

Llama-3.2-3B-Instruct-uncensored-GGUF项目是一个未过滤的量化语言模型版本，增强了文本生成的多样性和信息获取效率。通过llama.cpp的量化处理，该模型在保持高效性能的同时输出高质量响应。其特点包括在敏感话题上的信息提供更全面，响应拒绝次数少。支持研究和开发中的多场景应用，用户可以在相关平台上进行交互，实现从文本生成到信息提取的多领域应用。

llama-2-7b-chat-bnb-4bit - 开源LLM模型训练加速工具实现2至5倍速提升并节省70%内存

GithubHuggingfaceLlama-2Unsloth人工智能大语言模型开源项目模型模型微调

该开源项目致力于优化大语言模型的训练过程，通过创新技术为Mistral、Gemma、Llama 2等主流模型提供训练加速解决方案。基于Colab平台的多个训练笔记本支持对话及文本补全功能，可实现2-5倍的训练速度提升，并将内存占用降低70%。项目支持GGUF格式导出及vLLM、Hugging Face平台部署，为计算资源受限的AI开发团队提供了高效的模型训练方案。

Llama-3.2-3B-Instruct-GGUF - Meta Llama-3.2-3B模型的GGUF文件和高效微调工具

GithubHuggingfaceLlama 3.2开源开源项目微调机器学习模型语言模型

本项目提供Meta Llama-3.2-3B语言模型的GGUF格式文件，支持2至16位量化。集成的Unsloth工具可大幅提升Llama 3.2、Gemma 2和Mistral等模型的微调效率，速度提升2-5倍，内存减少70%。项目支持在Google Colab上使用Tesla T4 GPU免费微调模型，并可将结果导出为GGUF、vLLM格式或上传至Hugging Face平台。

rwkv.cpp - 多精度量化推理和CPU优化的大语言模型

GithubPythonRWKVcuBLASggmlhipBLAS开源项目

该项目将RWKV-LM移植到ggerganov的ggml，支持FP32、FP16及量化的INT4、INT5和INT8推理，主要针对CPU使用，同时兼容cuBLAS。项目提供C库和Python封装。RWKV是一种不同于Transformer的大语言模型架构，只需前一步状态计算logits，适合长上下文使用。支持RWKV v5和v6模型以及LoRA检查点加载，适用于高质量和高性能需求的场景。

llama2.c - 轻量级Llama 2模型推理引擎的纯C语言实现

AI模型C语言GithubLlama 2开源项目模型推理

llama2.c是一个用纯C语言实现的Llama 2模型推理引擎,仅需700行代码即可运行PyTorch训练的模型。项目设计简洁易用,提供从训练到推理的完整方案,支持Meta官方和自定义小型Llama 2模型。通过模型量化技术,llama2.c能够提升推理速度并缩小模型体积,为轻量级大语言模型部署提供了高效解决方案。

Llama-3-Smaug-8B-GGUF - Llama-3-Smaug-8B模型的GGUF格式文件支持多级量化

GGUF模型GithubHuggingfaceLlama-3-Smaug-8B人工智能助手开源项目文本生成模型量化

Llama-3-Smaug-8B-GGUF项目提供abacusai/Llama-3-Smaug-8B模型的GGUF格式文件，支持2-bit至8-bit多级量化。项目介绍了使用llama.cpp加载模型的方法，并概述了GGUF格式及其兼容工具。该资源有助于用户了解GGUF格式，选择适合的工具进行本地部署和文本生成应用。

llama3-8B-DarkIdol-2.2-Uncensored-1048K-GGUF - 多语言支持的llama3-8B GGUF量化模型，提供多级压缩优化

GGUFGithubHuggingfacellama3大语言模型开源项目权重压缩模型量化模型

llama3-8B GGUF量化模型支持英语、日语和中文，提供3.3GB至16.2GB多种压缩版本，适应不同硬件需求。Q4_K系列在性能和质量上表现均衡。模型基于transformers库开发，适用于角色扮演和偶像相关场景。用户可通过Hugging Face平台获取各版本及其性能对比信息。

rust - Rust语言TensorFlow绑定，支持多平台和GPU加速

GithubRustTensorFlow安装开源项目文档绑定

TensorFlow Rust提供符合Rust语言习惯的TensorFlow绑定，支持便捷下载或编译TensorFlow共享库和GPU加速。该项目仍在活跃开发，API尚未完全稳定。用户可以通过在Cargo.toml中添加依赖项并运行cargo build来构建，详见文档和示例代码。

Llama-3-8B-Instruct-32k-v0.1-GGUF - Llama-3 8B指令模型GGUF版本支持多位量化及广泛应用

GGUFGithubHuggingfaceLlama-3开源AI开源项目模型自然语言处理量化模型

本项目提供Llama-3-8B-Instruct-32k-v0.1模型的GGUF格式文件。GGUF是llama.cpp团队开发的新格式，取代了旧有的GGML。该模型支持2至8位量化，主要用于文本生成。它与多款主流本地运行框架和界面工具兼容，如llama.cpp、LM Studio和text-generation-webui等。这些工具普遍支持GPU加速，使模型能够适应多样化的应用需求。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com