#Llama

Sequoia学习资料汇总 - 可扩展、鲁棒的树形推测解码算法

1 个月前

Sequoia是一个可扩展、鲁棒的树形推测解码算法,本文汇总了Sequoia项目的学习资料,包括官方文档、代码库、论文等,帮助读者快速了解和上手这一算法。

Sequoia speculative decoding Llama growmap 接受率向量 Github 开源项目

1 个月前

OpenChat: 革新开源语言模型的新篇章

2 个月前

OpenChat是一个创新的开源语言模型库,通过C-RLFT技术从混合质量数据中学习,即使是7B小型模型也能达到与ChatGPT相当的性能。本文深入探讨了OpenChat的特点、优势及其在自然语言处理领域的重要意义。

OpenChat 语言模型人工智能开源 Llama Github 开源项目

2 个月前

探索LLaMA: Meta AI的开创性大语言模型

2 个月前

本文深入解析了Meta AI推出的LLaMA大语言模型,介绍了其架构、性能和应用,并探讨了如何使用Gradient平台快速部署和测试LLaMA模型。

Llama 提示词 AI助手开源模型对话结构 Github 开源项目

2 个月前

LLMtuner: 一种简化大型语言模型微调的开源框架

2 个月前

LLMtuner是一个实验性的开源框架,旨在通过简洁的scikit-learn风格接口,简化Whisper、Llama等大型语言模型的微调过程。

LLMTuner LLM微调 LoRA Whisper Llama Github 开源项目

2 个月前

Sequoia: 可扩展、强健且硬件感知的推测解码算法

2 个月前

Sequoia是一种创新的推测解码算法,旨在提高大型语言模型的推理效率。本文深入探讨了Sequoia的核心原理、主要特点及其在提升AI模型性能方面的重要意义。

Sequoia speculative decoding Llama growmap 接受率向量 Github 开源项目

2 个月前

MergeKit入门指南 - 强大的预训练语言模型合并工具包

1 个月前

MergeKit是一个用于合并预训练大型语言模型的强大工具包。它支持多种合并算法,可在资源受限的情况下执行复杂的模型合并,是AI研究人员和开发者的有力助手。

mergekit Hugging Face 模型融合 Llama GPT-NeoX Github 开源项目

1 个月前

BlockMerge Gradient: 革新性的语言模型融合技术

2 个月前

BlockMerge Gradient 是一种创新的技术，允许通过梯度参数来融合两个微调过的 Llama 1/2 语言模型。这种方法可以创建模型集成或将两个不同模型的优势结合到一个单一模型中，为自然语言处理领域带来了新的可能性。

BlockMerge Gradient 语言模型模型融合梯度值 Llama Github 开源项目

2 个月前

Llama模型：开放、强大的大规模语言模型

2 个月前

Llama是Meta公司开发的开源大规模语言模型系列，旨在为开发者、研究人员和企业提供强大的AI工具，推动生成式AI的创新和发展。

Llama 大语言模型开源人工智能自然语言处理 Github 开源项目

2 个月前

FireAct: 基于React、Firebase和Stripe的开源SaaS项目框架

2 个月前

FireAct是一个基于React、Firebase和Stripe构建的开源SaaS项目框架,旨在帮助开发者快速搭建具备用户管理、订阅支付等功能的Web应用。本文将详细介绍FireAct的特性、使用方法及最新进展。

FireAct 语言代理精调 Llama OpenAI API Github 开源项目

2 个月前

MergeKit: 一个强大的预训练语言模型合并工具包

2 个月前

MergeKit是一个开源的预训练语言模型合并工具包，它提供了多种先进的模型合并方法，可以在资源受限的情况下执行复杂的模型合并操作。MergeKit支持多种模型架构，并提供了GPU和CPU执行、低内存使用、参数插值等多项实用功能。

mergekit Hugging Face 模型融合 Llama GPT-NeoX Github 开源项目

2 个月前

相关项目

mergekit

MergeKit是一款合并预训练语言模型的工具，支持Llama、Mistral、GPT-NeoX等多种模型。该工具采用先进的方法，在资源有限的情况下执行复杂的合并操作。MergeKit可以在CPU或最低8GB VRAM环境下运行，支持多种合并算法，如线性插值、任务算术、TIES等。还提供图形用户界面并集成到Hugging Face Spaces，简化了模型合并流程。

LLMtuner

LLMTuner 提供类 scikit-learn 接口，让用户便捷微调如 Llama、Whisper 等大型语言模型。通过 LoRA 和 QLoRA 等技术实现高效微调，内置推理功能和一键启动的交互式 UI，简化模型展示和共享。此外，LLMTuner 还支持未来在 AWS 和 GCP 等平台上的部署。欢迎加入 PromptsLab 社区，探索和讨论最新的开源模型调优技术。

Sequoia

Sequoia项目提供了可扩展、稳定且硬件感知的推断系统环境，支持Llama系列模型，灵活调整温度和Top-p参数，并提供详细的实验再现指南。通过pip命令简便地设置环境，使用bash脚本进行测试，调整示例数量和随机种子来重现结果。Sequoia还具备生成接收率向量和生成树结构图的工具，满足各类实验需求。未来计划包括支持更多开源模型、多轮对话、INT4/8量化以及多GPU功能。

FireAct

FireAct项目提供了语言模型微调的完整解决方案，包括示例代码、提示词和训练数据。该项目详细介绍了如何在Llama和GPT等多任务模型上进行数据生成、监督微调和推理操作。项目包含适用于Alpaca和GPT格式的训练数据样本，并配有使用案例和模型卡，方便快速部署和应用。支持OpenAI和SERP API集成，具体信息请参考项目仓库与Hugging Face模型卡。

llama-models

llama-models是Meta开发的开放大型语言模型项目，为AI开发者、研究人员和企业提供易用的工具。项目包含Llama 2、Llama 3和Llama 3.1等多个版本，支持不同模型规模和上下文长度。llama-models注重开放性、生态系统支持和安全性，为AI创新与负责任发展奠定基础。

llama

Llama 2是Meta公司开发的开源大语言模型系列，提供7B至70B参数的预训练和微调模型。该项目为研究和商业用途提供模型权重和代码，支持多样化的自然语言处理应用。Llama 2注重负责任的AI发展，实施严格的使用政策。项目包含多个仓库，构建了从基础模型到端到端系统的完整技术栈，为AI领域的创新和应用提供了重要支持。

awesome-korean-llm

本资源列表全面汇总了韩语开源大语言模型(LLM)信息。内容涵盖Polyglot-Ko、KoAlpaca、KULLM等多种韩语LLM模型,提供模型规模、开发者、基础架构等核心数据。同时按基础模型对韩语LLM进行分类,包括基于Polyglot-Ko、Llama、Llama-2等的不同类型。该列表为韩语自然语言处理研究者提供了重要参考。

AutoCompressors

AutoCompressors是一项创新语言模型技术，可将长文本上下文压缩为少量摘要向量并进行推理。该项目提供官方实现，包含预训练模型、安装指南和示例代码。支持Llama-2和OPT等基础模型，有效提升长文本处理能力，为自然语言处理开辟新途径。

BlockMerge_Gradient

BlockMerge_Gradient是一款专为Llama 1/2语言模型设计的融合工具，通过梯度混合两个微调模型的层级来创建模型集成。该工具支持自定义梯度值和最大分片大小，可选择性处理层级或非层级张量。它能处理不同词汇表大小的模型，并自动复制相关分词器文件，提供灵活的模型融合方案。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com