Platypus

高效经济的大语言模型微调开源项目

Platypus LLM 微调模型合并开源 Github 开源项目

Platypus是一个开源项目，提供基于LLaMA和LLaMa-2架构的微调和融合模型。该项目使用LoRA和PEFT技术，实现高效的大语言模型微调。Platypus包含完整的训练流程，涵盖数据集精炼、模型微调和权重合并。在多项基准测试中，Platypus展现出优秀性能。这个项目为研究人员和开发者提供了优化定制语言模型的工具。

访问官网

Github

Huggingface

介绍相关项目

pythia - 大语言模型训练过程知识演化分析开源项目

GithubPythia可解释性研究大语言模型学习动态开源项目模型训练

Pythia是一个开源项目,旨在分析大语言模型训练过程中的知识演化。该项目提供完整的模型、数据和代码,包含154个训练检查点,支持研究人员深入探索学习动态和因果关系。Pythia是业界首个支持全面复现和学习动态分析的模型套件,为大语言模型的可解释性研究提供了重要工具。

ChatGLM-Tuning - ChatGLM-6B和LoRA结合的经济型语言模型微调方案

AI模型ChatGLM-6BGithubLoRA开源项目微调深度学习

ChatGLM-Tuning项目是一个基于ChatGLM-6B和LoRA技术的语言模型微调解决方案。该项目包含数据预处理、模型训练和推理功能，支持Alpaca数据集。它提供预训练LoRA模型，并计划引入中文数据和RLHF技术。这一方案适用于16GB以上显存的GPU环境，为开发者提供了一种经济高效的大型语言模型定制途径。

Finetune_LLMs - 引用数据集微调大型语言模型（LLM）的代码

DeepSpeedFinetune LLMsGPTJGithubHuggingfaceNvidia-docker开源项目

Finetune_LLMs 项目提供代码支持DeepSpeed、Lora或QLora方法微调大型语言模型，涵盖从名言数据集学习及利用 Nvidia-docker 简化环境配置，适于需GPU支持的用户。

Chinese-LLaMA-Alpaca-2 - 基于Meta发布的可商用大模型Llama-2开的中文LLaMA&Alpaca大模型的第二期项目

Chinese-LLaMA-Alpaca-2FlashAttention-2Github中文词表大模型开源项目长上下文

Chinese-LLaMA-Alpaca-2项目基于Meta的Llama-2模型开发，提供了全新的中文LLaMA-2基座模型和Alpaca-2指令精调大模型，专注于优化中文词表和扩展模型训练。模型支持大规模中文数据增量训练，显著提升中文语义和指令理解能力。支持4K至64K上下文长度，实现人类偏好对齐，提供多种工具支持部署和应用推广。适用于企业和研究机构进行语言模型深度研发和实用应用，如对话系统和文本分析等。

Llama-3-8B-Magpie-Align-SFT-v0.3 - 多语种微调，新增20万中文指令数据集

GithubHuggingfaceLlama-3-8BMagpie多语言能力对齐数据开源项目模型高质量指令

本项目推出基于Meta-Llama-3-8B模型的改进版本，尤其增强了多语言支持。通过引入20万中文数据集，性能已可媲美官方Llama-3-8B-Instruct模型。该版本主要依赖自我微调，展示出高效执行能力。尽管未用到大量监督数据，模型仍在AlpacaEval与ArenaHard等基准测试中表现优异，提供了比传统高人力成本方法更高效的数据生成方案。

gpt2-lora-random - GPT2模型LoRA微调框架提升语言模型性能的开源项目

GithubHuggingfacegpt2peft开源项目机器学习模型模型训练深度学习框架

gpt2-lora-random项目利用PEFT框架实现GPT2模型的LoRA微调。通过Low-Rank Adaptation技术，该项目降低了模型训练的资源需求和参数量。它为开发者提供了一个用于自然语言处理任务优化的灵活框架。项目文档涵盖了模型训练流程和环境影响评估指南，适合研究人员和工程师使用。

llama3 - Llama 3开源大语言模型推动AI创新与责任发展

GithubLlama 3Meta人工智能大语言模型开源开源项目

Meta推出Llama 3系列大语言模型，参数规模从8B到70B不等，包含预训练和指令微调版本。该系列面向广泛用户群体开放，旨在推动负责任的AI创新。Llama 3具备8192个token的序列处理能力，并提供便捷的加载和推理代码。模型权重和分词器可通过官方网站或Hugging Face平台获取。

OpenGPTAndBeyond - 开源类ChatGPT模型的实现与发展概述

ChatGPTGPT-3GithubLLaMA大语言模型开源开源项目

自LLaMA权重泄露和斯坦福小羊驼取得显著成果以来，开源社区对开发ChatGPT级别的大语言模型充满希望。页面详细记录了从复刻到超越的整个过程，包括基础模型、领域模型、训练、推理、多语言支持、多模态技术等各方面的进展。此外，还提供了丰富的开发和实施指导，从数据准备到低成本推理，并介绍了多个著名开源模型如LLaMA、BLOOM、GPT-J等。它是研究者和开发者理解和推进大语言模型开源发展的全面资源。

Meta-Llama-3-70B - Meta发布Llama 3开源大语言模型系列

GithubHuggingfaceLlama 3Meta人工智能大型语言模型开源项目模型自然语言处理

Meta推出Llama 3大语言模型系列,包含8B和70B参数规模的预训练和指令微调版本。模型在对话任务中表现出色,性能超越多个现有开源聊天模型。Llama 3采用优化的Transformer架构,使用公开在线数据训练,注重提升模型的实用性和安全性。该模型适用于英语商业和研究用途,Meta提供了使用说明、评估结果及负责任的AI开发实践指南。

Llama-3.2-3B-Instruct-GGUF - Meta Llama-3.2-3B模型的GGUF文件和高效微调工具

GithubHuggingfaceLlama 3.2开源开源项目微调机器学习模型语言模型

本项目提供Meta Llama-3.2-3B语言模型的GGUF格式文件，支持2至16位量化。集成的Unsloth工具可大幅提升Llama 3.2、Gemma 2和Mistral等模型的微调效率，速度提升2-5倍，内存减少70%。项目支持在Google Colab上使用Tesla T4 GPU免费微调模型，并可将结果导出为GGUF、vLLM格式或上传至Hugging Face平台。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能，包括文生视频、动态画面和形象生成等，帮助用户快速上手，创造专业级内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台，用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品，帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型，为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能，满足事务性工作的高频需求，帮助撰稿人节省精力，提高效率，优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号