Project Icon

llama3

Llama 3开源大语言模型 推动AI创新与责任发展

Meta推出Llama 3系列大语言模型,参数规模从8B到70B不等,包含预训练和指令微调版本。该系列面向广泛用户群体开放,旨在推动负责任的AI创新。Llama 3具备8192个token的序列处理能力,并提供便捷的加载和推理代码。模型权重和分词器可通过官方网站或Hugging Face平台获取。

🤗 Hugging Face 上的模型  | 博客  | 网站  | 开始使用 


废弃声明

感谢您使用Llama模型进行开发。作为Llama 3.1发布的一部分,我们已经整合了GitHub仓库,并随着Llama功能扩展成为端到端Llama堆栈而添加了一些新的仓库。请今后使用以下仓库:

  • llama-models - 基础模型的中心仓库,包括基本工具、模型卡片、许可证和使用政策
  • PurpleLlama - Llama堆栈的关键组件,专注于安全风险和推理时缓解措施
  • llama-toolchain - 模型开发(推理/微调/安全防护/合成数据生成)接口和规范实现
  • llama-agentic-system - 端到端独立Llama堆栈系统,以及用于创建代理应用程序的基础接口
  • llama-recipes - 社区驱动的脚本和集成

如果您有任何问题,请随时在上述任何仓库中提出问题,我们将尽最大努力及时回复。

谢谢!

(已废弃) Meta Llama 3

我们正在释放大型语言模型的力量。我们最新版本的Llama现在可供个人、创作者、研究人员和各种规模的企业使用,以便他们能够负责任地进行实验、创新和扩展他们的想法。

此版本包括预训练和指令微调的Llama 3语言模型的模型权重和启动代码 —— 包括8B到70B参数的规模。

这个仓库是加载Llama 3模型和运行推理的最小示例。有关更详细的示例,请参阅llama-recipes

下载

要下载模型权重和分词器,请访问Meta Llama网站并接受我们的许可协议。

一旦您的请求被批准,您将通过电子邮件收到一个签名URL。然后,运行download.sh脚本,在提示时输入提供的URL以开始下载。

前提条件:确保您已安装wgetmd5sum。然后运行脚本:./download.sh

请记住,链接在24小时后或达到一定下载次数后将过期。如果您开始看到诸如403: Forbidden之类的错误,您可以随时重新请求链接。

访问Hugging Face

我们还在Hugging Face上提供下载,包括transformers和原生llama3格式。要从Hugging Face下载权重,请按照以下步骤操作:

  • 访问其中一个仓库,例如meta-llama/Meta-Llama-3-8B-Instruct
  • 阅读并接受许可协议。一旦您的请求被批准,您将获得对所有Llama 3模型的访问权限。请注意,请求处理可能需要长达一小时的时间。
  • 要下载原始原生权重以与此仓库一起使用,请单击"Files and versions"选项卡并下载original文件夹的内容。如果您pip install huggingface-hub,也可以从命令行下载:
huggingface-cli download meta-llama/Meta-Llama-3-8B-Instruct --include "original/*" --local-dir meta-llama/Meta-Llama-3-8B-Instruct
  • 要与transformers一起使用,以下pipeline代码片段将下载并缓存权重:

    import transformers
    import torch
    
    model_id = "meta-llama/Meta-Llama-3-8B-Instruct"
    
    pipeline = transformers.pipeline(
      "text-generation",
      model="meta-llama/Meta-Llama-3-8B-Instruct",
      model_kwargs={"torch_dtype": torch.bfloat16},
      device="cuda",
    )
    

快速开始

您可以按照以下步骤快速开始使用Llama 3模型。这些步骤将让您在本地运行快速推理。有关更多示例,请参阅Llama recipes仓库

  1. 在安装了PyTorch / CUDA的conda环境中克隆并下载此仓库。

  2. 在顶级目录中运行:

    pip install -e .
    
  3. 访问Meta Llama网站并注册以下载模型。

  4. 注册后,您将收到一封包含下载模型URL的电子邮件。运行download.sh脚本时,您将需要此URL。

  5. 收到电子邮件后,导航到您下载的llama仓库并运行download.sh脚本。

    • 确保授予download.sh脚本执行权限
    • 在此过程中,系统将提示您输入电子邮件中的URL。
    • 请勿使用"复制链接"选项;手动从电子邮件中复制链接。
  6. 下载所需的模型后,您可以使用以下命令在本地运行模型:

torchrun --nproc_per_node 1 example_chat_completion.py \
    --ckpt_dir Meta-Llama-3-8B-Instruct/ \
    --tokenizer_path Meta-Llama-3-8B-Instruct/tokenizer.model \
    --max_seq_len 512 --max_batch_size 6

注意

  • Meta-Llama-3-8B-Instruct/替换为您的检查点目录路径,将Meta-Llama-3-8B-Instruct/tokenizer.model替换为您的分词器模型路径。
  • –nproc_per_node应设置为您使用的模型的MP值。
  • 根据需要调整max_seq_lenmax_batch_size参数。
  • 此示例运行此仓库中的example_chat_completion.py,但您可以将其更改为其他.py文件。

推理

不同的模型需要不同的模型并行(MP)值:

模型MP
8B1
70B8

所有模型都支持最多8192个标记的序列长度,但我们根据max_seq_lenmax_batch_size值预分配缓存。因此,请根据您的硬件设置这些值。

预训练模型

这些模型没有针对聊天或问答进行微调。应该以期望的答案是提示的自然延续的方式来提示它们。

请参阅example_text_completion.py中的一些示例。为了说明,请看下面使用llama-3-8b模型运行它的命令(nproc_per_node需要设置为MP值):

torchrun --nproc_per_node 1 example_text_completion.py \
    --ckpt_dir Meta-Llama-3-8B/ \
    --tokenizer_path Meta-Llama-3-8B/tokenizer.model \
    --max_seq_len 128 --max_batch_size 4

指令微调模型

经过微调的模型是为对话应用程序而训练的。要获得它们的预期功能和性能,需要遵循ChatFormat中定义的特定格式:提示以<|begin_of_text|>特殊标记开始,之后是一条或多条消息。每条消息以<|start_header_id|>标签开始,角色为systemuserassistant,然后是<|end_header_id|>标签。在双换行符\n\n之后,是消息的内容。每条消息的结尾由<|eot_id|>标记标记。

您还可以部署额外的分类器来过滤掉被认为不安全的输入和输出。有关如何在推理代码中添加安全检查器的示例,请参阅llama-recipes仓库中的示例

使用llama-3-8b-chat的示例:

torchrun --nproc_per_node 1 example_chat_completion.py \
    --ckpt_dir Meta-Llama-3-8B-Instruct/ \
    --tokenizer_path Meta-Llama-3-8B-Instruct/tokenizer.model \
    --max_seq_len 512 --max_batch_size 6

Llama 3是一项新技术,使用时可能存在潜在风险。迄今为止进行的测试尚未 —— 也无法 —— 涵盖所有场景。 为帮助开发人员应对这些风险,我们创建了《负责任使用指南》

问题

请通过以下方式之一报告任何软件"错误"或其他与模型相关的问题:

模型卡片

请参阅MODEL_CARD.md

许可证

我们的模型和权重授权给研究人员和商业实体使用,坚持开放原则。我们的使命是通过这个机会赋予个人和行业力量,同时培育一个发现和道德AI进步的环境。

请参阅LICENSE文件,以及我们随附的可接受使用政策

问题

有关常见问题,可以在这里找到FAQ,随着新问题的出现,FAQ将不断更新。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号