#CodeGen

CodeGen - 一系列用于程序合成的开源模型

CodeGenSalesforce AI ResearchProgram SynthesisCodeGen2.5CodeGen2.0Github开源项目

CodeGen是由Salesforce AI Research开发的开源项目，涵盖多个模型版本（350M、1B、3B、7B、16B），专注于程序合成。最新的CodeGen2.5模型在7B参数下超越了16B参数模型的性能。主要更新包括CodeGen2.0的强大补全能力和CodeGen1.0的发布，其性能媲美OpenAI Codex。所有模型均可在Hugging Face Hub上获取，适用于多轮程序合成任务。

codegen-350M-multi - 支持多种编程语言的程序合成模型

训练数据行业应用CodeGen开源项目模型Huggingface多语言模型Github程序合成

CodeGen-Multi 350M是一种程序合成模型，旨在生成可执行代码。其预训练数据来自GitHub的多语言代码库，包括C、C++、Go、Java、JavaScript和Python等。模型具备350M个参数，可以高效生成和补全代码。适用于HumanEval和MTPB等基准测试，为程序合成任务提供了良好的支持。

codegen-2B-multi - 提供多语言程序合成的自回归语言模型

Github开源项目自动生成代码机器学习模型Huggingface程序合成CodeGen多编程语言模型

CodeGen-Multi 2B模型是一种自回归语言模型，经过多个编程语言的大规模数据集预训练，能够合成可执行代码。模型以CodeGen-NL 2B为基础，并在多语言数据上进一步训练，能够从自然语言和编程语言中提取特征。模型在主要代码生成基准上经过评估，可用于从注释生成代码或完成部分代码。用户可借助AutoModelForCausalLM功能加载模型，适用于多种编程语言。

codegen-350M-mono - Python程序合成的自动回归语言模型

Github程序合成模型CodeGen开源项目自动回归语言模型PythonHuggingfaceGoogle TPUs

该模型基于大量Python语言数据训练，旨在合成程序。它可以通过英文提示生成代码，从而用于代码补全任务。

相关文章

Article Cover

CodeGen: Salesforce的开源大语言模型革新代码生成

Article Cover

CodeGen学习资料汇总 - 开源程序合成AI模型

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号