Project Icon

Lemur

Lemur:同时具备自然语言与编程能力的开放语言模型

Lemur项目优化了自然语言和编程技能,旨在成为多功能语言代理的基础。通过预训练和指令微调,Lemur在语言和编程基准测试中表现出色,缩小了开源与商业模型的差距。用户可以访问和使用Lemur-70B和Lemur-70B-Chat模型,实现文本和代码生成。项目由XLang Lab与Salesforce Research合作支持,适用于多种应用场景,包括工具使用和环境反馈的适应,并覆盖广泛的语言和交互代理技能评估。

Lemur 项目简介

项目背景

Lemur 项目致力于开发一种开放获取的语言模型,专注于自然语言和代码能力的优化,用以支持多功能的语言代理。随着语言模型从简单的对话机器人发展到能够在现实世界中发挥作用的功能性代理,它们不仅需要强大的语言理解能力,还需要执行操作的能力。Lemur 通过平衡自然语言和代码技能,使得代理能够遵循指令、对任务进行推理以及采取实际行动。

主要功能

Lemur 项目强调以下功能:

  1. 自然语言和代码的结合:大多数现有的开源模型主要在自然语言或代码的某一方面占有优势,而 Lemur 通过同时在这两个方面进行预训练和微调来结合两者的优势。

  2. 两阶段训练

    • 使用 90B 个 token 的语料库以代码和文本 10:1 的比例预训练 Llama-2-70B,得到 Lemur-70B-v1。
    • 在 300K 个包含文本和代码的示例上进行指导调优,得到 Lemur-70B-Chat-v1。

这种两阶段的训练方法在各种语言和代码基准测试中取得了最先进的性能,超越了其他现有的开源模型,并缩小了开源和商业模型在代理能力上的差距。

模型使用方法

Lemur 提供两种主要模型:

  • Lemur-70B-v1:一个基础的语言模型,支持文本生成和代码生成。
  • Lemur-70B-Chat-v1:在 ChatML 格式上进行微调,适用于对话场景。

训练和评估

Lemur 被评估于多种语言和代码数据集,例如 MMLU、BBH、GSM8K、HumanEval 和 Spider,以验证其在文本和代码领域的平衡能力。此外,还在 13 个互动代理数据集上进行测试,以检验其在工具使用、适应环境反馈以及探索部分可见数字或物理环境的技能。

Lemur 提供了多种评估框架,例如 MINT、InterCode 和 WebArena,以评估其互动代理技能。为了部署 Lemur 模型,项目提供了一个使用 vLLM 的 docker。

近期动态

  • 2023年10月18日:开源了 OpenAgents 代码,一个用于野外语言代理的开放平台。
  • 2023年10月11日:公开发布研究论文和代码库,并将持续更新。
  • 2023年8月23日:发布了 OpenLemur/lemur-70b-v1OpenLemur/lemur-70b-chat-v1 的权重。

项目合作

Lemur 项目是 XLang 实验室和 Salesforce Research 之间的开放合作研究成果,得到了 Google Research 和 Amazon AWS 等机构的支持。

总的来说,Lemur 项目的目标是打破自然语言和代码之间的界限,为相关领域的研究和应用提供强有力的支持。通过其开放的资源和不断的完善,Lemur 为开发者和研究人员提供了一个丰富的工具平台。

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号