bloom-1b7

开源多语言自然语言处理模型

Huggingface 模型开源人工智能大型语言模型多语言 Github 开源项目 BLOOM

BLOOM-1B7是BigScience项目开发的开源多语言预训练语言模型,支持45种自然语言和12种编程语言。该模型采用改进的Transformer架构,包含17亿参数,在1.5TB多语言语料上训练而成。BLOOM-1B7可用于文本生成、信息提取、问答等多种自然语言处理任务,为研究人员和开发者提供了探索大型语言模型特性的平台。模型遵循RAIL许可证,限制了在高风险场景中的使用,旨在推动语言模型的公共研究。

访问官网

Github

Huggingface

介绍相关项目

grok-1 - 314B参数语言模型支持混合专家系统和8位量化

GithubGrok-1大型语言模型开源权重开源项目模型规格混合专家模型

Grok-1是一个开源的大型语言模型，拥有314B参数和8,192个token的最大序列长度。它采用混合专家系统架构，每个token使用2个专家，包含64层结构。模型具有48个查询注意力头和8个键/值注意力头，嵌入维度为6,144。Grok-1支持激活分片和8位量化。项目提供JAX示例代码用于加载和运行模型，并可通过种子链接或Hugging Face下载权重。

GLM-4 - 多语言支持与长文本处理能力

AI对话GLM-4Github多模态大语言模型开源项目长文本

GLM-4-9B系列是智谱AI推出的开源预训练模型,包括基础版、支持128K上下文的Chat版、1M长文本版及多模态版。该系列支持26种语言,在语义理解、数学计算、逻辑推理等多项评测中表现优异。GLM-4-9B-Chat具备网页浏览、代码执行等功能,GLM-4V-9B则增加了视觉理解能力。这些模型在多项基准测试中均超越了同规模竞品。

Llama-2-7b-hf - Meta开发的开源语言模型支持多种参数规模和商业应用

GithubHuggingfaceLlama 2人工智能大语言模型开源项目模型自然语言处理预训练模型

Llama-2-7b-hf是Meta推出的开源大型语言模型之一，采用优化的Transformer架构。该模型经过2万亿token预训练，拥有70亿参数，支持4k上下文长度。Llama 2系列提供预训练和微调版本，可用于多种自然语言生成任务。在多项基准测试中表现优异，并支持商业应用，是一个功能强大的开源AI工具。

OLMoE-1B-7B-0924 - 开源混合专家模型，具备高性价比和竞争力

GithubHuggingfaceMixture-of-ExpertsOLMoEallenai大语言模型开源开源项目模型

OLMoE-1B-7B-0924是一个混合专家语言模型，具备1B个活跃和7B总参数，以其高性能和成本效益在同类模型中表现出色，并可竞争于更大规模的模型如Llama2-13B。该项目完全开源，提供了详细的预训练、监督微调及偏好优化的检查点和相关资源，适合自然语言处理领域的研究和开发。

openbuddy-zephyr-7b-v14.1 - 多语言聊天机器人平台支持多种语言的互动

ChatbotGithubHuggingfaceOpenBuddy使用条款免责声明多语言开源项目模型

OpenBuddy支持多种语言，使用transformers库，具备多语言能力和开源许可。用户可通过GitHub访问使用指南和演示，但在高风险环境中使用需注意其固有局限性。

GalTransl-7B-v2.6 - GalTransl-7B模型，专为视觉小说翻译任务设计

GalTransl-7BGithubHuggingfacesakuraumi开源项目显存模型翻译工具视觉小说

GalTransl-7B-v2.6模型专注于视觉小说的日译简中翻译，优化翻译质量与稳定性，适用于主流游戏显卡（显存≥6G）。本模型在翻译质量上优于多款现有大模型，并支持GPT字典，为用户提供量化等级选择以实现硬件和性能的平衡。

xmtf - 通过多任务微调提升跨语言泛化能力

BLOOMZGithubmT0xP3多任务微调开源项目跨语言泛化

XMTF项目探索了通过多语言多任务微调来增强模型的跨语言泛化能力。研究者基于BLOOM和mT5模型，使用xP3数据集进行微调，开发了BLOOMZ和mT0系列模型。这些模型在46种语言的13个任务上接受训练，展现出显著的跨语言和跨任务迁移学习能力。项目公开了完整的数据处理流程、模型训练方法和评估体系，为自然语言处理领域的跨语言研究提供了重要参考。

honeybee - 优化多模态大语言模型性能的局部性增强投影器

GithubHoneybee多模态大语言模型局部性增强投影器开源项目深度学习计算机视觉

Honeybee项目通过局部性增强投影器提升多模态大语言模型性能。该项目在MMB、MME、SEED-I等基准测试中表现优异，提供预训练和微调模型检查点。Honeybee支持多种数据集，包含详细的数据准备、训练和评估指南，为多模态AI研究和开发提供开源工具。

Llama3-OpenBioLLM-70B - 生物医学领域的开源大型语言模型

GithubHuggingfaceOpenBioLLM-70B临床医疗领域开源项目模型模型训练生物医学

由Saama AI Labs开发的OpenBioLLM-70B是专为生物医学设计的开源语言模型。其在高质量数据集上进行微调，以70亿参数的性能在生物医学基准测试中表现优异，甚至超过了更大规模的模型。该模型基于Meta-Llama-3-70B-Instruct等架构，通过多样化的医疗数据集优化生物医学应用，为全球研究人员和开发者在医疗和生命科学领域提供支持。

EXAONE-3.0 - 英韩双语7.8B参数大规模语言模型

EXAONE 3.0Github人工智能开源项目机器学习自然语言处理语言模型

EXAONE 3.0是LG AI Research开发的英韩双语大规模语言模型，参数规模达78亿。该模型通过8T优质数据预训练和指令微调，在MT-Bench等多项评测中表现出色。EXAONE 3.0能够进行跨语言交互，处理复杂指令，并生成准确回应。这一开源项目为自然语言处理研究和应用开发提供了重要工具。

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号