Project Icon

bloom-1b7

开源多语言自然语言处理模型

BLOOM-1B7是BigScience项目开发的开源多语言预训练语言模型,支持45种自然语言和12种编程语言。该模型采用改进的Transformer架构,包含17亿参数,在1.5TB多语言语料上训练而成。BLOOM-1B7可用于文本生成、信息提取、问答等多种自然语言处理任务,为研究人员和开发者提供了探索大型语言模型特性的平台。模型遵循RAIL许可证,限制了在高风险场景中的使用,旨在推动语言模型的公共研究。

grok-1 - 314B参数语言模型 支持混合专家系统和8位量化
GithubGrok-1大型语言模型开源权重开源项目模型规格混合专家模型
Grok-1是一个开源的大型语言模型,拥有314B参数和8,192个token的最大序列长度。它采用混合专家系统架构,每个token使用2个专家,包含64层结构。模型具有48个查询注意力头和8个键/值注意力头,嵌入维度为6,144。Grok-1支持激活分片和8位量化。项目提供JAX示例代码用于加载和运行模型,并可通过种子链接或Hugging Face下载权重。
GLM-4 - 多语言支持与长文本处理能力
AI对话GLM-4Github多模态大语言模型开源项目长文本
GLM-4-9B系列是智谱AI推出的开源预训练模型,包括基础版、支持128K上下文的Chat版、1M长文本版及多模态版。该系列支持26种语言,在语义理解、数学计算、逻辑推理等多项评测中表现优异。GLM-4-9B-Chat具备网页浏览、代码执行等功能,GLM-4V-9B则增加了视觉理解能力。这些模型在多项基准测试中均超越了同规模竞品。
Llama-2-7b-hf - Meta开发的开源语言模型 支持多种参数规模和商业应用
GithubHuggingfaceLlama 2人工智能大语言模型开源项目模型自然语言处理预训练模型
Llama-2-7b-hf是Meta推出的开源大型语言模型之一,采用优化的Transformer架构。该模型经过2万亿token预训练,拥有70亿参数,支持4k上下文长度。Llama 2系列提供预训练和微调版本,可用于多种自然语言生成任务。在多项基准测试中表现优异,并支持商业应用,是一个功能强大的开源AI工具。
OLMoE-1B-7B-0924 - 开源混合专家模型,具备高性价比和竞争力
GithubHuggingfaceMixture-of-ExpertsOLMoEallenai大语言模型开源开源项目模型
OLMoE-1B-7B-0924是一个混合专家语言模型,具备1B个活跃和7B总参数,以其高性能和成本效益在同类模型中表现出色,并可竞争于更大规模的模型如Llama2-13B。该项目完全开源,提供了详细的预训练、监督微调及偏好优化的检查点和相关资源,适合自然语言处理领域的研究和开发。
openbuddy-zephyr-7b-v14.1 - 多语言聊天机器人平台支持多种语言的互动
ChatbotGithubHuggingfaceOpenBuddy使用条款免责声明多语言开源项目模型
OpenBuddy支持多种语言,使用transformers库,具备多语言能力和开源许可。用户可通过GitHub访问使用指南和演示,但在高风险环境中使用需注意其固有局限性。
GalTransl-7B-v2.6 - GalTransl-7B模型,专为视觉小说翻译任务设计
GalTransl-7BGithubHuggingfacesakuraumi开源项目显存模型翻译工具视觉小说
GalTransl-7B-v2.6模型专注于视觉小说的日译简中翻译,优化翻译质量与稳定性,适用于主流游戏显卡(显存≥6G)。本模型在翻译质量上优于多款现有大模型,并支持GPT字典,为用户提供量化等级选择以实现硬件和性能的平衡。
xmtf - 通过多任务微调提升跨语言泛化能力
BLOOMZGithubmT0xP3多任务微调开源项目跨语言泛化
XMTF项目探索了通过多语言多任务微调来增强模型的跨语言泛化能力。研究者基于BLOOM和mT5模型,使用xP3数据集进行微调,开发了BLOOMZ和mT0系列模型。这些模型在46种语言的13个任务上接受训练,展现出显著的跨语言和跨任务迁移学习能力。项目公开了完整的数据处理流程、模型训练方法和评估体系,为自然语言处理领域的跨语言研究提供了重要参考。
honeybee - 优化多模态大语言模型性能的局部性增强投影器
GithubHoneybee多模态大语言模型局部性增强投影器开源项目深度学习计算机视觉
Honeybee项目通过局部性增强投影器提升多模态大语言模型性能。该项目在MMB、MME、SEED-I等基准测试中表现优异,提供预训练和微调模型检查点。Honeybee支持多种数据集,包含详细的数据准备、训练和评估指南,为多模态AI研究和开发提供开源工具。
Llama3-OpenBioLLM-70B - 生物医学领域的开源大型语言模型
GithubHuggingfaceOpenBioLLM-70B临床医疗领域开源项目模型模型训练生物医学
由Saama AI Labs开发的OpenBioLLM-70B是专为生物医学设计的开源语言模型。其在高质量数据集上进行微调,以70亿参数的性能在生物医学基准测试中表现优异,甚至超过了更大规模的模型。该模型基于Meta-Llama-3-70B-Instruct等架构,通过多样化的医疗数据集优化生物医学应用,为全球研究人员和开发者在医疗和生命科学领域提供支持。
EXAONE-3.0 - 英韩双语7.8B参数大规模语言模型
EXAONE 3.0Github人工智能开源项目机器学习自然语言处理语言模型
EXAONE 3.0是LG AI Research开发的英韩双语大规模语言模型,参数规模达78亿。该模型通过8T优质数据预训练和指令微调,在MT-Bench等多项评测中表现出色。EXAONE 3.0能够进行跨语言交互,处理复杂指令,并生成准确回应。这一开源项目为自然语言处理研究和应用开发提供了重要工具。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号