m2

子二次GEMM架构Monarch Mixer实现高效语言模型

Monarch Mixer M2-BERT 人工智能机器学习自然语言处理 Github 开源项目

Monarch Mixer是一种创新的子二次GEMM架构，用于训练序列长度和模型维度均为子二次的语言模型。该架构使用Monarch矩阵层替代Transformer中的注意力和MLP操作，提高了计算效率。基于此架构的M2-BERT模型在减少25%参数和计算量的同时，在GLUE基准测试中达到了与BERT相当的性能。项目开源了预训练模型权重以及预训练和微调代码，方便研究者进行further研究。

Github

Huggingface

介绍相关项目

SqueezeLLM - 硬件资源优化下的大语言模型量化服务

GithubSqueezeLLM内存优化大语言模型开源项目模型压缩量化

SqueezeLLM通过密集与稀疏量化方法降低大语言模型的内存占用并提升性能，将权重矩阵拆分为易量化的密集组件和保留关键部分的稀疏组件，实现更小内存占用、相同延迟和更高精度。支持包括LLaMA、Vicuna和XGen在内的多个热门模型，提供3位和4位量化选项，适用于不同稀疏度水平。最新更新涵盖Mistral模型支持和自定义模型量化代码发布。

Firefly-LLaMA2-Chinese - 低资源高效的中英文LLaMA2模型预训练与指令微调

Firefly-LLaMA2-ChineseGithubHuggingface中英双语模型低资源增量预训练大模型技术开源项目

本项目专注于低资源增量预训练与多轮指令微调，提升LLaMA2模型在中文领域的表现。支持对多种中英文预训练模型进行扩充与优化，开源了7B和13B的Base与Chat模型。在Open LLM Leaderboard和CMMLU榜单上表现出色，以4*V100完成高效训练，远低于其他模型的GPU资源需求。提供全项目信流程训练代码及数据，对LLaMA2、Baichuan2等多个模型进行详细评测，确保用户获得全面权威的模型性能数据。

llm-finetuning - Modal和axolotl驱动的大语言模型高效微调框架

DeepSpeedGithubLLM微调LoRAModalaxolotl开源项目

这个开源项目整合了Modal和axolotl,为大语言模型微调提供了一个高效框架。它采用Deepspeed ZeRO、LoRA适配器和Flash Attention等先进技术,实现了高性能的模型训练。该框架支持云端部署,简化了资源管理流程,并可灵活适配不同模型和数据集。项目还提供了全面的配置说明和使用指南,方便开发者快速上手和定制化应用。

DeepSeek-Coder-V2-Instruct - 高性能开源MoE代码语言模型支持338种编程语言

AI编程DeepSeek-Coder-V2GithubHuggingface大型语言模型开源模型开源项目模型混合专家模型

DeepSeek-Coder-V2是一个开源的MoE代码语言模型，通过6万亿token的额外预训练，大幅提升了编码和数学推理能力。该模型支持338种编程语言，具有128K的上下文长度，在多项标准基准测试中表现优异。DeepSeek-Coder-V2不仅在代码相关任务中媲美GPT4-Turbo，还在某些方面超越了多个知名闭源模型。

gemma-2-2b - 轻量级文本生成模型，支持多任务应用

GemmaGithubHuggingface开源项目文本生成机器学习模型语言模型谷歌

Gemma是Google推出的开源文本生成模型，专用于问答、文本总结和推理等任务。其模型小巧，易于在笔记本或云基础设施等资源有限的环境中部署。支持多种应用场景，例如内容生成、聊天机器人、自然语言处理研究和语言学习。模型使用多样化来源的数据进行训练，覆盖广泛的语言风格和主题。

bge-micro-v2 - 轻量高效的语义相似度神经网络

GithubHuggingfacesentence-transformers开源项目数据集机器学习模型模型评估自然语言处理

作为一个轻量级语义相似度模型，bge-micro-v2在保持小型化的同时，展现出卓越的文本表示能力。该模型在MTEB多项基准测试中表现出色，包括文本分类、信息检索、文档聚类和语义相似度评估等任务。bge-micro-v2的设计特别适合在计算资源受限的场景下进行高效的语义分析工作。

gemma-2-9b-it-GGUF - AI语言模型量化版本满足多种硬件需求

GPU内存优化GithubHuggingfacegemma-2-9b-it开源项目文件格式转换机器学习模型模型量化

本项目提供Google Gemma 2 9B模型的多种量化版本，涵盖从高质量Q8_0到轻量级IQ2_M。详细介绍了各版本特点、文件大小和推荐用途，并附有下载使用指南。这些优化版本在保持性能的同时大幅减小体积，适配不同硬件和内存需求，使模型能在更多设备上运行。

mint - 从零构建Transformer模型的详细教程和实现

BERTGithubHuggingFaceMinTPyTorchTransformer开源项目

该项目提供了一系列循序渐进的教程，指导从零开始构建常见的Transformer模型，如BERT、GPT、GPT2、BART和T5。教程不仅讲解基本架构的实现，还包括预训练和微调示例，并提供小型PyTorch库以便额外使用。项目依赖HuggingFace的tokenizers库进行子词标记，适用于不同规模数据集的训练需求，还涵盖了多工作节点的分布式训练示例，非常适合希望深入了解Transformer模型原理和应用的学习者。

MiniLM-L12-H384-uncased - 轻量快速的预训练语言模型实现BERT级别性能表现

BERTGithubHuggingfaceMiniLM开源项目模型模型压缩深度学习自然语言处理

MiniLM-L12-H384-uncased通过模型压缩技术将参数量降至33M，在保持与BERT相当性能的同时，运行速度提升2.7倍。模型在SQuAD 2.0和GLUE等自然语言理解任务中表现出色，可直接替代BERT，适用于对模型体积和运行效率敏感的场景。

mamba-130m-hf - 轻量级Mamba模型为序列建模提供高效替代方案

GithubHuggingfaceMambaPEFT微调transformers开源项目模型模型部署生成模型

mamba-130m-hf是基于Mamba架构的轻量级语言模型，专为因果语言建模设计。该模型与Transformers库兼容，支持高效文本生成和序列建模。通过创新的状态空间模型结构，mamba-130m-hf在保持较小参数量的同时展现出卓越性能。模型可用于直接文本生成，也支持通过PEFT等技术进行微调以适应特定任务。其轻量级设计和强大功能使其成为序列建模任务的理想选择。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号