fairseq2

先进序列建模工具包支持多任务自定义模型训练

fairseq2 序列建模自然语言处理机器学习开源项目 Github

fairseq2是由Facebook AI Research开发的序列建模工具包，作为fairseq的后续版本，为研究人员和开发者提供了强大的自定义模型训练功能。它支持包括LLaMA系列、Mistral 7B和NLLB-200在内的多种先进模型，可用于翻译、摘要和语言建模等任务。fairseq2提供Linux和macOS的预构建包，兼容多种PyTorch和CUDA版本，为序列建模研究和应用提供了灵活的解决方案。

访问官网

Github

介绍相关项目

parseq - 创新的场景文本识别统一模型

ECCVGithubPARSeq场景文本识别开源项目深度学习计算机视觉

PARSeq是一种创新的场景文本识别模型，采用置换自回归序列方法，实现了上下文无关和上下文感知推理及迭代预测细化。该模型统一了现有STR解码方法，无需独立语言模型，在多个基准数据集上展现出优异性能，同时保持较低计算成本。PARSeq支持灵活的字符集训练和多种评估配置，为OCR应用提供了高效而强大的解决方案。

llm-toys - 微调小型语言模型实现多任务处理

Githubllm-toys任务微调低资源模型对话摘要开源项目语气变化

llm-toys 项目提供适用于释义、语气转换、对话总结和主题生成等任务的小型量化3B和7B语言模型。这些经过微调的模型能在普通消费级硬件上高效运行，并通过简单的安装步骤提升文本处理和生成能力。

llms_tool - 多功能大语言模型训练测试工具包

GithubHuggingFaceRLHF分布式训练大语言模型开源项目预训练

llms_tool是一个基于HuggingFace的大语言模型工具包，支持多种模型的训练、测试和部署。它提供预训练、指令微调、奖励模型训练和RLHF等功能，支持全参数和低参数量训练。工具包集成WebUI和终端预测界面，以及DeepSpeed分布式训练。涵盖ChatGLM、LLaMA、Bloom等主流模型，提供多种训练方法和量化选项。

faster-whisper-large-v2 - 多语言语音识别模型支持高效转录和翻译

CTranslate2GithubHuggingfaceWhisper开源项目模型模型转换自然语言处理语音识别

faster-whisper-large-v2是基于OpenAI Whisper large-v2模型转换的CTranslate2格式语音识别模型。该模型支持100多种语言的音频转录和翻译，性能高效且语言覆盖范围广泛。开发者可通过faster-whisper库轻松使用，实现强大的多语言语音处理。模型采用FP16格式保存权重，可在加载时根据需求调整计算类型，适应不同应用场景。

w2v-bert-2.0 - 大规模多语言语音编码器

GithubHuggingfaceSeamless CommunicationTransformersW2v-BERT 2.0开源项目模型语音编码器预训练模型

W2v-BERT 2.0是一款开源的多语言语音编码器，基于Conformer架构设计。该模型包含6亿参数，在4.5百万小时的无标签音频数据上进行预训练，涵盖143种语言。作为Seamless系列的核心组件，W2v-BERT 2.0可应用于自动语音识别和音频分类等任务。该模型支持通过Hugging Face Transformers和Seamless Communication框架使用，为多语言语音处理研究提供了有力工具。

OPUS-MT-train - 用于训练多语言神经机器翻译模型的开源工具集

GithubOpus-MT多语言翻译开源软件开源项目机器翻译模型训练

OPUS-MT-train是一个开源的神经机器翻译模型训练工具集。它基于MarianNMT和OPUS数据集，提供了模型训练、评估和发布的完整脚本。该项目包含丰富的预训练模型，支持多语言翻译，并附有详细文档和教程。OPUS-MT-train适用于CSC HPC集群环境，包含了安装、设置和使用的详细说明。它还提供了低资源语言模型训练和Tatoeba翻译挑战等教程，致力于推动神经机器翻译技术的普及，为研究人员和开发者提供了实用的工具，有助于推进神经机器翻译技术的研究和应用。

m2 - 子二次GEMM架构Monarch Mixer实现高效语言模型

GithubM2-BERTMonarch Mixer人工智能开源项目机器学习自然语言处理

Monarch Mixer是一种创新的子二次GEMM架构，用于训练序列长度和模型维度均为子二次的语言模型。该架构使用Monarch矩阵层替代Transformer中的注意力和MLP操作，提高了计算效率。基于此架构的M2-BERT模型在减少25%参数和计算量的同时，在GLUE基准测试中达到了与BERT相当的性能。项目开源了预训练模型权重以及预训练和微调代码，方便研究者进行further研究。

llama - Facebook开源语言模型推进机器翻译研究

Facebook AIGithubLLaMA开源项目机器翻译自然语言处理

LLAMA是Facebook AI Research开发的开源语言模型项目,致力于提高机器翻译质量。该项目专注于源语言处理,采用创新方法改进翻译效果。LLAMA为机器翻译研究提供了重要工具,有望推动该领域的技术进步。

flair - 一个易用的最先进自然语言处理和文本嵌入框架，支持多语言模型应用

FlairGithubPyTorch开源项目情感分析文本嵌入自然语言处理

Flair 是一个强大的自然语言处理库，支持命名实体识别、情感分析、词性标注等多种功能，并且支持多种语言。通过简易接口，用户可以轻松使用和整合多种词和文档嵌入，基于 PyTorch 框架进行模型训练和实验。Flair 还对生物医学文本有特殊支持，并提供最新的命名实体识别模型，性能媲美甚至超过当前最优结果。用户可以在 Hugging Face 平台上访问并试用这些模型。

repeat - 开源自然语言处理库

GithubHuggingfacetransformers人工智能开源项目机器学习模型深度学习自然语言处理

Transformers是一个开源的自然语言处理库，提供了多种预训练模型和工具。该库支持文本分类、命名实体识别和机器翻译等任务，具有良好的文档支持和定期更新特性。研究人员和开发者可以使用Transformers构建和部署NLP应用。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号