Project Icon

trlx

分布式微调大型语言模型的强化学习框架,支持奖励函数与高效并行

一个专注于强化学习微调大型语言模型的分布式训练框架。支持使用奖励函数或已标注数据集进行训练,兼容🤗Hugging Face和NVIDIA NeMo模型,可扩展到20B参数以上。实现了PPO和ILQL等多种RL算法,提供详细文档和丰富示例,支持分布式训练和超参数搜索。适用于各种应用场景,通过高效并行技术提升训练效率。

rtp-llm - 大型语言模型推理加速引擎
CUDAGithubrtp-llm多模态输入大语言模型开源项目量化
rtp-llm是阿里巴巴基础模型推理团队开发的大型语言模型推理加速引擎,广泛应用于支持淘宝问答、天猫、菜鸟网络等业务,并显著提升处理效率。该项目基于高性能CUDA技术,支持多种权重格式和多模态输入处理,跨多个硬件后端。新版本增强了GPU内存管理和设备后端,优化了动态批处理功能,提高了用户的使用和体验效率。
relora - 使用ReLoRA实现高效深度学习模型训练
GithubPEFTPyTorchReLoRAflash attention开源项目训练
ReLoRA项目通过低秩更新实现高效深度学习训练,兼容Python 3.10+和PyTorch 2.0+,支持更大的微批次大小。用户可通过执行预处理和不同配置的训练脚本,达到高效分布式训练,并支持cosine重启调度和多GPU配置。项目涵盖了预热训练和ReLoRA重启,适用于各种规模的模型训练。
truss - 简便的AI/ML模型生产环境部署工具
BasetenGithubPython框架Truss开源项目机器学习模型模型部署
Truss是一个用于在生产环境中轻松打包和部署AI/ML模型的工具。它具有一次编写即可在任何地方运行的特性,确保开发和生产环境的一致性。支持所有主流的Python框架,如transformers、diffusers、PyTorch和TensorFlow等,并包含快速开发反馈机制。Truss由Baseten维护,提供便捷的云端部署,通过Baseten的API密钥即可轻松实现远程部署。
ALMA-13B-Pretrain - 改进大型语言模型的翻译性能与偏好优化技术
ALMAGithubHuggingfaceLoRA微调对比偏好优化开源项目数据集机器翻译模型
ALMA基于新的翻译模型范式,初步在单语数据上进行精调,接着应用高质量的平行数据进行优化,从而显著提升大型语言模型的翻译效果。其最新版本ALMA-R采用了对比偏好优化(CPO),相较于传统监督精调,进一步提高了翻译的精度,可与GPT-4媲美。尤其是ALMA-13B-LoRA,通过过渡性精调和人类撰写的平行数据,确保了在专业翻译任务中的卓越表现。
NeMo-Aligner - NVIDIA开发的大规模语言模型对齐工具包
AI训练GithubNVIDIANeMo-Aligner开源项目模型对齐语言模型
NeMo-Aligner是NVIDIA开发的语言模型对齐工具包,支持SteerLM、DPO和RLHF等算法,用于调整模型以提高安全性和实用性。基于NeMo Toolkit构建,支持大规模GPU并行处理,提供监督微调和奖励模型训练等功能。与NeMo生态系统兼容,便于模型部署和进一步定制。
ChatGLM-Finetuning - ChatGLM系列模型的多方法微调工具
ChatGLMGithub大语言模型开源项目微调深度学习自然语言处理
ChatGLM-Finetuning为ChatGLM系列模型提供多种微调方法,包括Freeze、Lora、P-Tuning和全量参数训练。该项目支持信息抽取、文本生成和分类等任务,可进行单卡或多卡训练。通过DeepSpeed等优化技术,实现高效大模型微调,并有效缓解灾难性遗忘问题。项目支持最新的ChatGLM3模型,并提供详细的使用说明。
awesome-llms-fine-tuning - 大语言模型微调资源指南,包括教程、工具与最佳实践
BERTGPTGithubLLMRoBERTafine-tuning开源项目
本页面汇总了微调大语言模型(如GPT、BERT、RoBERTa)的全面资源,适用于特定任务和领域的需求。包含教程、论文、工具、框架和最佳实践,为研究人员、数据科学家和机器学习从业者提供宝贵的指导,提升模型表现,优化工作流程。
Mixtral-8x22B-v0.1 - 多平台兼容的预训练大规模语言模型
GithubHugging FaceHuggingfaceMistral AIMixtral-8x22B开源项目模型生成模型语言模型
这是一款多语言兼容的预训练大型语言模型,支持生成性稀疏专家技术,兼容vLLM和Hugging Face transformers库,提供灵活的运行选项和优化内存管理的优势。然而,用户需注意,该模型没有内容审核功能。
cleanrl - 一个深度强化学习库
CleanRLGithubPPO算法云集成单文件实现开源项目深度强化学习
CleanRL是一款简洁高效的深度强化学习库,提供单文件实现和广泛的算法支持,包括PPO、DQN等。它支持本地和云端实验、Tensorboard日志记录及Weights and Biases管理,适用于研究与快速原型开发。
NeMo - 人工智能训练和部署平台
GithubNVIDIA NeMo多模态模型大语言模型开源项目热门生成式AI语音识别
NeMo框架是NVIDIA开发的一款云原生生成式AI框架,专为研究人员和使用PyTorch的开发者设计,支持大型语言模型、多模态模型、自动语音识别等多个领域。该框架能够利用现有代码和预训练的模型检查点,帮助用户高效创建和定制新的生成式AI模型。通过广泛的教程和文档,用户可以轻松开始使用NeMo框架,无论是在任何云端还是本地环境中。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号