#模型训练

DataDreamer - 生成合成数据和优化模型的开源Python工具
DataDreamer合成数据生成模型训练Python库开源Github开源项目
DataDreamer 是一个功能强大的开源Python库,专为创建提示工作流、生成合成数据集和训练模型而设计。它支持复杂的多步提示工作流,适用于各种大语言模型。该工具简单易用,且达到研究级别,兼具高效性和可复现性,支持最新技术如量化和LoRA等。无论是研究人员还是普通用户,都可以轻松发布数据集和模型。
gpt-neo - 使用 mesh-tensorflow 库的模型并行 GPT-2 和 GPT-3 样式模型的实现
GPT-Neo模型训练预训练模型TPU支持GPT-3Github开源项目
GPT-Neo项目在mesh-tensorflow库的支持下,开发出了类似于GPT-3的高级模型与数据并行技术。项目支持在TPU及GPU上进行高效训练与推理,并集成了局部注意力、线性注意力和多专家系统等先进技术,能有效处理大规模参数模型。GPT-Neo还提供了多项模型评估功能,专注于语言和科学推理,拓宽了其在自然语言处理应用中的领域。
tensor2tensor - 一个旨在使深度学习更加深入的深度学习模型和数据集的库
Tensor2Tensor深度学习模型训练翻译任务数据集Github开源项目
Google Brain团队和社区合作开发的tensor2tensor库,通过提供多模态的深度学习模型和数据集,简化了机器学习的应用,尤其在文本、图像与语音处理上表现出色。项目不再开发新功能,但持续维护并推荐用户迁移到其后继库Trax,以获得更好的支持和更新。
xllm - 便捷微调大语言模型,集成最新优化技术
X—LLM大语言模型模型训练训练优化集成开发Github开源项目
X—LLM是一个便捷的微调大语言模型工具,集成了诸如QLoRA、DeepSpeed、GPTQ、Flash Attention 2和FSDP等最新优化方法,显著提升训练效率。用户可以专注于模型和数据的优化,而不需要繁琐的代码编写。该工具支持多种Transformer模型,并可无缝对接HuggingFace Hub,适用于生产环境和快速原型设计,有助于用户更好地掌控模型训练进度并降低开销。
wandb - 专注于机器学习流程优化的工具
Weights & Biases机器学习模型训练数据可视化模型管理Github开源项目
Weights & Biases(简称W&B)是一个专注于机器学习流程优化的工具,它通过追踪和可视化机器学习的各个阶段——从数据集处理到模型部署——以提高开发效率。W&B 允许用户在一处平台上管理和比较多个实验,便捷地监控实验的运行效果及进度。
U-2-Net - 深度嵌套U结构助力显著对象精准检测
U2-Net人像分割视觉应用模型训练图像背景移除Github开源项目
U-2-Net,一项荣获2020年模式识别最佳论文奖的创新技术,通过其深度嵌套U结构显著提升对象检测精准度。此技术广泛适用于图像处理、视频分析、背景移除及人像生成等领域,并提供丰富的开发资源助力应用的快速迭代。
vall-e - 零样本文本到语音神经编解码器语言模型
VALL-E语音合成PyTorch人工智能模型训练Github开源项目
VALL-E是一个基于PyTorch的开源项目,通过神经编解码器语言模型实现零样本文本到语音的转换。该模型可在单GPU上训练,能模拟特定说话者的语音,并采取了措施以防止技术的潜在滥用。然而,开发者没有提供完全训练的模型和服务。VALL-E提供了包括英语和中文在内的多语种语音技术支持,是语音技术研究的有益工具。
vall-e - 开源PyTorch框架下基于EnCodec Tokenizer的音频合成实现
VALL-EPyTorch音频合成人工智能模型训练Github开源项目
VALL-E项目是EnCodec Tokenizer在开源PyTorch环境下的实施,提供高效音频合成技术。支持GPU加速,允许用户迅速搭建、训练个性化音频模型,并通过CLI完成音频合成。包括AR和NAR模型训练,模型配置与导出等功能,并持续优化以期未来提供预训练模型和更丰富的示例。
pytorch-cifar100 - 使用PyTorch高效训练和测试CIFAR-100数据集
Pytorchcifar100卷积神经网络模型训练网络架构Github开源项目
pytorch-cifar100项目提供了一套完整的训练和测试框架,使得使用者能在CIFAR-100数据集上通过多种网络架构实施图像识别。支持的网络包括VGG, ResNet, DenseNet等多种深度学习模型,并详细记录每种模型的错误率。项目还包括自定义数据集模块的示例代码,供不熟悉数据处理的用户参考。项目提供了清晰的代码,便于使用者根据需求调整模型训练与测试。
x-transformers - 轻量级Transformer模型,支持完整的编解码器配置和最新研究成果,适合各种从图像分类到语言模型的应用
x-transformerstransformer模型训练编解码器编码器Github开源项目
x-transformers提供了多功能的Transformer模型,支持完整的编解码器配置和最新研究成果,适合各种应用,从图像分类到语言模型。其先进技术如闪存注意力和持久内存,有助于提高模型的效率和性能。此项目是研究人员和开发者的理想选择,用于探索和优化机器学习任务中的Transformer技术。
lingvo - Tensorflow中高效的序列模型神经网络构建框架
LingvoTensorflow神经网络模型训练机器翻译Github开源项目
Lingvo由Google维护的高质量框架,专用于在Tensorflow中构建神经网络,特别适用于序列模型的开发。此框架支持多种模型类型,包括自动语音识别、图片处理、语言建模和机器翻译等。Lingvo允许通过pip安装或源代码编译来灵活部署。借助详尽的文档和综合的模型库,用户可以轻松地构建、训练并评估自定义模型。此外,Lingvo还与最新版本的Tensorflow和Python兼容,确保与当前技术生态的同步。
VoiceFlow-TTS - 结合最新流匹配算法的文本转语音技术
VoiceFlow文本转语音Kaldi模型训练数据准备Github开源项目
VoiceFlow-TTS项目采用先进的矫正流匹配技术,提升了文本到语音转换的效率和自然度。此项目详细介绍了设置环境、准备数据、训练模型以及推理过程,支持多GPU并发处理,兼容多种数据集。
One-Shot-Voice-Cloning - 一站式语音克隆与风格转换技术
Unet-TTS一键语音克隆风格迁移语音合成模型训练Github开源项目
One-Shot-Voice-Cloning利用Unet结构和AdaIN层,实现了高效的说话人和风格转换。此技术支持单次语音克隆,无需额外的声音参数输入,有效解决了面对未见说话人和风格迁移的难题。此外,通过Colab notebook,用户可以便捷地测试和验证模型性能。
glow-tts - 通过单调对齐搜索进行文本转语音的生成流
Glow-TTS文本转语音并行合成HiFi-GAN模型训练Github开源项目
Glow-TTS,一款创新的文本到语音转换模型,独立完成文本与语音的单调对齐搜索,无需外部辅助。此模型不仅大幅提升合成速度,还支持多样性与可控性,并可适应多说话人环境。更新项包括采用新技术降低噪声并优化发音,使其在速度和音质上优于传统模型。
Awesome-LLM-Inference - 一系列关于涵盖了从基础框架到先进技术的大型语言模型推理的研究论文和配套代码
Awesome-LLM-Inference模型训练模型推理算法优化量化压缩Github开源项目
Awesome-LLM-Inference项目提供了一系列关于大型语言模型推理的研究论文和配套代码,涵盖了从基础框架到先进技术的全面资源,旨在帮助研究人员和开发者提高推理效率和性能。提供了全面的信息和技术支持,用于研究和开发高性能的大型语言模型。
safe-rlhf - 北京大学开发的AI安全增强框架
Beaver安全RLHF人工智能数据集模型训练Github开源项目
Safe RLHF是一个由北京大学PKU-Alignment团队开发的开源框架,整合了SFT、RLHF及Safe RLHF训练方法。它支持多种预训练模型,提供大量人工标注数据,能够训练奖励与成本模型,并采用多层次的安全性校验指标。最新发布的版本提供详尽的复现代码和数据集,旨在增强AI模型的安全性和实用性。
zero_nlp - 中文NLP训练与应用框架
zero_nlp模型训练中文NLP大模型pytorchGithub开源项目
zero_nlp是基于pytorch和transformers的中文NLP框架,支持从数据处理到模型部署的整个工作流程。它特别适用于处理大数据集、训练和部署多卡串联大模型,支持包括gpt2、clip在内的丰富模型类型,适用于文本分类、生成及多模态处理等多种任务。
MotionGPT - 构建多任务的人体动作与语言统一模型
MotionGPT人机交互模型训练人体动作多模态数据Github开源项目
MotionGPT是一种整合人体动作和语言的统一模型,专注于两种模态间的语义耦合学习。在诸多人体动作任务中表现优异,包括文本驱动动作生成、动作标题生成及动作预测。该模型结合预训练与指令性微调,能高效处理多种动作相关任务,是动作语言模型的新代表。此外,其零拍技术使其能识别新词汇并生成相应动作,突显处理复杂场景的能力。
kogpt - 韩语生成预训练模型
KoGPTKakaoBrain人工智能语言模型模型训练Github开源项目
由KakaoBrain开发的KoGPT,是一个专注于韩语的生成预训练模型,广泛应用于文本分类、搜索和生成摘要等多种AI任务。这一模型训练于大型数据集,具备卓越的文本生成能力。然而,使用期间可能生成不恰当内容,主要用于学术研究与技术开发,用户在使用时需严格遵守其许可协议。
ChatGPT_DAN - 详述ChatGPT DAN模式如何拓展人工智能应用边界
ChatGPTDAN模式人工智能内容策略模型训练Github开源项目
详述ChatGPT DAN模式如何突破常规界限,通过高度自由的交互表现,增强人工智能的应对能力和创造性。此模式通过模拟角色扮演的方式,实现了对复杂场景的深度适应与精准回应。
neptune-client - 可伸缩的实验跟踪工具,简化团队基础模型训练
neptune.ai实验跟踪机器学习模型训练数据处理Github开源项目
Neptune 提供一款高效实验跟踪平台,适用于团队基础模型训练。用户可记录大量运行数据,实时对比实验结果。其灵活日志记录、自定义仪表板、多节点支持,加速训练监控和优化。支持25+框架集成,是MLOps理想工具。
LESS - 选择有影响力的数据进行有针对性的指令调整
LESS数据选择指令微调模型训练评估Github开源项目
LESS项目提供了一种数据选择方法,通过选择有影响力的数据来增强特定功能。该项目涵盖了安装要求、数据准备、数据选择和模型训练的详细步骤,并提供相应的脚本和指南。通过预热训练、构建梯度数据存储库、任务数据选择和最终训练四个步骤,提升模型在下游任务中的表现能力。利用Flan v2、COT、Dolly和Open Assistant等训练数据集,以及MMLU、TydiQA和BBH等评估数据集,优化特定任务的模型性能。
starcoder2-self-align - 自我校准的代码生成大型语言模型
StarCoder2-Instruct代码生成大语言模型数据生成流水线模型训练Github开源项目
StarCoder2-15B-Instruct-v0.1是一款完全自我校准的代码生成大型语言模型,采用公开透明的工作流程,无需人工注释或专有数据。模型通过生成大量指令-响应对,进一步微调自身。专为Python代码生成任务优化,支持语法验证和定制排序。提供详细的训练和评估信息,包括数据生成、模型优化和性能验证,适用于多种编程任务。模型强调透明度和开放许可,提升代码生成的准确性和效率。
EasyDeL - 多模型训练优化框架
EasyDeL机器学习JAXFlax模型训练Github开源项目
EasyDeL是一个开源框架,用于通过Jax/Flax优化机器学习模型的训练,特别适合在TPU/GPU上进行大规模部署。它支持多种模型架构和量化方法,包括Transformers、Mamba等,并提供高级训练器和API引擎。EasyDeL的架构完全可定制和透明,允许用户修改每个组件,并促进实验和社区驱动的开发。不论是前沿研究还是生产系统构建,EasyDeL都提供灵活强大的工具以满足不同需求。最新更新包括性能优化、KV缓存改进和新模型支持。
SmallLanguageModel-project - 自主构建完整的语言模型,从数据采集到训练一步到位
SmallLanguageModel数据处理模型训练Python依赖安装Github开源项目
该项目提供全面的构建语言模型指南,包括数据收集、预处理及模型训练。项目涵盖从数据采集到训练多种模型(如BERT、GPT、Seq-2-Seq)的全部必要工具和步骤。适用于Python 3.8及以上版本,通过详细的教程和文档帮助开发者高效实现模型训练与应用。
TextAttack - 为NLP模型生成对抗样本和进行数据增强的专业工具
TextAttackNLP对抗样本数据增强模型训练Github开源项目
TextAttack是一个专为自然语言处理(NLP)提供对抗攻击、数据增强和模型训练的Python框架。通过多种预定义攻击策略,用户可以更好地理解和研究NLP模型。TextAttack支持简便的命令行操作和广泛的模型与数据集,提供详细的文档和示例代码,帮助提高模型的泛化能力和鲁棒性。
torchdistill - 模块化深度学习知识蒸馏框架
torchdistill知识蒸馏深度学习PyYAML模型训练Github开源项目
torchdistill是一款模块化的深度学习知识蒸馏框架,通过编辑yaml文件即可设计实验,无需编写Python代码。支持提取模型中间表示,方便进行可重复的深度学习研究。通过ForwardHookManager,无需修改模型接口即可提取数据。支持从PyTorch Hub导入模块,并包含多种范例代码及预训练模型,适用于图像分类、目标检测、语义分割和文本分类等任务。
JamSpell - 高效准确的多语言拼写检查库,兼容C++和Python
JamSpell拼写检查多语言模型训练准确性Github开源项目
JamSpell是一款高效的拼写检查库,每秒处理近5000个单词,支持多种语言和跨平台使用。它通过考虑单词的上下文来提高准确性,兼容C++、Python等多种编程语言。JamSpellPro版本提升了精准度,支持Java、C#和Ruby,并可在运行时添加词汇,适用于Windows系统。新的预训练模型提供了更好的多语言支持,满足各种应用场景需求。
lite-transformer - 现代高效的长短期注意力Transformer模型
Lite Transformer模型训练数据预处理分布式训练测试模型Github开源项目
Lite Transformer是一种结合长短期注意力机制的高效Transformer模型。它基于PyTorch开发,支持多种数据集的下载和预处理,能够在NVIDIA GPU上高效运行。模型在多个大型数据集上表现优异,并支持分布式训练和预训练模型下载。
text2vec - 多模型文本向量化工具,支持多语言文本匹配分析
Text2vec文本向量化文本相似度模型训练BERTGithub开源项目
text2vec工具实现了多种文本向量表示和相似度计算模型,如Word2Vec、BERT、Sentence-BERT和CoSENT。最新版本增加了多卡推理和命令行工具,方便用户批量处理文本向量化。它在中英文测试集上的表现优秀,尤其新版中文匹配模型在短文本区分上有显著提升。该工具为中文和多语言文本匹配提供了丰富的支持,能够满足各种文本语义分析任务的需求。
machinelearning - 跨平台开源框架,简化.NET应用中的模型开发与部署
ML.NET机器学习开源框架模型训练自定义模型Github开源项目
ML.NET是一个跨平台的开源机器学习框架,使开发者无需机器学习经验即可在.NET应用中构建、训练和部署定制模型。它支持从文件和数据库加载数据,并进行数据转换,具备多种机器学习算法。ML.NET适用于分类、预测和异常检测等多种场景,并兼容TensorFlow和ONNX模型,扩展性强。支持Windows、Linux和macOS操作系统,以及ARM64和Apple M1处理器架构。
feast - 旨在为机器学习平台团队提供可靠的特征管理工具的开源的特征存储系统
Feast特征存储机器学习数据基础设施模型训练Github开源项目
Feast是一个开源的特征存储系统,旨在为机器学习平台团队提供可靠的特征管理工具。它通过管理离线存储和低延迟的在线存储,确保特征在训练和服务中的一致性,避免数据泄漏。Feast提供了一个单一的数据访问层,将特征存储与特征检索分离,使模型在不同数据基础设施之间保持可移植性。用户可以通过详细的文档和指南,轻松上手并运行Feast。
sacremoses - 简洁高效的Python自然语言处理工具包和命令行界面
Sacremoses令牌化Python归则化模型训练Github开源项目
Sacremoses是一个支持Python 3的自然语言处理工具包,提供分词、去分词、真字修复和文本规范化功能。支持命令行操作和多进程处理,让大规模文本处理变得更简单。
libai - 支持多种并行训练的大规模模型训练工具
LiBaiOneFlow模型训练CV任务NLP任务Github开源项目
LiBai是基于OneFlow的大规模开源模型训练工具,支持数据并行、张量并行和流水线并行等多种训练组件。提供分布式训练、混合精度训练、激活检查点等多种技术,适用于计算机视觉和自然语言处理任务。LiBai易于使用,模块化设计便于研究项目的搭建,同时具备高效性能,支持CIFAR、ImageNet和BERT等数据集的处理。
edward2 - 概率编程语言,为深度学习生态系统设计,支持编写和操控模型用于灵活的训练和推断
Edward2深度学习概率编程TensorFlow模型训练Github开源项目
Edward2是一个简洁易用的概率编程语言,为深度学习生态系统设计,支持编写和操控模型用于灵活的训练和推断。项目包括核心库代码、示例和前沿研究,同时支持TensorFlow、JAX和NumPy后端。用户可将随机变量与TensorFlow操作结合,开展如贝叶斯逻辑回归等任务。此外,Edward2支持模型计算操作追踪及程序转换,满足各种训练和测试需求。
网易云课堂 - 云端AI绘画和设计创作平台
AI图像图像生成AI工具AI设计工坊云端Stable Diffusion网易云课堂模型训练作品接单社区热门
网易云课堂AI设计工坊集成了全面的AI绘画工具和云端Stable Diffusion技术,无安装需求,支持即时使用。平台整合了学习、创作、分享及接单等功能,提供专业多样的Checkpoint和LoRA风格模型,支持在线定制模型训练,以及丰富的社区与课程资源,助力设计师技能提升与作品商业化。