#模型训练
CMLM-ZhongJing - 中医大语言模型结合古今智慧推动医学创新
CMLM-ZhongJing中医大语言模型指令数据模型训练Github开源项目
CMLM-ZhongJing是一款专注中医领域的大语言模型,融合古代医学智慧与现代AI技术。该模型采用多任务诊疗行为分解和中医常识指令数据构建策略进行训练,致力于深入阐释中医知识,为医学领域提供智能化工具。在专业中医案例测试中,模型展现出优秀的泛化能力和专业水平。
pythia - 大语言模型训练过程知识演化分析开源项目
Pythia大语言模型模型训练可解释性研究学习动态Github开源项目
Pythia是一个开源项目,旨在分析大语言模型训练过程中的知识演化。该项目提供完整的模型、数据和代码,包含154个训练检查点,支持研究人员深入探索学习动态和因果关系。Pythia是业界首个支持全面复现和学习动态分析的模型套件,为大语言模型的可解释性研究提供了重要工具。
InstructUIE - 基于Flan T5的统一信息抽取指令微调框架
InstructUIE信息提取模型训练深度学习自然语言处理Github开源项目
InstructUIE是一个基于Flan T5预训练模型的指令微调框架,致力于统一信息抽取。该项目通过自定义数据集微调,实现多种信息抽取任务的统一处理。InstructUIE提供完整的训练和评估脚本,并开放预训练模型下载,为自然语言处理研究和应用提供有力支持。
OpenChatKit - 强大的开源对话模型开发工具包
OpenChatKitAI模型自然语言处理开源项目模型训练Github
OpenChatKit是一套功能全面的开源工具包,用于开发专业和通用对话模型。它集成了指令微调的语言模型、内容审核模型和可扩展检索系统。该项目提供训练、微调和测试各种规模模型的代码,并支持检索增强功能。OpenChatKit基于OIG-43M数据集训练,由Together、LAION和Ontocord.ai联合开发。这一灵活的基础设施为开发者构建定制对话应用提供了便利。
diffusion-forcing - 创新机器学习方法结合下一步预测和全序列扩散技术
Diffusion Forcing深度学习视频预测迷宫规划模型训练Github开源项目
Diffusion Forcing是一种结合下一步预测和全序列扩散技术的机器学习方法。该项目为视频预测、迷宫规划和时间序列分析等任务提供了框架。通过时间注意力机制,Diffusion Forcing可生成长序列预测并在复杂环境中进行规划。该方法在Minecraft和DMLab视频数据集以及迷宫规划任务中表现优异。项目包含使用说明和预训练模型,便于研究者快速上手和复现结果。
dclm - 大型语言模型训练与评估的开源综合框架
DataComp-LM大语言模型数据处理模型训练评估Github开源项目
DataComp-LM是一个开源的大型语言模型训练和评估框架。它提供了超过300T的CommonCrawl标准语料库、基于open_lm的预训练方案和50多项评估指标。研究人员可利用该框架在411M至7B参数规模下进行数据集构建实验。通过数据集优化,DataComp-LM已显著提升了模型性能,创建了多个跨规模表现优异的高质量数据集。
corenet - 用于训练多任务深度神经网络的工具库
CoreNet神经网络深度学习模型训练计算机视觉Github开源项目
CoreNet是一款多功能深度神经网络工具库,支持训练各种规模的标准和创新模型。它适用于基础模型、计算机视觉和自然语言处理等多个领域。该项目提供可复现的训练方案、预训练模型权重和针对Apple Silicon优化的MLX示例,有助于推动AI研究和应用的发展。
ai-toolkit - AI模型训练与优化的多功能工具集
AI ToolkitLoRAFLUX.1模型训练图像生成Github开源项目
AI-toolkit是一款功能丰富的AI模型工具集,包含FLUX.1训练、LoRA提取和模型合并等功能。它还支持批量图像生成、LoRA权重调整和滑块训练等高级特性,并提供扩展系统供用户自定义功能。这个工具集主要适用于24GB及以上显存的GPU,为AI模型开发者和研究人员提供灵活高效的解决方案。
poutyne - 简化PyTorch开发 加速神经网络训练
PoutynePyTorch深度学习神经网络模型训练Github开源项目
Poutyne是一个简化的PyTorch深度学习框架,能够处理神经网络训练中的大量样板代码。该框架提供简洁的模型训练接口、丰富的回调函数及自动检查点保存功能,显著提升开发效率。Poutyne兼容最新版PyTorch和Python 3.8+,适合需要快速构建和训练神经网络的研究人员及开发者。
aiXcoder-7B - 多语言代码生成模型 提高开发效率与代码质量
aiXcoder-7B代码生成大语言模型AI编程模型训练Github开源项目
aiXcoder-7B是一个支持多种编程语言的代码生成模型。该模型在代码补全、理解和生成方面表现优异,经过1.2万亿唯一标记的训练,采用了针对实际代码生成场景的预训练任务和上下文信息设计。aiXcoder-7B提高了代码补全和生成的效率与准确性,未来还将优化测试用例生成和代码调试等功能,为开发者提供更全面的编程支持。
chain-of-hindsight - 基于人类反馈优化语言模型的开源框架
Chain of Hindsight语言模型反馈对齐模型训练评估Github开源项目
Chain-of-Hindsight是一个开源项目,提供了基于Jax的语言模型训练框架。该方法通过人类反馈来优化模型性能,支持LLaMA和GPT-J等大型模型。项目包括数据准备、模型训练和评估的完整流程,其反馈处理机制有助于模型在对话和摘要等任务中提升表现。最新更新改进了大模型分片和数据并行处理,为自然语言处理研究提供了实用工具。
gptsovits-api - 基于GPT-SoVITS的灵活语音合成API接口
GPT-SoVITSAPI调用语音合成声音克隆模型训练Github开源项目
gptsovits-api项目为GPT-SoVITS提供了扩展API接口。它支持自定义模型、参考音频和多语言设置,可处理中英混合文本。通过简单的HTTP API,开发者能轻松将语音合成功能集成到应用中。该接口适用于默认和自训练模型,能满足不同场景的语音合成需求。
fine-tune-mistral - Mistral大语言模型全量微调开源项目
Mistral微调深度学习模型训练Hugging FaceGithub开源项目
fine-tune-mistral是一个专注于Mistral 7B大语言模型全量微调的开源项目。项目提供完整训练代码和使用说明,支持多GPU训练。其中包含多项训练技巧,如学习率调整和数据量建议等。项目还强调通过评估任务来衡量模型性能改进。该工具为研究者提供了一个进行Mistral模型定制化的便捷平台。
ModelsLab - 全面的AI API平台助力下一代智能应用开发
AI工具Stable DiffusionAPIAI绘图模型训练LLM
ModelsLab是一个综合性AI API服务平台,提供稳定扩散、大型语言模型等多种AI功能接口。平台支持文本生成图像、图像编辑、视频生成、语音克隆等应用,无需用户配置高性能硬件。拥有10,000多个预训练模型和模型微调功能,可满足个人到企业的多样化AI需求。ModelsLab支持快速集成先进AI技术,加速新一代智能应用的开发与落地。
Determined AI - 开源深度学习平台助力模型训练和优化
AI工具深度学习模型训练GPU资源超参数调优分布式训练
Determined AI是一个开源深度学习训练平台,集成了超参数调优和分布式训练功能。该平台支持多种深度学习框架,可在云端或本地运行,提供资源管理、实验跟踪和结果可视化等功能。它能显著加快模型训练速度,提高模型精度,让研究人员更专注于模型开发而非基础设施管理,从而提升深度学习团队的整体效率。
DreamLook.ai - 快速训练和优化Stable Diffusion模型的AI服务平台
AI工具Stable DiffusionAI绘图模型训练图像生成LoRA
DreamLook.ai是一个专业的AI图像生成平台,提供Stable Diffusion模型的快速fine-tuning服务。平台可在数分钟内完成模型训练,速度是传统方法的2.5倍,每日可处理数千次训练。支持SD1.5和SDXL模型的全模型fine-tuning。平台提供强大的API接口,解决GPU资源问题。此外,还有多种价格套餐可选,适应不同需求。
Custom.MT - AI本地化机器翻译解决方案
AI工具机器翻译平台AI翻译模型训练本地化策略翻译评估
Custom.MT为本地化团队提供先进的AI机器翻译平台。该平台整合多种领先翻译引擎,支持模型管理与定制。提供全面服务,包括模型训练、性能评估和术语合规检查,有效提升翻译质量和效率。适合不同经验水平的用户,协助制定专业的本地化策略。
NeuroCraft - 简化神经网络开发流程的直观平台
AI工具神经网络模型设计模型训练模型部署人工智能
NeuroCraft是一个创新的神经网络开发平台,提供设计、训练和部署神经网络的综合解决方案。该平台采用简洁的拖放界面,简化模型设计过程,支持实时观察模型学习并灵活配置训练参数。NeuroCraft还提供多样化的部署选项,方便将模型集成到现有系统或用于应用内预测。这个平台适合各级人工智能从业者使用,有助于高效管理神经网络的全生命周期。
Datature - 一体化AI视觉平台简化企业计算机视觉应用开发
AI工具计算机视觉人工智能模型训练数据标注模型部署
Datature是一个无代码计算机视觉MLOps平台,提供数据管理、标注、训练和部署的全流程解决方案。支持图像分类、目标检测和分割等任务,具备AI辅助标注和自动模型训练功能,可显著提高开发效率。适用于医疗、零售和智慧城市等多个领域,有助于快速开发AI视觉应用。平台还提供开发工具,支持大规模部署和集成,是一个功能完备的计算机视觉开发平台。
LangDrive - 开源大语言模型微调的统一API解决方案
AI工具LangDrive开源LLM模型训练APIAI助手
LangDrive为开源大语言模型微调提供统一API接口,支持100多种LLM。该AI框架允许开发者连接私有数据、训练模型并部署至Hugging Face。平台功能包括自定义数据导入、自动化训练流程和完全的模型权重所有权。适用于自然语言处理、文本生成等多种AI应用场景,LangDrive还提供免费LLM微调服务和在线模型试用,简化了自定义AI模型的开发和应用过程。
FanCraft - AI个人模型创作与收益平台
AI工具AI绘图图像生成创意创作模型训练收益变现
FanCraft是一个AI内容创作平台,用户可通过少量个人照片创建独特AI模型。平台提供图像生成功能,用户还能通过分享模型获得Coins。主要功能包括用于个性化AI模型创建和变现的ModelCraft,以及提供多样化图像生成的UniCraft。FanCraft为创作者构建了一个创意释放与收益兼具的生态系统。
Stable Diffusion API - 全面的AI图像生成和模型训练API服务
AI工具Stable DiffusionAPIAI绘图模型训练图像生成
Stable Diffusion API平台提供多样化的AI图像生成和模型训练服务。开发者可通过API轻松集成文本生成图像、图像编辑等功能,无需高端硬件即可使用。平台拥有丰富的预训练模型,支持先进的微调技术,并提供企业级服务。作为众多公司的选择,该平台为AI图像应用开发提供了便捷解决方案。
Custom Vision - 云端视觉AI平台提供智能图像标记和分类服务
AI工具计算机视觉图像标记模型训练API调用Custom Vision
Custom Vision是一个云端视觉AI平台,专注于图像分类和标记。该平台支持用户上传并标记图像,或为未标记图像快速添加标签。通过标记数据,Custom Vision能训练自定义计算机视觉模型。用户可评估模型效果,并使用REST API标记新图像。这个平台为创建和部署自定义视觉AI解决方案提供了便捷途径,适用于多种图像识别和分类场景。
syntheticAIdata - 为计算机视觉AI模型提供大规模合成训练数据的平台
AI工具合成数据计算机视觉模型训练AI数据生成
syntheticAIdata是一个为企业提供合成数据解决方案的平台,主要用于训练视觉AI模型。该平台能够生成大规模高质量数据,具有自动注释、成本效益高等特点。它采用无代码设计,操作简便。使用syntheticAIdata不仅可以降低数据获取成本,还能保护隐私、确保合规,加快AI产品开发进程。平台支持与主流云服务一键集成,便于用户快速部署和使用。syntheticAIdata通过模拟真实场景生成数据,有效规避了隐私和监管风险。对于企业来说,这是一个能够加速AI项目落地、提高模型性能的实用工具。
OmniEvent - 多模型事件抽取框架 支持多种范式和语言
OmniEvent事件抽取模型训练评估方法数据处理Github开源项目
OmniEvent是一个开源事件抽取工具包,支持事件检测和事件论元抽取。它覆盖多种范式,如令牌分类、序列标注、机器阅读理解和序列到序列等,在英文和中文数据集上提供统一评估。采用模块化实现,具有可扩展性,支持大型模型训练和推理,易用性高,兼容Transformers库。
OPUS-MT-train - 用于训练多语言神经机器翻译模型的开源工具集
Opus-MT机器翻译模型训练开源软件多语言翻译Github开源项目
OPUS-MT-train是一个开源的神经机器翻译模型训练工具集。它基于MarianNMT和OPUS数据集,提供了模型训练、评估和发布的完整脚本。该项目包含丰富的预训练模型,支持多语言翻译,并附有详细文档和教程。OPUS-MT-train适用于CSC HPC集群环境,包含了安装、设置和使用的详细说明。它还提供了低资源语言模型训练和Tatoeba翻译挑战等教程,致力于推动神经机器翻译技术的普及,为研究人员和开发者提供了实用的工具,有助于推进神经机器翻译技术的研究和应用。
CodeFuse-DevOps-Model - 中文DevOps大模型助力开发运维全生命周期
DevOps-Model中文开发运维大模型模型评测模型训练模型量化Github开源项目
CodeFuse-DevOps-Model作为首个开源中文开发运维大模型,专注于DevOps全生命周期问题解决。基于Qwen系列并经高质量中文DevOps语料训练,模型在同规模对比中表现卓越。项目囊括7B和14B基座及对齐模型,并配备在线试用和评测基准。在多个DevOps评测数据集中,模型均取得优异成绩,为开发者提供了可靠的DevOps智能支持。
zero-bubble-pipeline-parallelism - 流水线并行算法创新 实现零气泡和内存优化
Zero BubblePipeline Parallelism深度学习模型训练内存优化Github开源项目
该项目开发了两种新型流水线并行算法:零气泡和可控内存流水线并行。零气泡算法几乎消除了流水线并行的气泡,保持同步语义;可控内存算法显著降低激活内存使用,同时维持或提高吞吐量。项目实现了ZB1P、ZB2P和ZBV等多种调度策略,平衡吞吐量和内存效率。另外,项目还采用优化器后验证等技术来进一步增强性能。
textgen - 文本生成库实现多种模型,支持大模型微调和推理
文本生成模型训练ChatGLMLLaMALoRAGithub开源项目
TextGen实现了LLaMA、ChatGLM、GPT2等多种文本生成模型。该开源库支持大模型LoRA微调训练和高效推理,还包含UDA、Seq2Seq等经典生成模型。TextGen提供多个预训练模型,可用于对话生成、文本扩增、翻译等任务。项目开箱即用,便于研究人员和开发者快速构建文本生成应用。
txtinstruct - 开源框架简化指令调优模型开发
txtinstruct指令调优数据集模型训练开源框架Github开源项目
txtinstruct是一个开源的指令调优模型训练框架,支持开放数据和模型,可与自有数据集成。它旨在解决指令数据集和大型语言模型许可不明确的问题,便于构建个性化指令数据集和模型。基于Python 3.8+和txtai构建,txtinstruct提供简便的安装方法和丰富示例,方便用户快速开发指令调优模型。
torchlm - 面向人脸关键点检测的开源工具包
torchlm深度学习人脸关键点检测数据增强模型训练Github开源项目
torchlm是一个开源的人脸关键点检测工具包,提供训练、评估、导出和推理功能。它包含100多种数据增强方法,支持30多种原生关键点增强,可与torchvision和albumentations集成。torchlm实现了PIPNet等先进模型,在多个基准数据集上性能出色。该项目简化了人脸关键点检测的开发流程,适用于研究和实际应用。
cookbook - EleutherAI深度学习实践指南与资源库
深度学习模型训练Transformer分布式训练EleutherAIGithub开源项目
EleutherAI的Cookbook项目是一个综合性深度学习资源库,涵盖从基础到高级的实用工具和知识。项目提供参数计算器、基准测试工具和精选阅读清单,内容包括transformer基础、分布式训练和最佳实践等主题。此外,还收录了多个简化版教学代码库,便于学习和理解。这个资源库适合各级深度学习从业者使用,有助于提升相关技能和知识。
orpo - 无参考模型的语言模型偏好优化技术
ORPO模型训练人工智能自然语言处理机器学习Github开源项目
ORPO是一种新型语言模型训练方法,无需参考模型即可实现偏好优化。项目展示了ORPO在AlpacaEval、MT-Bench和IFEval等基准测试中的性能。ORPO训练的Mistral-ORPO-β模型在AlpacaEval官方排行榜上获得14.7%的长度控制胜率。项目开源了多个预训练模型和训练日志,为AI研究和开发提供了重要资源。
mljar-supervised - 开源自动机器学习框架 简化表格数据建模
AutoML机器学习模型训练数据分析MLJARGithub开源项目
mljar-supervised是一个专门用于表格数据的开源自动机器学习框架。它可自动完成数据预处理、模型构建和超参数调优,生成详细的Markdown报告解释每个模型。该框架提供多种工作模式,包括数据解释、生产部署、竞赛优化等。支持多种算法并具备模型集成功能,能有效简化数据科学工作流程,帮助用户快速构建高质量机器学习模型。
PyTorch_Tutorial - PyTorch深度学习实践教程
PyTorch深度学习模型训练教程代码实践Github开源项目
PyTorch_Tutorial是一个综合性深度学习教程项目,专注于PyTorch框架的应用。教程涵盖基础到高级的模型训练技巧,提供计算机视觉、自然语言处理和大型语言模型等领域的实践案例。内容还包括ONNX和TensorRT等推理部署框架的使用指南,展示了从模型开发到部署的完整流程。项目定期更新,配有环境配置说明,适合深度学习研究者和实践者参考学习。
网易云课堂 - 云端AI绘画和设计创作平台
AI图像图像生成AI工具AI设计工坊云端Stable Diffusion网易云课堂模型训练作品接单社区热门
网易云课堂AI设计工坊集成了全面的AI绘画工具和云端Stable Diffusion技术,无安装需求,支持即时使用。平台整合了学习、创作、分享及接单等功能,提供专业多样的Checkpoint和LoRA风格模型,支持在线定制模型训练,以及丰富的社区与课程资源,助力设计师技能提升与作品商业化。
相关文章
EasyPhoto: 您的智能AI肖像生成器
2024年08月30日
Superduper: 将AI引入您的数据库的革命性框架
2024年08月30日
零到NLP:开箱即用的中文NLP训练框架
2024年08月30日
ONNX Runtime: 跨平台高性能机器学习加速器
2024年08月30日
PyTorch Metric Learning:深度度量学习的强大工具
2024年08月30日
GPT-Neo:开源大规模语言模型的突破性进展
2024年08月30日
Tensor2Tensor: 加速深度学习研究的强大工具库
2024年08月30日
Weights & Biases:AI开发者的得力助手
2024年08月30日
GPT-SoVITS: 革命性的少样本语音克隆与文本转语音技术
2024年08月29日