Logo

#AI训练

Logo of Deep_reinforcement_learning_Course
Deep_reinforcement_learning_Course
免费深度强化学习课程,结合理论与实践,掌握Stable Baselines3、RL Baselines3 Zoo、Sample Factory和CleanRL等库的使用。训练智能体在SnowballFight、Huggy the Doggo、MineRL(Minecraft)、VizDoom(Doom)及经典环境(如Space Invaders、PyBullet)中运行。发布和下载社区智能体,并参与挑战与其他团队及AI对抗。
Logo of carbontracker
carbontracker
carbontracker是一款开源工具,用于监测深度学习模型训练过程中的能耗和碳排放。它能实时追踪GPU和CPU能耗,提供当前和预测的碳足迹数据,并转换为直观的等效值。该工具兼容NVIDIA GPU、Intel CPU以及Slurm和Google Colab等环境,帮助AI研究人员评估和降低模型训练对环境的影响。
Logo of advprompter
advprompter
AdvPrompter是一种针对大语言模型的自适应对抗提示技术。该项目提供完整实现代码,支持Vicuna、Mistral和Llama2等主流模型。AdvPrompter具有易于安装、使用灵活的特点,适用于模型评估和训练。研究人员可利用此工具优化大语言模型性能,提升输出质量。项目还提供了详细的使用说明和配置选项,方便用户进行自定义设置。
Logo of Zeus by Kayyo
Zeus by Kayyo
Zeus by Kayyo是一款利用AI技术的MMA训练应用,为用户提供个性化训练计划和详细视频指导。应用包含进度跟踪、训练日程安排等功能,适合初学者和专业格斗选手使用。此外,应用还提供用户间的竞争模式,增加训练趣味性。Zeus by Kayyo适合各阶段MMA爱好者使用,助力提升格斗技能。
Logo of Plutofy
Plutofy
Plutofy是一个创新的智能销售培训平台,通过实时角色扮演、自定义场景和详细分析反馈,显著提升用户的销售技能。平台提供预设和自定义培训模式,结合进度跟踪和个性化建议,使学习过程更加高效。适用于个人和企业用户,Plutofy能快速提升销售能力,优化团队策略,是一款全面的销售技能提升工具。平台特色包括实时AI反馈、多样化训练场景、个性化学习路径和团队协作功能,为用户提供沉浸式的销售实践体验。
Logo of dreamerv3
dreamerv3
DreamerV3是一种创新的强化学习算法,通过世界模型实现多领域任务掌控。其特点是使用固定超参数,具有卓越的稳健性和扩展性。随着模型规模增加,性能和数据效率同步提升。该开源项目提供完整实现,包含训练脚本和使用指南,为研究人员和开发者提供了探索先进强化学习技术的平台。
Logo of glake
glake
GLake优化了GPU内存管理和IO传输,解决了AI大模型训练和推理中的内存和传输瓶颈。通过GPU虚拟和物理内存管理及多GPU、多路径和多任务优化,提高了硬件资源利用率,最高可将训练吞吐量提高4倍,推理内存降低3倍,IO传输加速3至12倍。GLake易于集成,无需代码修改,且提供内存优化、多路径IO传输提升、和数据去重等功能,为AI训练与推理提供高效、安全的解决方案。
Logo of open-instruct
open-instruct
open-instruct是一个致力于指令微调预训练语言模型的开源项目。它提供了基于最新技术和公开数据集的模型微调代码,以及多项基准测试的评估工具。项目发布了包括Tülu系列在内的多个微调模型检查点。open-instruct支持全参数微调、LoRA和QLoRA等高效方法,并提供完整的训练和评估脚本。该工具集为研究人员和开发者提供了探索指令调优大语言模型的全面解决方案。
Logo of gpt-llm-trainer
gpt-llm-trainer
gpt-llm-trainer是一个AI模型训练自动化工具,简化了从任务描述到高性能模型的开发流程。该工具利用Claude 3或GPT-4生成数据集,为LLaMA 2或GPT-3.5模型创建系统提示并进行微调。gpt-llm-trainer通过自动化处理复杂的技术细节,使AI模型开发变得更加简单高效,适合快速开发特定任务AI模型的需求。
Logo of BodBot
BodBot
BodBot是一款智能健身应用,利用AI技术为用户定制个性化训练计划和营养建议。根据目标、身体状况和进展,BodBot生成针对性锻炼方案和详细营养指导,全面提升健康水平。支持多平台使用,可与可穿戴设备结合,实现数据驱动的科学健身。适合各级健身爱好者,提供专业指导以实现个人健康目标。
Logo of Prolific
Prolific
Prolific作为专业的在线研究参与者招募平台,为学术研究、人工智能开发和市场调查等领域提供高质量数据。平台拥有超过20万名经过严格审核的活跃参与者,保证数据真实性和可靠性。支持灵活的项目设计,提供300多种筛选条件,通常在2小时内即可完成数据收集。Prolific凭借严谨和道德的方法,为全球研究人员和组织提供多样化的优质数据资源,赢得众多知名机构的信赖。
Logo of arena
arena
DIAMBRA Arena是一个开源的强化学习环境平台,集成了多款经典街机格斗游戏。它提供符合OpenAI Gym/Gymnasium标准的Python接口,支持单人和双人模式,适用于多种强化学习研究场景。该平台兼容主流操作系统,安装简便,并配有详细文档和示例。用户注册后可免费使用,还能参与在线竞赛。
Logo of awesome-huge-models
awesome-huge-models
详尽介绍大型AI语言模型最新进展及开源资源,包括训练代码、数据集和预训练权重。收录Baichuan、Falcon、OpenLLaMA等模型,并关注开源与分布式训练框架如PyTorch和XLA生态。提供全面资源链接,帮助研究人员和开发者了解当前AI模型的最前沿动态。
Logo of InstructionWild
InstructionWild
InstructionWild项目汇集11万余条高质量用户生成指令,类型丰富,标签完善。该数据集致力于增强AI模型在生成、开放问答和头脑风暴等领域的对话表现。项目展示了完整的数据收集流程、评估分析和后续规划,为AI研究与应用领域贡献重要资源。
Logo of chat-dataset-baseline
chat-dataset-baseline
chat-dataset-baseline项目整合Hugging Face平台优质数据集,为中文对话模型训练提供全面资源。采用PDCA循环迭代,涵盖数据选择、模型训练、测试和优化。项目提供详细指南,适合数据科学家和AI爱好者快速上手,用于训练高质量中文基础模型,为特定行业应用打下基础。
Logo of PrepBuddy
PrepBuddy
PrepBuddy为咨询案例面试提供AI驱动练习。平台采用前麦肯锡顾问训练的AI,基于真实案例给出实时反馈。支持灵活练习,跟踪进度。覆盖市场规模估算、估值等多种案例类型,帮助全面提升面试技能。
Logo of NeMo-Aligner
NeMo-Aligner
NeMo-Aligner是NVIDIA开发的语言模型对齐工具包,支持SteerLM、DPO和RLHF等算法,用于调整模型以提高安全性和实用性。基于NeMo Toolkit构建,支持大规模GPU并行处理,提供监督微调和奖励模型训练等功能。与NeMo生态系统兼容,便于模型部署和进一步定制。
Logo of asteroids-genetic
asteroids-genetic
asteroids-genetic是一个开源的交互式AI训练模拟器,结合神经网络和遗传算法来训练小行星游戏AI。该项目通过自然选择规则实现AI进化,支持AI模型的保存和加载,并提供人类玩家游戏体验。提供网页版和多平台桌面版,是AI学习、游戏开发和算法研究的实用工具。
Logo of Contra-PPO-pytorch
Contra-PPO-pytorch
本项目利用Proximal Policy Optimization (PPO)算法,通过Python代码训练AI智能体进行Contra NES游戏。PPO算法由OpenAI提出,其早期版本曾用于训练OpenAI Five在电竞中取得胜利。项目提供了详细的训练指南、示例代码,并支持Docker环境,方便进行模型的训练和测试。本项目展示了PPO算法在游戏AI中的实际应用效果。
Logo of param
param
PARAM (PyTorch based Arbitrary Range Micro-benchmarks) Benchmarks是一个评估AI训练和推理平台的综合基准测试库。它包括通信和计算微基准测试以及完整工作负载,弥补了独立C++基准测试和应用级基准测试之间的空白。PARAM能够深入分析系统架构和框架级开销,涵盖通信、计算和端到端工作负载评估。该开源项目采用MIT许可证,欢迎社区贡献。
Logo of lilac
lilac
Lilac是一个开源的AI数据处理工具,专注于数据集的探索、管理和质量控制。它提供交互式数据探索、LLM驱动的搜索、聚类和标注功能,支持本地运行和云端处理。Lilac能够优化数据集,降低AI训练成本,并支持语义搜索和概念搜索等高级特性。该工具已被Cohere和Databricks等公司采用,用于改善预训练和微调数据的质量。
Logo of CoolifyMe
CoolifyMe
CoolifyMe是领先的AI头像生成器,将照片转换为多样化的个性头像。上传18张照片后,系统3小时内生成100多个独特虚拟形象。采用加密技术保护隐私,适合社交媒体用户、游戏玩家和专业人士。这种创新的AI头像生成方式为用户提供丰富的个人形象选择,打造独一无二的数字化身。
Logo of BakLLaVA
BakLLaVA
BakLLaVA项目通过优化基础模型、改进训练流程、使用定制数据集和重构LLaVA架构,将先进的多模态能力融入语言模型。该项目与LAION、Ontocord和Skunkworks OSS AI小组合作,致力于提升AI系统理解和生成视觉内容的能力。BakLLaVA为研究人员提供了探索视觉语言模型前沿的强大工具。