Project Icon

PPOxFamily

PPO算法在决策智能领域的应用实践

PPOxFamily是一个深度强化学习入门课程,聚焦PPO算法在决策智能领域的应用。课程通过视频讲解、理论资料和代码示例,系统阐述PPO算法原理及其在复杂动作空间、多模态观察、稀疏奖励、时序建模和多智能体等问题上的应用。内容涵盖理论讲解、补充材料、习题及解答,以及详细的代码实现,为学习者提供全面的学习资源。

cleanrl - 一个深度强化学习库
CleanRLGithubPPO算法云集成单文件实现开源项目深度强化学习
CleanRL是一款简洁高效的深度强化学习库,提供单文件实现和广泛的算法支持,包括PPO、DQN等。它支持本地和云端实验、Tensorboard日志记录及Weights and Biases管理,适用于研究与快速原型开发。
reinforcement_learning_course_materials - 强化学习完整开源课程资料 包括讲义练习和视频
GithubPython开源项目强化学习教学视频练习题课程材料
这个项目提供了全面的强化学习课程资料,包含讲义、练习题及答案和教学视频。内容覆盖从基础到高级的强化学习知识,如马尔可夫决策过程、动态规划、蒙特卡洛方法和时序差分学习等。每个主题配有详细讲解和Python代码实现。所有资料均为开源,适合自学者和教育工作者使用。该资源为强化学习的学习和教学提供了实用全面的材料支持。
rl_games - 强化学习框架支持多环境及算法的高性能实现
GPU加速GithubRL Games多智能体训练开源项目强化学习机器人学习
rl_games是一个高性能强化学习库,实现了PPO、A2C等算法,支持NVIDIA Isaac Gym、Brax等环境的GPU加速训练。该库具备异步actor-critic、多智能体训练、自对弈等功能,可在多GPU上并行。rl_games提供Colab notebook示例便于快速上手,在多个基准测试中表现出色。作为一个功能丰富的强化学习工具,rl_games兼具高性能和易用性。
mlcourse.ai - 综合性机器学习在线课程 理论实践并重
GithubOpenDataSciencemlcourse.ai开源项目数据分析机器学习课程算法
mlcourse.ai是OpenDataScience推出的开放式机器学习课程,涵盖数据分析到梯度提升等10个主题。课程通过理论讲解与实践作业相结合,帮助学习者掌握机器学习技能。提供多语言学习资源,包括文章、视频和编程作业,支持自定进度学习。另有付费作业包供选择,进一步提升学习效果。
direct-preference-optimization - DPO算法实现语言模型的偏好数据优化
DPOGithub偏好优化开源项目机器学习训练算法语言模型
DPO(Direct Preference Optimization)是一种语言模型训练算法,通过偏好数据优化模型。该项目提供DPO算法的参考实现,包含监督微调和基于偏好学习两个阶段。支持各种因果HuggingFace模型,可添加自定义数据集,并包括'conservative' DPO和IPO等变体。这为研究人员提供了灵活工具,用于从偏好数据训练语言模型。
LearningHumanoidWalking - 强化学习驱动的人形机器人双足行走算法
GithubMuJoCoPyTorch人形机器人双足行走开源项目强化学习
LearningHumanoidWalking开源项目探索了基于强化学习的人形机器人双足行走控制。该项目利用PPO算法训练机器人在预设足迹上行走,实现了包括上下楼梯和弯道行走在内的复杂任务。项目提供了完整的代码实现,涵盖环境设置、奖励函数和网络结构等,为相关研究提供了可复现的实验基础。通过MuJoCo物理引擎仿真,该算法在多种复杂地形中展现了良好性能。
hands-on-rl - 实践驱动的强化学习进阶教程
GithubPython开源项目强化学习机器学习深度学习课程
hands-on-rl项目提供一套系统化的强化学习实践教程。该教程涵盖从Q-learning到策略梯度等核心算法,通过递进难度的案例帮助学习者掌握RL技术。内容包括出租车驾驶和登月模拟等实例,并结合深度学习知识。教程提供Python代码实现和详细解释,适合希望深入学习强化学习的研究者和开发者。
FinRL-Tutorials - FinRL金融强化学习实践教程与应用案例集
FinRLGithub开源项目投资组合管理深度强化学习量化交易金融市场
FinRL-Tutorials项目提供强化学习在金融交易中的实践教程。内容涵盖股票交易、投资组合管理和加密货币等领域,从入门到高级逐步深入。教程展示FinRL框架应用,同时介绍可解释AI和集成学习等技术。项目为研究人员和从业者提供了将AI应用于金融市场的学习资源。
PFLlib - 个性化联邦学习算法库和评估平台
GithubPFLlib个性化开源项目数据集算法库联邦学习
提供36种传统和个性化联邦学习算法,涵盖3种场景和20个数据集。专注于统计异质性数据,支持高效GPU内存使用及新增的隐私保护功能。新手用户通过简单的示范指南即可快速上手,参与贡献算法、数据集和评估指标。支持非独立同分布和不均衡数据,并可在多达500个客户端上进行训练模拟。
ppl.nn - 用于 AI 推理的高性能深度学习推理引擎
GithubONNXOpenMMLabPPLNN卷积神经网络开源项目深度学习推理
PPLNN是一款高效的深度学习推理引擎,兼容各种ONNX模型,并对OpenMMLab进行了优化。其最新的LLM引擎包括闪存注意力、分裂K注意力、动态批处理和张量并行等功能,并支持INT8分组和通道量化。项目发布了多个LLM模型,如LLaMA、ChatGLM和Baichuan,并提供详细的构建和集成指南。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号