Project Icon

stable-baselines3-contrib

实验性强化学习算法和工具

提供最新的实验性强化学习算法和工具,保持稳定基线风格和文档,适用于更广泛的实际应用需求。包括增强随机搜索(ARS)和量化回归DQN(QR-DQN)等算法,以及适用于Gym环境的包装器。适合需要超越主存储库限制且仍需高可靠性的用户。

dreamerv3 - 多领域任务的通用强化学习算法
AI训练DreamerV3Github世界模型开源项目强化学习性能优化
DreamerV3是一种创新的强化学习算法,通过世界模型实现多领域任务掌控。其特点是使用固定超参数,具有卓越的稳健性和扩展性。随着模型规模增加,性能和数据效率同步提升。该开源项目提供完整实现,包含训练脚本和使用指南,为研究人员和开发者提供了探索先进强化学习技术的平台。
PantheonRL - 多智能体强化学习训练和测试的模块化框架
GithubPantheonRLStableBaselines3多智能体强化学习开源项目自适应训练训练框架
PantheonRL是一个用于多智能体强化学习环境训练和测试的开源框架。它提供模块化和可扩展的功能,支持智能体策略训练、微调、动态配对等。基于StableBaselines3构建,PantheonRL采用去中心化训练方法,为每个智能体配备独立的重放缓冲区和更新算法。此外,它还提供Web用户界面,便于进行轻量级实验和原型设计,支持自我对弈、交叉对弈、循环训练和微调等多种训练模式。
HandyRL - 高效实用的分布式强化学习框架
GithubHandyRLPyTorch分布式训练开源项目强化学习离线策略修正
HandyRL是一个基于Python和PyTorch的分布式强化学习框架,已在Kaggle竞赛中取得优异成绩。它采用离线策略修正的策略梯度算法和学习者-工作者架构,支持自定义环境和大规模训练。HandyRL的高并行能力和实用性使其在竞争性游戏AI开发中表现出色,能够快速训练出强大的AI模型。
Gym-Trading-Env - Gymnasium金融交易环境 支持强化学习算法研究
GithubGym Trading EnvPython库交易模拟开源项目强化学习金融数据
Gym-Trading-Env是基于Gymnasium的股票交易模拟环境,专为强化学习算法研究设计。它支持多交易所数据快速下载、高效环境配置、复杂交易操作和高性能渲染。适用于Python 3.9+的Windows、Mac和Linux平台,为交易算法研究提供了简化的工具。
reinforcement-learning-an-introduction - Sutton & Barto《强化学习: 介绍 (第2版)》的Python实现
GithubPythonReinforcement LearningSutton & Barto图像分析开源项目算法
该项目提供了Sutton和Barto所著《Reinforcement Learning: An Introduction(第2版)》的Python代码实现,涵盖各章节的示例和性能分析。项目专注于强化学习核心算法的实现和优化,适合打算深入了解和应用强化学习技术的开发者与研究人员。欢迎交流、贡献代码,提升项目质量与完整性。
ReinforcementLearning.jl - 高性能Julia强化学习框架
GithubJuliaReinforcementLearning.jl开源项目强化学习机器学习
ReinforcementLearning.jl是Julia语言开发的强化学习框架,提供精心设计的组件和接口。研究人员可轻松实现新算法、进行基准测试和算法比较。框架支持从传统表格方法到深度强化学习,注重实验可重复性。其核心设计原则包括可重用性、可扩展性和易用性,适合各类强化学习实验和研究。
rliable - 提升强化学习和机器学习评估可靠性的Python库
Githubrliable开源项目强化学习性能分析置信区间评估方法
rliable是一个开源Python库,旨在提高强化学习和机器学习基准测试的评估可靠性。该库支持分层自举置信区间、性能曲线和聚合指标等功能,即使在数据有限的情况下也能得出可靠结论。rliable提供交互式Colab演示和多个主流基准测试数据,致力于克服现有评估方法的局限性,增强结果的可重复性和统计稳健性。
genrl - 强化学习算法库,提供快速基准测试和示例教程
GenRLGithubPyTorch基准测试开源项目强化学习算法实现
GenRL是一个基于PyTorch的强化学习库,提供可重现的算法实现和通用接口。它包含20多个从基础到高级的强化学习教程,并支持模块化和可扩展的Python编程。统一的训练和日志记录功能提高了代码复用性,同时自动超参数调整功能加速了基准测试。GenRL旨在支持新算法的实现,代码少于100行。适用于Python 3.6及以上版本,依赖于PyTorch和OpenAI Gym。
competition-baseline - 为数据科学入门者及爱好者提供基本的、易于理解的代码,支持参与国内外数据竞赛
AI换脸Github人工智能开源项目数据竞赛海上风电出力预测科大讯飞
competition-baseline为数据科学入门者及爱好者提供基本的、易于理解的代码,支持参与国内外数据竞赛。涵盖机器学习至深度学习等领域,适用于多种场景,如AI换脸、海上风电及人脸识别等,促进开源学习文化发展及技术应用能力提升。
AgentGym - 多环境下的广泛能力AI智能体进化平台
AgentGymGithub人工智能基准套件开源项目自我进化方法高质量轨迹集
AgentGym是一个框架,通过多种交互环境和统一任务格式,协助科研人员评估和开发具备广泛能力的语言模型智能体。平台支持实时反馈和并发操作,包含14种环境,如网页导航、文字游戏和家务任务。核心组成包括高质量的轨迹集AgentTraj和基准测试套件AgentEval,并提出了智能体自我进化方法AgentEvol。实验结果显示,进化后的智能体可与当前最先进的模型媲美。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号