Logo

#Reinforcement Learning

Logo of annotated_deep_learning_paper_implementations
annotated_deep_learning_paper_implementations
该项目提供详细文档和解释的简明PyTorch神经网络及算法实现,涵盖Transformer、GPT-NeoX、GAN、扩散模型等前沿领域,并每周更新新实现,帮助研究者和开发者高效理解深度学习算法。
Logo of awesome-RLHF
awesome-RLHF
此页面汇集了关于强化学习与人类反馈(RLHF)的最新研究论文,涵盖从基础概念到高级技术,包括大语言模型、视频游戏、机器人和个性化推荐系统等应用。页面将持续更新,跟踪此领域的前沿进展。
Logo of machine-learning-curriculum
machine-learning-curriculum
该教程旨在引导学习机器学习,推荐实用工具和媒体资源,帮助用户融入机器学习领域。内容定期更新,保持新鲜度并移除过时信息。涵盖机器学习、深度学习、强化学习及最佳实践等多个主题,并提供详细的学习资源和书籍推荐。适合从初学者到高级用户,帮助提升机器学习技能,掌握最新技术。
Logo of ML-From-Scratch
ML-From-Scratch
本项目使用Python从零实现多个机器学习模型与算法,旨在展示其内部运作。涵盖监督学习、非监督学习、强化学习和深度学习,并提供多项式回归、CNN分类、生成对抗网络等实际案例,适合希望深入理解机器学习原理的开发者和爱好者。
Logo of Awesome-Papers-Autonomous-Agent
Awesome-Papers-Autonomous-Agent
此资源汇聚了最新的自主智能体研究论文,涵盖了强化学习(RL)和大型语言模型(LLM)智能体方向。汇编内容包括ICLR、ICML、NeurIPS等顶级会议上接受的论文,并分类为任务跟随、世界模型构建、跨任务泛化、持续学习及RL与LLM的结合等专题。该项目旨在持续更新,为研究者提供全面参考,并欢迎提交issue推荐其他相关研究。
Logo of rl-agents
rl-agents
此页面介绍了多种强化学习算法的实现,如价值迭代、交叉熵方法、蒙特卡洛树搜索和深度Q网络,适用于有限MDP和连续动作空间等环境。用户可参考详细的安装和使用指南,通过命令行运行实验和基准测试,并使用Gym Monitor和Tensorboard等工具进行性能监控,非常适合优化决策和数据分析的研究者与开发者。
Logo of deep-rl-class
deep-rl-class
本页面提供Hugging Face深度强化学习课程的全部资源,包括mdx文件和教程笔记。学习者可获取课程大纲、注册信息及详细介绍,适合研究AI和机器学习的人员深入了解深度强化学习的核心概念和应用技术。
Logo of reinforcement-learning-an-introduction
reinforcement-learning-an-introduction
该项目提供了Sutton和Barto所著《Reinforcement Learning: An Introduction(第2版)》的Python代码实现,涵盖各章节的示例和性能分析。项目专注于强化学习核心算法的实现和优化,适合打算深入了解和应用强化学习技术的开发者与研究人员。欢迎交流、贡献代码,提升项目质量与完整性。
Logo of rl-book
rl-book
本书系统介绍强化学习,从基础理论到具体算法实现,包含基于TensorFlow和PyTorch的代码对照,实现经典和现代深度强化学习算法。提供完整数学推导和高质量代码,适合希望深入理解和应用强化学习的读者。
Logo of OpenUnivCourses
OpenUnivCourses
通过此页面,您可以找到麻省理工学院、斯坦福大学、伯克利大学、卡内基梅隆大学、纽约大学等顶尖高校提供的免费在线课程。这些课程涵盖深度学习、强化学习、自然语言处理、数据结构和人工智能等热门领域。每个课程都有多个年份的资源链接,方便获取最新和过往课程资料,支持学术研究与职业发展。
Logo of awesome-deep-rl
awesome-deep-rl
该项目收录了深度强化学习领域的重要研究成果和应用示例,包括最新的学术论文、框架、算法和应用案例,覆盖无监督、离线、价值基础和策略梯度等多种方法。项目内容经常更新,提供最新的研究动态和工具,如2024年的HILP与2022年的EDDICT。适合从事人工智能、机器学习和强化学习的专业人员与爱好者了解该领域的最新进展。