热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#GLAM
Grounding_LLMs_with_online_RL - GLAM 强化学习优化大型语言模型的新方法
大语言模型
强化学习
BabyAI-Text
GLAM
Lamorel
Github
开源项目
这个开源项目开发了GLAM方法,通过在线强化学习优化大型语言模型在BabyAI-Text环境中的性能。项目提供了BabyAI-Text环境和实验代码,支持智能体训练和评估。研究者使用Lamorel库实现了PPO、DRRN等多种智能体。代码库包含详细的安装说明、配置文件和运行指南,便于其他研究人员复现和拓展相关研究。
1
1
相关文章
大型语言模型在交互式环境中的在线强化学习应用
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号