Logo

#Text2Reward

Text2Reward: 利用大型语言模型实现强化学习中的自动化奖励函数生成

2 个月前
Cover of Text2Reward: 利用大型语言模型实现强化学习中的自动化奖励函数生成