热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#KTO
HALOs - 设计人类意识损失函数以改进大型语言模型的人类反馈对齐
Human-Aware Loss Functions
LLM
KTO
Archangel
训练
Github
开源项目
该项目提供灵活的平台,用于设计和优化人类意识的损失函数,旨在大规模地与离线人类反馈对齐大型语言模型。通过模块化数据加载和训练架构,支持包括KTO、PPO等多种损失策略,并提供基于GPT-4的开放式评估功能。建议阅读项目的技术报告和完整论文以获取更多信息。
1
1
相关文章
HALOs: 人类意识损失函数 - 优化大型语言模型的新方法
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号