热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#评测
AlignBench
AlignBench 是多维度评估中文大语言模型对齐性能的评测基准。最新的 v1.1 版本提供了动态更新的数据、详细评分规则和高质量参考答案,确保评估的可靠性和可解释性。涵盖八大能力类别的数据主要来自真实用户问题,并使用 GPT-4 作为评分模型,通过多维度分析方法系统评估模型性能。
Medical_NLP
本页面汇总了最新的医疗自然语言处理资源,涵盖基准评测、比赛信息、多语言数据集、开源预训练模型、学术论文和工具包等内容。为研究人员和开发者提供一站式资源支持,以提升医疗NLP领域的研究深度和应用效果。
XuanYuan
轩辕项目开源了6B、13B、70B等规模的中文大语言模型系列。这些模型在金融领域表现突出,FinanceIQ评测结果优于GPT-4。在C-Eval、CMMLU等通用能力测试中也取得了优秀成绩。项目同时发布高质量中文金融数据集,促进金融AI研究。多种模型规格可满足不同应用场景需求。
Llama3-Tutorial
Llama 3教程项目提供了从本地部署到高效部署和能力评测的全面指导。包含六个课程,涵盖XTuner个性化助手训练、LLaVA图像理解、LMDeploy高效部署和OpenCompass模型评估等核心内容。该教程为开发者提供了实践Llama 3大语言模型的完整流程和关键技能培训。
相关文章
AlignBench:全面评估中文大语言模型对齐性能的多维度基准
2 个月前
TransGPT: 中国首个开源交通大模型的突破性进展
2 个月前
Llama 3 教程:从入门到精通的全面指南
2 个月前
AlignBench入门指南 - 全面评估中文大语言模型对齐水平的基准
1 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号