#评测

AlignBench入门指南 - 全面评估中文大语言模型对齐水平的基准

1 个月前

Cover of AlignBench入门指南 - 全面评估中文大语言模型对齐水平的基准

AlignBench是一个专门用于评估中文大语言模型对齐性能的多维度基准测试。本文汇总了AlignBench项目的相关资源,帮助读者快速了解和使用这一评测工具。

AlignBench 大语言模型对齐水平评测 GPT-4-0613 Github 开源项目

1 个月前

Cover of AlignBench入门指南 - 全面评估中文大语言模型对齐水平的基准

TransGPT: 中国首个开源交通大模型的突破性进展

2 个月前

Cover of TransGPT: 中国首个开源交通大模型的突破性进展

北京交通大学携手中国计算机学会智能交通专业委员会等机构推出TransGPT，这是中国首个综合性大规模交通模型，旨在为交通行业带来革命性的变革。

TransGPT 交通大模型多模态开源数据集评测 Github 开源项目

2 个月前

Cover of TransGPT: 中国首个开源交通大模型的突破性进展

Llama 3 教程：从入门到精通的全面指南

2 个月前

Cover of Llama 3 教程：从入门到精通的全面指南

本文全面介绍了Llama 3模型的应用与开发，包括本地部署、微调、量化部署、评测等内容，帮助读者快速掌握Llama 3的核心技能。

Llama 3 微调部署评测大模型 Github 开源项目

2 个月前

Cover of Llama 3 教程：从入门到精通的全面指南

AlignBench：全面评估中文大语言模型对齐性能的多维度基准

2 个月前

Cover of AlignBench：全面评估中文大语言模型对齐性能的多维度基准

AlignBench是一个专门用于评估中文大语言模型与人类意图对齐程度的全面基准。它采用多维度评估方法，结合人工参与的数据构建流程和规则校准的LLM-as-Judge评价方式，为中文大模型的对齐性能提供了可靠且可解释的评测标准。

AlignBench 大语言模型对齐水平评测 GPT-4-0613 Github 开源项目

2 个月前

Cover of AlignBench：全面评估中文大语言模型对齐性能的多维度基准

相关项目

Project Cover

AlignBench 是多维度评估中文大语言模型对齐性能的评测基准。最新的 v1.1 版本提供了动态更新的数据、详细评分规则和高质量参考答案，确保评估的可靠性和可解释性。涵盖八大能力类别的数据主要来自真实用户问题，并使用 GPT-4 作为评分模型，通过多维度分析方法系统评估模型性能。

Project Cover

本页面汇总了最新的医疗自然语言处理资源，涵盖基准评测、比赛信息、多语言数据集、开源预训练模型、学术论文和工具包等内容。为研究人员和开发者提供一站式资源支持，以提升医疗NLP领域的研究深度和应用效果。

Project Cover

轩辕项目开源了6B、13B、70B等规模的中文大语言模型系列。这些模型在金融领域表现突出，FinanceIQ评测结果优于GPT-4。在C-Eval、CMMLU等通用能力测试中也取得了优秀成绩。项目同时发布高质量中文金融数据集，促进金融AI研究。多种模型规格可满足不同应用场景需求。

Project Cover

Llama3-Tutorial

Llama 3教程项目提供了从本地部署到高效部署和能力评测的全面指导。包含六个课程，涵盖XTuner个性化助手训练、LLaVA图像理解、LMDeploy高效部署和OpenCompass模型评估等核心内容。该教程为开发者提供了实践Llama 3大语言模型的完整流程和关键技能培训。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号