#评估数据集

Awesome-LLM-Eval - 集成了评估工具、数据集、演示与论文资源的平台

Github开源项目LLM应用大模型评估评估工具评估数据集LLM技术边界

Awesome-LLM-Eval 包罗万象，集成了评估工具、数据集、演示与论文资源，深入探讨大型语言模型的评估技术和方法。该平台支撑学术探索与实际应用，并致力于提升语言模型的透明度及可信度。

Awesome-LLMs-Datasets - 完整收录大型语言模型数据集的多维度分类概览

Github开源项目大语言模型评估数据集LLMs数据集预训练语料库指令微调数据集

这个项目全面收集和分类了大型语言模型(LLM)数据集，包括预训练语料库、指令微调数据集、偏好数据集、评估数据集和传统NLP数据集五大类别。新增的内容涵盖多模态大语言模型数据集和检索增强生成数据集。项目统计了444个数据集的详细信息，覆盖8种语言和32个领域，为LLM研究提供了全面参考资源。

wav2vec2-xls-r-300m-mixed - wav2vec2模型在多语言环境下的创新语音识别解决方案

Github开源项目语音识别语言模型模型KerasHuggingface评估数据集wav2vec2-xls-r-300m-mixed

wav2vec2-xls-r-300m-mixed项目在马来语、Singlish和普通话三种语言上进行了微调。依托单GPU（RTX 3090 Ti）完成训练，结合语言模型在CER和WER等指标上表现优异，尤其在普通话识别中取得了最低WER 0.075。这为多语言语音识别的研究与优化提供了一个有效路径。

tiny-random-bert-sharded - 模型从零开始训练，适应不明数据集进行深度学习

Github开源项目模型训练模型Huggingface评估数据集训练超参数框架版本tiny-random-bert-sharded

该模型完全从零训练，具体数据集信息尚未公开。利用TensorFlow和Transformers框架，该模型利于在不明数据环境下进行实验和测试，适合研究每种应用表现。

Qwen2-72B - 新一代开源大语言模型在多个领域表现出色的中立评估

Github开源项目文本生成语言模型模型Huggingface评估数据集多语言能力Qwen2-72B

Qwen2系列大语言模型采用改进的Transformer架构，包含多种参数尺寸，加强了在多语言、编程、数学和推理领域的表现。Qwen2-72B模型对比现有开源和专有模型，展示了其在自然语言处理、代码生成和多语言翻译方面的竞争力，支持各类复杂任务的高效执行。了解更多关于模型的功能和实用建议，为语言技术应用提供支持。

相关文章

Article Cover

Awesome-LLM-Eval: 大型语言模型评测工具与基准的全面指南

Article Cover

Awesome-LLMs-Datasets:大型语言模型数据集全面概述

Article Cover

Awesome-LLMs-Datasets: 大型语言模型数据集全面概述

Article Cover

Awesome-LLM-Eval学习资料汇总 - 大语言模型评估工具与基准的精选列表

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号