#评估数据集

Awesome-LLM-Eval - 集成了评估工具、数据集、演示与论文资源的平台
Github开源项目LLM应用大模型评估评估工具评估数据集LLM技术边界
Awesome-LLM-Eval 包罗万象,集成了评估工具、数据集、演示与论文资源,深入探讨大型语言模型的评估技术和方法。该平台支撑学术探索与实际应用,并致力于提升语言模型的透明度及可信度。
Awesome-LLMs-Datasets - 完整收录大型语言模型数据集的多维度分类概览
Github开源项目大语言模型评估数据集LLMs数据集预训练语料库指令微调数据集
这个项目全面收集和分类了大型语言模型(LLM)数据集,包括预训练语料库、指令微调数据集、偏好数据集、评估数据集和传统NLP数据集五大类别。新增的内容涵盖多模态大语言模型数据集和检索增强生成数据集。项目统计了444个数据集的详细信息,覆盖8种语言和32个领域,为LLM研究提供了全面参考资源。
wav2vec2-xls-r-300m-mixed - wav2vec2模型在多语言环境下的创新语音识别解决方案
Github开源项目语音识别语言模型模型KerasHuggingface评估数据集wav2vec2-xls-r-300m-mixed
wav2vec2-xls-r-300m-mixed项目在马来语、Singlish和普通话三种语言上进行了微调。依托单GPU(RTX 3090 Ti)完成训练,结合语言模型在CER和WER等指标上表现优异,尤其在普通话识别中取得了最低WER 0.075。这为多语言语音识别的研究与优化提供了一个有效路径。
tiny-random-bert-sharded - 模型从零开始训练,适应不明数据集进行深度学习
Github开源项目模型训练模型Huggingface评估数据集训练超参数框架版本tiny-random-bert-sharded
该模型完全从零训练,具体数据集信息尚未公开。利用TensorFlow和Transformers框架,该模型利于在不明数据环境下进行实验和测试,适合研究每种应用表现。
Qwen2-72B - 新一代开源大语言模型在多个领域表现出色的中立评估
Github开源项目文本生成语言模型模型Huggingface评估数据集多语言能力Qwen2-72B
Qwen2系列大语言模型采用改进的Transformer架构,包含多种参数尺寸,加强了在多语言、编程、数学和推理领域的表现。Qwen2-72B模型对比现有开源和专有模型,展示了其在自然语言处理、代码生成和多语言翻译方面的竞争力,支持各类复杂任务的高效执行。了解更多关于模型的功能和实用建议,为语言技术应用提供支持。