#评价

VBench: 全面评估视频生成模型的基准测试套件

2024年09月04日

2024年09月04日

相关项目

VBench

VBench项目提供一个全面的基准测试套件，专用于评估视频生成模型的多维质量。通过分层的评估维度，VBench可以细化并客观地评估视频生成质量的多个方面。套件包含详细的提示和评估方法，并提供人类偏好注释，确保结果与人类感知一致。用户可以选择对自定义视频或标准提示进行评估，以确保模型间的公平对比。

lm-ner-linkedin-skills-recognition

该模型通过对distilbert-base-uncased进行LinkedIn领域的微调，展示出高效的技能识别性能。在评估集上，它达到了高精度（0.9119）、召回率（0.9312）和F1值（0.9214），准确率更是高达0.9912，适用于需要高可靠性技能识别的场景。

cot_5k

本文详细介绍了开源模型的功能用途、潜在风险和关键技术细节。通过深入了解这些方面，有助于优化模型应用，规避潜在问题。

投诉举报邮箱: service@vectorlightyear.com