相关项目
VBench
VBench项目提供一个全面的基准测试套件,专用于评估视频生成模型的多维质量。通过分层的评估维度,VBench可以细化并客观地评估视频生成质量的多个方面。套件包含详细的提示和评估方法,并提供人类偏好注释,确保结果与人类感知一致。用户可以选择对自定义视频或标准提示进行评估,以确保模型间的公平对比。
lm-ner-linkedin-skills-recognition
该模型通过对distilbert-base-uncased进行LinkedIn领域的微调,展示出高效的技能识别性能。在评估集上,它达到了高精度(0.9119)、召回率(0.9312)和F1值(0.9214),准确率更是高达0.9912,适用于需要高可靠性技能识别的场景。
cot_5k
本文详细介绍了开源模型的功能用途、潜在风险和关键技术细节。通过深入了解这些方面,有助于优化模型应用,规避潜在问题。