#评价
VBench - 视频生成模型多维度质量评估套件
VBench视频生成模型评价基准套件Python包Github开源项目
VBench项目提供一个全面的基准测试套件,专用于评估视频生成模型的多维质量。通过分层的评估维度,VBench可以细化并客观地评估视频生成质量的多个方面。套件包含详细的提示和评估方法,并提供人类偏好注释,确保结果与人类感知一致。用户可以选择对自定义视频或标准提示进行评估,以确保模型间的公平对比。
lm-ner-linkedin-skills-recognition - LinkedIn技能识别的深度学习模型
训练评价lm-ner-linkedin-skills-recognition模型Github开源项目精度Huggingface
该模型通过对distilbert-base-uncased进行LinkedIn领域的微调,展示出高效的技能识别性能。在评估集上,它达到了高精度(0.9119)、召回率(0.9312)和F1值(0.9214),准确率更是高达0.9912,适用于需要高可靠性技能识别的场景。
cot_5k - 研究开源变形金刚模型的功能与技术特点
Github模型transformers开源项目训练细节Huggingface环境影响模型卡评价
本文详细介绍了开源模型的功能用途、潜在风险和关键技术细节。通过深入了解这些方面,有助于优化模型应用,规避潜在问题。