#mamba-2.8b-zephyr

mamba-2.8b-zephyr - HuggingFace优化的AI模型Direct Preference Optimization方法提升性能

Github模型HuggingFace开源项目超参数训练数据集Huggingface模型微调mamba-2.8b-zephyr

mamba-2.8b-zephyr是对xiuyul/mamba-2.8b-ultrachat的增强版，在HuggingFaceH4/ultrafeedback_binarized数据集上通过Direct Preference Optimization方法进行训练。它在性能评价中表现优异，奖励准确率为0.7857，奖励边际值为1.1582。在多GPU分布式环境中，通过Adam优化器和线性学习率调度进行训练，提高了模型的稳定性和预测精准度，具备广泛的应用潜力。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号