CarbonVillain-en-10.7B-v4项目介绍
CarbonVillain-en-10.7B-v4是一个面向生成文本任务的大规模语言模型。这个模型旨在推动解决与碳排放相关的问题,其开发的初衷是通过创新的技术手段反对无差别的碳排放。
项目背景
CarbonVillain-en-10.7B-v4是通过使用mergekit工具合并多个版本的模型创建的实验性版本。合并过程中使用的方法是slerp
,整合了以下几个版本的模型:
核心功能
CarbonVillain-en-10.7B-v4主要用于文本生成任务。它在多个公开的数据集上进行了测试,这些数据集包括智力推理挑战、HellaSwag、MMLU、TruthfulQA、Winogrande和GSM8k等。模型在这些数据集上的表现如下:
- AI2 Reasoning Challenge (25-Shot):标准化准确率为71.25
- HellaSwag (10-Shot):标准化准确率为88.48
- MMLU (5-Shot):准确率为66.27
- TruthfulQA (0-shot):准确率为71.95
- Winogrande (5-shot):准确率为83.58
- GSM8k (5-shot):准确率为65.58
成果展示
CarbonVillain-en-10.7B-v4在2023年12月30日的排名中获得了第一名,成绩斐然。详细的评估结果可以在Open LLM Leaderboard查阅。
感谢与支持
在模型开发过程中,CarbonVillain获得了来自社区的众多支持,特别要感谢KyujinHan, Yağız Çalık 以及 VAGO solutions提供的宝贵帮助。
总之,CarbonVillain-en-10.7B-v4代表了一项重要的技术前进,通过其在生成文本和推理应用中的卓越性能,展示了大规模语言模型在解决复杂问题中的潜力。