#StableLM-3B-4E1T

stablelm-3b-4e1t - StableLM开源语言模型在1万亿token数据上训练达到30亿参数规模

大语言模型开源模型开源项目StableLM-3B-4E1T模型人工智能Huggingface文本生成Github

StableLM-3B-4E1T是一个开源语言模型，通过在Falcon RefinedWeb和RedPajama-Data等数据集上训练4轮获得，总计处理1万亿tokens数据。模型采用LayerNorm归一化和Rotary位置编码技术，支持Flash Attention 2优化。在HellaSwag和Winogrande任务评测中分别达到75.94%和71.19%的准确率，展现出良好的语言理解能力。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号