#Wikitext-103

BitNet-Transformers 入门学习指南 - 1比特Transformer缩放大型语言模型

2 个月前

BitNet-Transformers Huggingface LLama(2)pytorch Wikitext-103 Github 开源项目

2 个月前

BitNet-Transformers: 1比特量化技术在大型语言模型中的应用与实现

3 个月前

BitNet-Transformers Huggingface LLama(2)pytorch Wikitext-103 Github 开源项目

3 个月前

相关项目

BitNet-Transformers

BitNet-Transformers项目使用Llama (2)架构，并通过1-bit权重缩放技术，实现对大型语言模型的高效训练和推理。该项目基于Huggingface Transformers，显著降低了GPU内存占用，从原始LLAMA的250MB减少到BitNet模型的最低要求。用户可通过wandb实时追踪训练进度，并在Wikitext-103上进行训练。项目提供了详细的开发环境配置和训练步骤指南，为研究者和开发者提供有力支持。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com