#RedPajama-Data-v2

RedPajama-Data-v2: 一个包含30万亿个令牌的开放数据集,用于训练大型语言模型

3 个月前
Cover of RedPajama-Data-v2: 一个包含30万亿个令牌的开放数据集,用于训练大型语言模型