#自动回归模型
Lumina-mGPT-7B-768 - 自回归多模态模型在图像生成和语言任务中的应用
Github开源项目图像生成模型多模态文本描述HuggingfaceLumina-mGPT自动回归模型
Lumina-mGPT是一组多模态自回归模型,专注于视觉和语言任务,尤其在从文本描述生成逼真的图像方面表现出色。GitHub上的实现和示例代码让用户可以轻松探索和应用其能力。
llama-7b-hf - LLaMA-7B模型在自然语言处理和AI研究中的应用
Github开源项目自然语言处理模型LLaMA模型评估Huggingface补充授权自动回归模型
LLaMA-7B是Meta AI的FAIR团队开发的自回归语言模型,基于转换器架构拥有7B参数,主要用于研究大语言模型的可能性。模型改进了解决EOS标记问题,并通过多数据集如CCNet、C4和Wikipedia进行训练,展现出语言间和方言间的性能差异,适合问答和自然语言理解等应用场景。仅限获授权的非商业研究使用,更多信息请参考Meta AI的研究出版物。
polyglot-ko-3.8b - 韩国大规模自回归语言模型的技术突破
Github开源项目模型HuggingfaceEleutherAIPolyglot-Ko自动回归模型韩国语言模型RoPE位置编码
Polyglot-Ko-3.8B是一个由EleutherAI开发的韩国大型自回归语言模型,具有3.8B参数和32个Transformer层,采用Rotary位置编码。模型在超过863GB的韩语数据集上训练,但不对公众开放,并在训练中屏蔽了个人信息,以防止生成个人识别数据。Polyglot-Ko-3.8B在COPA和HellaSwag任务中表现优异。此模型可在GPT-NeoX框架中使用,适合多种语言处理任务,但建议在使用时对潜在敏感内容进行人类审核。