#MADLAD-400
madlad400-3b-mt - 基于T5架构的多语言机器翻译模型
模型开源项目Github多语言翻译T5模型Huggingface机器学习MADLAD-400自然语言处理
MADLAD-400-3B-MT是一个基于T5架构的多语言机器翻译模型,覆盖450多种语言。该模型在1万亿个token的公开数据上训练,可实现多语言间的高质量翻译。支持文本生成和翻译任务,主要面向研究社区。尽管参数量较小,性能却可与更大规模模型相媲美。MADLAD-400-3B-MT为低资源语言提供了有力的自然语言处理支持,促进了多语言NLP的进步。
madlad400-3b-mt - 多语言翻译模型,支持450+种语言的实时翻译
语言模型HuggingfaceMADLAD-400模型Github开源项目T5模型机器翻译多语言
MADLAD-400-3B-MT是基于T5架构的多语言机器翻译模型,在1万亿个涵盖450多种语言的标记上训练而成。模型采用32层3B参数的共享架构,使用256k标记的Sentence Piece模型进行编解码。尽管规模较小,其翻译性能可媲美大型模型,特别适合处理低资源语言的自然语言任务。