#Vietnamese
PhoGPT - 越南语生成预训练模型系列
Github开源项目聊天机器人预训练生成模型PhoGPTVietnamese
PhoGPT是一个高性能的越南语生成预训练模型系列,包括基础模型PhoGPT-4B和聊天变体PhoGPT-4B-Chat。PhoGPT-4B在102B词汇上预训练,支持8192上下文长度和20K词汇类型。PhoGPT-4B-Chat经过微调,提升了对话和指令响应能力。PhoGPT在开源模型中表现优异,适合多种生成任务。
opus-mt-vi-en - 基于Transformer架构的越南语英语双向翻译模型
Github开源项目模型HuggingfaceVietnamese机器翻译OPUSTatoeba-ChallengeEnglish
opus-mt-vi-en是一个基于transformer-align架构的越南语-英语机器翻译模型。该模型在Tatoeba测试集上实现了42.8的BLEU分数和0.608的chrF分数。模型采用normalization和SentencePiece进行预处理,支持越南语和英语间的双向翻译。用户可通过官方链接获取模型权重和测试数据集。
vit5-base - 用以越南语生成任务的预训练Transformer模型
Github开源项目预训练Transformer模型HuggingfaceVietnameseViT5-base编码解码器
这是一个先进的预训练Transformer编码解码模型,专门用于越南语生成任务。它支持文本摘要、翻译和问答功能,并在GitHub上提供使用和微调的详细示例。