#Vietnamese

PhoGPT - 越南语生成预训练模型系列

Github开源项目聊天机器人预训练生成模型PhoGPTVietnamese

PhoGPT是一个高性能的越南语生成预训练模型系列，包括基础模型PhoGPT-4B和聊天变体PhoGPT-4B-Chat。PhoGPT-4B在102B词汇上预训练，支持8192上下文长度和20K词汇类型。PhoGPT-4B-Chat经过微调，提升了对话和指令响应能力。PhoGPT在开源模型中表现优异，适合多种生成任务。

opus-mt-vi-en - 基于Transformer架构的越南语英语双向翻译模型

Github开源项目模型HuggingfaceVietnamese机器翻译OPUSTatoeba-ChallengeEnglish

opus-mt-vi-en是一个基于transformer-align架构的越南语-英语机器翻译模型。该模型在Tatoeba测试集上实现了42.8的BLEU分数和0.608的chrF分数。模型采用normalization和SentencePiece进行预处理，支持越南语和英语间的双向翻译。用户可通过官方链接获取模型权重和测试数据集。

vit5-base - 用以越南语生成任务的预训练Transformer模型

Github开源项目预训练Transformer模型HuggingfaceVietnameseViT5-base编码解码器

这是一个先进的预训练Transformer编码解码模型，专门用于越南语生成任务。它支持文本摘要、翻译和问答功能，并在GitHub上提供使用和微调的详细示例。

相关文章

Article Cover

PhoGPT入门指南 - 越南语生成式预训练模型

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号