#MuRIL
muril-large-cased - 支持17种印度语言的BERT大规模预训练模型
Github开源项目预训练模型自然语言处理多语言模型Huggingface印度语言MuRIL
MuRIL是基于BERT large架构开发的印度语言预训练模型,支持17种印度语言及其音译版本。模型通过整合翻译数据和音译语料进行训练,在PANX和问答等多项XTREME基准测试中超越XLM-R large的性能表现,可广泛应用于印度语言相关的自然语言处理任务。
muril-base-cased - MuRIL:适用于多种印度语言的多语言BERT模型
Github开源项目自然语言处理模型Huggingface迁移学习印度语言MuRIL多语言表征
MuRIL是一种专为17种印度语言及其音译数据预训练的BERT模型。此模型利用公共数据集和新颖的训练方法,在低资源语言处理上表现优异。MuRIL在多个基准任务中超越了传统的mBERT模型,适用于印度语言的多种NLP任务,并附带预处理模块及使用指南以支持有效应用。