#UmBERTo
umberto-wikipedia-uncased-v1 - UmBERTo模型专注意大利语NLP任务
UmBERTo词汇表标记HuggingfaceGithub开源项目模型意大利语语言模型
UmBERTo Wikipedia Uncased是基于Roberta的意大利语语言模型,利用SentencePiece和Whole Word Masking技术进行训练。该模型展示出在命名实体识别和词性标注任务中的高表现,尤其是在F1和精确度指标上。模型训练于小规模的意大利语Wikipedia语料库,为意大利语应用提供支持。可以在huggingface平台上获取并进行应用测试。
umberto-commoncrawl-cased-v1 - 高性能意大利语预训练语言模型 支持全词遮蔽技术
意大利语言模型开源项目预训练模型命名实体识别UmBERTo自然语言处理模型HuggingfaceGithub
该模型是一个意大利语预训练语言模型,基于OSCAR语料库训练,支持命名实体识别和词性标注等自然语言处理任务。模型采用全词遮蔽技术,在多个基准测试中准确率达到98%以上。开发者可通过Hugging Face平台快速部署和使用该模型。