#CAMeLBERT
bert-base-arabic-camelbert-msa-ner - 现代标准阿拉伯语命名实体识别增强
Github开源项目模型命名实体识别Huggingface预训练语言模型CAMeLBERT阿拉伯语模型Camel工具
项目基于CAMeLBERT模型提升现代标准阿拉伯语的命名实体识别性能,使用ANERcorp数据集进行微调以提高精度。可通过CAMeL Tools组件或transformers管道实现多用例应用。
bert-base-arabic-camelbert-da - 基于方言数据的阿拉伯语预训练语言模型
Github开源项目预训练模型深度学习自然语言处理模型Huggingface阿拉伯语CAMeLBERT
CAMeLBERT-DA是基于54GB阿拉伯语方言数据训练的语言模型,专门用于处理阿拉伯方言文本分析。模型支持掩码语言建模与序列预测,可用于实体识别、词性标注和情感分析等任务。模型采用3万词表的WordPiece分词方案,经过TPU训练后在多项评估中取得良好效果。