热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#DODa
dataset - 摩洛哥方言Darija与英语双语开源数据集DODa
Darija
DODa
开源数据集
摩洛哥方言
自然语言处理
Github
开源项目
Darija Open Dataset (DODa)是一个专注于摩洛哥方言的开源项目,包含约15万条条目。该数据集提供语义和语法分类、多种拼写形式、词形变化以及大量翻译句子。DODa采用拉丁字母和阿拉伯字母,反映了Darija拼写的多样性,为自然语言处理应用提供了丰富资源。项目目标是成为Darija NLP的重要参考,并鼓励社区贡献。
1
1
相关文章
Dataset: 探索开放数据集的世界
3 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号