相关项目
UD_English-EWT
UD英语网络树库包含254,820个单词和16,622个句子,涵盖博客、新闻组、电子邮件等多种网络文本。语料采用CoNLL-U格式,依存关系经人工校正,部分双重标注。该语料库遵循通用依存关系规范,为自然语言处理研究提供了高质量的英语语言资源。
bert-base-japanese-upos
此模型在日语维基百科文本上进行预训练,支持词性标注和依存解析等任务。它衍生自bert-base-japanese-char-extended,利用UPOS体系为短单位词标注。通过Python代码,用户能方便地进行文本处理和结构解析,适合希望高效处理日语文本的用户。该模型具有良好的兼容性,可通过Huggingface平台使用。