项目简介:gbert-large
gbert-large是一个专门为德语设计的大型BERT语言模型。该模型于2020年10月发布,由原始德语BERT的创作者与dbmdz BERT的开发者合作训练完成。相比较之前的版本,这一模型在性能上表现出色,并且在多项测试中超越了前辈们。
模型概况
- 论文链接:点击查看论文
- 模型架构:BERT large
- 支持语言:德语
性能表现
在多项德语语料训练的评测中,gbert-large表现优异,具体成绩如下:
- GermEval18 粗略分类:80.08
- GermEval18 细分分类:52.48
- GermEval14:88.16
这些成绩展示了该模型在处理德语文本时的强大能力。
项目作者
- Branden Chan: 邮箱 - branden.chan@deepset.ai
- Stefan Schweter: 邮箱 - stefan@schweter.eu
- Timo Möller: 邮箱 - timo.moeller@deepset.ai
关于我们
deepset是开发这个模型的主要公司,他们也是生产级开源AI框架Haystack的制作公司。deepset在AI领域有多个重要贡献,如tinyroberta-squad2和其它德语相关模型,并且他们的项目还包括deepset Cloud和deepset Studio。
加入社区
有兴趣进一步了解Haystack及其背后的技术?可以访问他们的GitHub和文档。此外,也欢迎加入他们的Discord社区。
更多信息可通过以下链接获取:
deepset目前也在招聘中,点击查看职位。