#德语模型

German_Semantic_STS_V2 - 德语语义相似度计算模型实现文本搜索与聚类

GithubBERT自然语言处理Huggingface德语模型开源项目模型语义相似度sentence-transformers

这是一个专注于德语文本处理的语义模型，能够准确计算文本间的语义相似度。模型在德语基准测试中表现出色，相似度评分达到0.86，优于现有主流方案。主要应用于智能文本搜索、文档聚类等场景，并提供简单的集成方式。

gbert-large-paraphrase-cosine - GBERT-Large模型优化德语少样本文本分类

BERTGithub开源项目句子相似度SetFit德语模型自然语言处理Huggingface模型

gbert-large-paraphrase-cosine是一个基于deepset/gbert-large的德语句子转换模型，能将文本映射至1024维向量空间。该模型与SetFit配合使用，显著提升德语少样本文本分类效果。模型采用MultipleNegativesRankingLoss和余弦相似度作为损失函数，在精选的deutsche-telekom/ger-backtrans-paraphrase数据集上训练。评估显示，其在德语少样本场景中的表现优于多语言模型和Electra模型，为德语自然语言处理任务提供了有力工具。

bert-base-german-uncased - 基于多源语料库训练的德语BERT预训练模型

数据预处理德语模型深度学习BERT自然语言处理HuggingfaceGithub开源项目模型

巴伐利亚州立图书馆MDZ团队开发的德语BERT模型，基于维基百科、EU图书和开放字幕等数据集训练，数据规模达16GB、23亿tokens。模型提供大小写敏感和不敏感两个版本，原生支持Transformers库，预训练序列长度512。经实测在命名实体识别、词性标注等任务中表现优异，可广泛应用于德语NLP领域。

gbert-base - 基于维基百科训练的高性能德语BERT预训练模型

德语模型自然语言处理开源项目模型Github机器学习HuggingfaceHaystackBERT

gbert-base是一款德语BERT预训练模型，由原始German BERT与dbmdz BERT团队于2020年10月联合发布。模型使用维基百科、OPUS和OpenLegalData数据集进行训练，在GermEval18和GermEval14基准测试中取得了显著优于前代模型的性能表现。作为开源项目，该模型采用MIT许可证，可用于多种德语自然语言处理应用场景。

Llama-3-SauerkrautLM-8b-Instruct - 基于Llama 3的德英双语语言模型

Fine-Tuning自然语言处理人工智能助手HuggingfaceGithub开源项目模型Llama-3德语模型

Llama-3-SauerkrautLM-8b-Instruct是一个基于Llama 3的德英双语语言模型。通过两阶段DPO微调技术,模型分别在70k和20k规模的数据集上完成训练,增强了德语处理能力。在Open LLM Leaderboard和MT-Bench等基准测试中取得了良好成绩。该模型支持多种量化格式,便于开发者将其集成到实际应用中。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号