Project Icon

german-gpt2

开源的德语预训练语言模型

German-GPT2是DBMDZ开发的德语预训练语言模型,基于GPT-2架构构建。模型通过大规模德语语料库训练,采用5万词汇量的字节级BPE编码。项目开源发布,提供便捷的API接口,支持文本生成等自然语言处理任务。作为基础模型,German-GPT2主要用于进一步针对特定任务的微调训练。

optimized-gpt2-500m - GPT-2语言模型的优化版本 用于多种自然语言处理任务
GithubHuggingfacetransformers人工智能开源项目机器学习模型模型卡片自然语言处理
optimized-gpt2-500m是一个经过优化的GPT-2语言模型,参数量为5亿。该模型在保持GPT-2语言理解和生成能力的同时,提高了推理速度和资源利用效率。它可用于文本生成、对话系统、问答等多种自然语言处理任务,为开发者和研究人员提供了一个高效的预训练语言模型选择。
gbert-large-paraphrase-cosine - GBERT-Large模型优化德语少样本文本分类
BERTGithubHuggingfaceSetFit句子相似度开源项目德语模型模型自然语言处理
gbert-large-paraphrase-cosine是一个基于deepset/gbert-large的德语句子转换模型,能将文本映射至1024维向量空间。该模型与SetFit配合使用,显著提升德语少样本文本分类效果。模型采用MultipleNegativesRankingLoss和余弦相似度作为损失函数,在精选的deutsche-telekom/ger-backtrans-paraphrase数据集上训练。评估显示,其在德语少样本场景中的表现优于多语言模型和Electra模型,为德语自然语言处理任务提供了有力工具。
leo-hessianai-7b - LeoLM推动德语语言模型发展的新选择
GithubHuggingfaceLAIONLeoLMLlama-2开源开源项目德语语言模型模型
LeoLM是首个基于Llama-2构建的商用德语基础语言模型,经过大规模德语语料库的持续预训练。其旨在推动德语开源及商用LLM的研究,提升语言理解和文本生成能力,支持8k上下文长度。该项目依托于HessianAI的新超算系统42,并施行Llama-2社区许可证。用户可在Hugging Face平台获取leo-hessianai-7b及leo-hessianai-13b模型,并借助Transformers库实现快速推理。此项目旨在为德语开源及商业应用带来新发展。
German_Semantic_STS_V2 - 德语语义相似度计算模型 实现文本搜索与聚类
BERTGithubHuggingfacesentence-transformers开源项目德语模型模型自然语言处理语义相似度
这是一个专注于德语文本处理的语义模型,能够准确计算文本间的语义相似度。模型在德语基准测试中表现出色,相似度评分达到0.86,优于现有主流方案。主要应用于智能文本搜索、文档聚类等场景,并提供简单的集成方式。
gpt2_chinese - 使用15G中文语料和31亿tokens完成GPT2训练教程
GithubHuggingfacegpt2transformerszero_nlp中文开源项目模型训练
该项目使用15G中文语料和31亿个tokens,在单张3090显卡上运行60多小时,成功训练出中文版本的GPT2模型。项目提供教程指导如何使用transformers库实现中文文本生成。
leo-hessianai-7b-chat - 德语对话模型,适用于多种自然语言处理任务
GithubHuggingfaceLeoLM开源项目德语语言模型文本生成模型自由软件超算
本项目提供基于LeoLM/leo-hessianai-7b的德语对话模型,经过德语指令数据集的微调,适用于写作、解释及讨论,数学和高级推理仍具挑战。支持英语和德语,并拥有8k上下文长度,为德国开源和商业语言模型的研究发展助力。
gpt2-xl - OpenAI开发的15亿参数GPT-2 XL语言模型
GPT-2GithubHuggingfaceOpenAI开源项目模型深度学习自然语言处理预训练模型
GPT-2 XL是OpenAI开发的大规模transformer语言模型,拥有15亿参数。该模型在大规模英语语料库上预训练,可用于文本生成、写作辅助和创意写作等多种任务。尽管具有强大的语言理解能力,但GPT-2 XL也存在潜在偏见和误用风险。研究人员可利用它探索大型语言模型的行为、能力和局限性。
gpt2client - OpenAI GPT-2模型封装工具,简化文本生成操作
GPT-2GithubPython安装指南开源项目文本生成自然语言处理
gpt2-client是一款易于使用的GPT-2模型封装工具,支持从124M到1.5B的多种模型。通过简单的API调用,可以方便地下载、加载并使用GPT-2模型进行文本生成和微调。兼容Python 3.5以上和TensorFlow 1.X,适合自然语言处理研究和应用开发,提供高效的文本生成解决方案。
gpt2-small-spanish - 基于GPT-2的西班牙语自然语言处理模型
GPT-2GithubHuggingface开源项目模型神经网络训练自然语言处理西班牙语模型迁移学习
GPT2-small-spanish是一个基于GPT-2 small架构的西班牙语语言模型,通过在西班牙语维基百科数据集上进行迁移学习和微调而成。该模型耗时70小时训练完成,支持文本生成等自然语言处理任务。模型由Datificate团队基于Pierre Guillou的GPorTuguese-2项目开发,在庆熙大学IAI实验室完成训练。作为开源项目,该模型为西班牙语NLP应用提供了重要的基础支持。
deepset-mxbai-embed-de-large-v1 - 高性能德语句子嵌入模型
GithubHuggingfacesentence-transformers变换器模型嵌入模型开源项目模型特征提取自然语言处理
deepset-mxbai-embed-de-large-v1是一个专为德语开发的句子嵌入模型。该模型基于Sentence Transformers技术,可将德语文本转换为向量表示。在语义相似度和文本分类等任务中表现优异,为德语自然语言处理应用奠定基础。支持高效特征提取,适用于多种下游任务。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号