Project Icon

opus-mt-gmq-en

北日耳曼语到英语的翻译模型

这是一个基于transformer模型的项目,专注于将北日耳曼语言翻译为英语。使用了SentencePiece进行预处理,支持多种语言,比如丹麦语、挪威语和瑞典语。在Tatoeba测试集上,获得了58.1的BLEU评分。用户可以通过提供的链接下载原始模型权重和测试集,适合对多语言翻译有研究兴趣的开发者和研究人员。

opus-mt-en-bg - 英语到保加利亚语的开源神经机器翻译模型
GithubHuggingfaceOPUSTatoeba保加利亚语开源项目机器翻译模型英语
opus-mt-en-bg是一个基于Transformer架构的英语到保加利亚语机器翻译模型。该模型在Tatoeba测试集上达到50.6的BLEU分数和0.680的chrF值。它使用SentencePiece进行预处理,支持保加利亚语的拉丁字母变体,需要添加目标语言标记。这个模型是Helsinki-NLP开发的Tatoeba-Challenge项目的一部分,为英语到保加利亚语的翻译提供了开源解决方案。模型采用了normalization和SentencePiece (spm32k,spm32k)预处理方法,需要在句子开头添加'>>id<<'形式的目标语言标记。用户可以下载原始权重、测试集翻译和评分结果。该项目遵循Apache-2.0许可协议,为研究人员和开发者提供了可靠的英语到保加利亚语机器翻译资源。
opus-mt-ca-it - 加泰罗尼亚语和意大利语的开源翻译模型
BLEUGithubHuggingfaceTatoeba-Challenge句子片段开源项目模型翻译
该项目提供了加泰罗尼亚语到意大利语的翻译模型,利用transformer-align模型执行自然语言处理。在Tatoeba测试集上,模型的BLEU得分为48.6,chr-F得分为0.690,表现出良好的翻译效果。这个项目中使用SentencePiece进行预处理和文本规范化,确保翻译的准确性和一致性。该系统支持单一源语言和目标语言,适合需要精准翻译的用户。提供模型的权重和测试集供下载,以供进一步探索和应用。
opus-mt-en-gl - 英语到加利西亚语机器翻译模型 基于OPUS数据集
BLEU评分GithubHuggingfaceopus-mt-en-gl开源项目数据集机器翻译模型语言模型
opus-mt-en-gl是一个开源的英语到加利西亚语机器翻译模型。该模型采用transformer-align架构,基于OPUS数据集训练,使用normalization和SentencePiece进行预处理。在Tatoeba测试集上,模型达到36.4的BLEU得分和0.572的chr-F值,表现出较好的翻译质量。这个模型为英语到加利西亚语的翻译任务提供了一个有效的工具。
opus-mt-tc-big-fr-en - 法语到英语神经机器翻译模型概述
BLEUGithubHuggingfaceSentencePieceopus-mt-tc-big-fr-en开源项目模型法语到英语神经机器翻译
OPUS-MT项目中的法英翻译模型,基于Marian NMT框架训练,通过Huggingface的transformers库转换为pyTorch模型,具有优秀的BLEU评分。模型支持多种数据集,使用SentencePiece进行分词,适用于多种翻译任务,适合学术研究及实际应用。
OpenNMT-py - 开源的神经机器翻译与大型语言模型框架
EoleGithubLLM支持Neural Machine TranslationOpenNMT-pyPyTorch开源项目
OpenNMT-py是基于PyTorch的开源神经机器翻译和语言模型框架,适用于研究和生产。支持大语言模型转换、量化以及多GPU并行。提供教程、文档和社区支持,适合翻译、总结等多种NLP任务。最新版本引入了多查询注意力机制和线性去偏等新功能。
TransnormerLLM - 使用线性注意力机制的大规模语言模型
GithubTransNormerLLM大语言模型开源项目模型权重线性注意力机制高质量语料库
TransNormerLLM是一种高效的大规模语言模型,使用线性注意力机制,优于传统的软注意力模型。该模型训练于高质量语料库,包含1.4万亿个词元,支持中文、英语和多语言基准测试,在多领域表现出色。提供385M、1B和7B参数版本,开放给学术研究,商用需申请许可。
bergamot-translator - 高性能开源机器翻译库支持原生和WebAssembly
APIBergamot TranslatorEmscriptenGithubWASM开源项目机器翻译
bergamot-translator是基于Marian NMT框架的机器翻译API,旨在提升浏览器端翻译性能。项目支持原生和WebAssembly编译,提供详细的构建指南。开发者可通过其API实现高效的机器翻译功能,适用于多种应用场景。原生版本可集成到各类项目中,WebAssembly版本则适用于浏览器环境,为开发者提供了灵活的机器翻译实现选择。
Thorsten-Voice - 开源德语TTS项目提供高质量免费离线语音数据集和模型
GithubThorsten-Voice开源开源项目德语TTS语音技术语音数据集
Thorsten-Voice项目由Thorsten Müller与Dominik Kreutz联合开发,提供多种开源德语文本到语音(TTS)数据集。这些数据集从中性到情感表达具备多样性,配合AI技术开发出多种TTS模型,适用于教育、研究和开源软件。该项目积极支持开源语音技术的进步,并在Thorsten-Voice YouTube频道提供相关教程,推广这些技术的应用。
joeynmt - 简洁而清晰的NMT模型实现,促进教育和学习
GRUGithubJoey NMTPyTorchTransformer开源项目机器翻译
Joey NMT框架专为教育而设计,提供简明和清晰的代码库,帮助初学者理解RNN和Transformer等经典NMT架构。其主要特点包括模块化设计,便于修改组件及训练流程,保持代码可读性。支持多个注意力机制、不同的分词类型和多语种翻译,包含详细的文档和教程,适用于模型训练、测试和翻译的各个阶段。最新版本引入分布式数据并行和多项优化,兼容最新的Python和PyTorch版本。
OLMo - 开源语言模型加速科学研究
GithubOLMo人工智能开源语言模型开源项目机器学习自然语言处理
OLMo是一个开源语言模型项目,提供多种规模的先进模型,如1B、7B和7B Twin 2T,全部基于Dolma数据集训练。该项目支持模型训练、微调和推理,提供详细配置和检查点以确保研究可重现。OLMo还包含数据检查和评估工具,为语言模型研究提供全面支持,旨在加速这一领域的科学进展。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号