rebel-large

基于BART的端到端关系抽取模型

序列到序列模型 Github 关系抽取开源项目信息提取自然语言处理 Huggingface REBEL 模型

REBEL是一个创新的关系抽取模型，基于BART架构，将关系抽取转化为序列生成任务。该模型支持200多种关系类型识别，采用端到端设计避免了多步骤处理的错误累积。在多个基准测试中表现优异，其多语言版本mREBEL进一步扩展了语言和实体类型支持范围。

文档

deberta-v3-large-squad2 - DeBERTa V3大规模模型设计，问答任务表现卓越

GithubHaystackHuggingfaceSQuAD 2.0deberta-v3-large开源项目提取式问答模型问答

该DeBERTa模型基于SQuAD2.0数据集进行了微调，专注于提取式问答任务。通过Haystack和Transformers框架的整合，模型在检索和匹配性能上表现优异，经多种数据集验证显示出高准确性。

bros-base-uncased - 整合文本布局的文档信息提取预训练语言模型

BROSGithubHuggingface光学字符识别开源项目文本布局分析文档信息提取模型预训练语言模型

BROS是一种创新的预训练语言模型，结合了文本内容和空间布局信息，以提升文档关键信息提取的效果。该模型能够处理OCR识别后的文本和边界框数据，适用于多种文档分析任务，例如从收据中提取商品清单。BROS提供base和large两种规模的模型，参数量分别约为110M和340M。这一开源项目已在Hugging Face平台上发布，为研究人员和开发者提供了强大的文档信息提取工具。

xlm-roberta-large-squad2 - XLM-RoBERTa大型模型在多语言环境中的高效问答表现

GithubHaystackHuggingfacexlm-roberta-large多语种开源项目机器学习模型问答

XLM-RoBERTa大型模型经过SQuAD 2.0训练，支持多语言提取式问答。结合Haystack和Transformers框架，适用于大规模文档问答。模型评估显示其精准度和F1分数较高，尤其在无答案场景中表现突出，且支持FARM和Transformers间灵活切换。

bigbird-roberta-base - 高性能长序列文本处理的稀疏注意力Transformer模型

BigBirdGithubHuggingfacetransformer模型开源项目模型深度学习自然语言处理长序列处理

BigBird-RoBERTa-base是一种基于块稀疏注意力机制的Transformer模型，可处理长达4096个token的序列。该模型在Books、CC-News、Stories和Wikipedia等大规模数据集上预训练，大幅降低了计算成本。在长文档摘要和长上下文问答等任务中，BigBird-RoBERTa-base展现出优秀性能。模型支持灵活配置注意力类型，可在默认的块稀疏模式和全注意力模式间切换，为超长序列文本处理提供了高效方案。

mDeBERTa-v3-base-xnli-multilingual-nli-2mil7 - mDeBERTa-v3模型实现多语言自然语言推理和零样本分类

GithubHuggingfacemDeBERTa-v3多语言开源项目机器学习模型自然语言推理零样本分类

mDeBERTa-v3-base-xnli-multilingual-nli-2mil7是一个支持100种语言的自然语言推理和零样本分类模型。它基于mDeBERTa-v3-base架构,通过XNLI和multilingual-NLI-26lang-2mil7数据集微调,包含27种语言的270多万个文本对。该模型在XNLI和英语NLI测试中表现优异,展现出卓越的跨语言迁移能力,为多语言NLP任务提供了强大解决方案。

rag-token-base - 基于检索增强生成的知识型自然语言处理模型

GithubHuggingfaceRAG开源项目检索增强生成模型生成器知识密集型NLP任务问题编码器

RAG-Token-Base是一个开源的自然语言处理模型，集成了问题编码器、检索器和生成器三个核心组件。模型采用DPR编码器和BART生成器架构，通过结合外部知识实现高质量的文本生成。其灵活的检索器配置功能使其适用于各类知识密集型的语言处理任务。

repeat - 开源自然语言处理库

GithubHuggingfacetransformers人工智能开源项目机器学习模型深度学习自然语言处理

Transformers是一个开源的自然语言处理库，提供了多种预训练模型和工具。该库支持文本分类、命名实体识别和机器翻译等任务，具有良好的文档支持和定期更新特性。研究人员和开发者可以使用Transformers构建和部署NLP应用。

mxbai-rerank-base-v1 - 跨语言重排序模型提升搜索结果相关性

GithubHuggingfacetransformers人工智能开源项目机器学习模型深度学习自然语言处理

mxbai-rerank-base-v1是一个基于transformers库开发的跨语言重排序模型。该模型支持多语言处理，可在transformers.js中使用，有助于提升搜索结果的相关性。模型采用Apache-2.0开源协议发布，适用于搜索引擎、推荐系统和问答系统等场景，能够优化排序结果。

mbart-large-50 - 面向多语言翻译的序列到序列神经网络模型

GithubHuggingfacemBART-50多语言翻译序列到序列模型开源项目机器翻译模型预训练模型

mBART-50模型支持50种语言间的互译，基于序列到序列架构开发。该模型通过降噪预训练方法提升性能，包含句子重排和文本掩码等创新技术。作为mBART的扩展版本，覆盖英语、中文、日语在内的主要语言，可用于各类多语言自然语言处理任务。

twitter-roberta-large-2022-154m - 训练于154M推文的RoBERTa-large模型（2022年数据）及其应用

GithubHuggingfaceRoBERTa-large开源项目推特掩码语言模型模型特征提取自然语言处理

本项目提供了一种经过2022年12月底前154M条推文训练的RoBERTa-large模型，主要用于推文数据的理解和解析。它通过Twitter Academic API获取并过滤推文，实现了高级文本预处理、掩码语言模型和特征提取的应用示例。用户可借助标准Transformers接口进行推文分析及嵌入提取，同时适用于对比在不同时间段训练的模型的预测结果和困惑度得分，为研究人员提供更深入分析推特时间序列数据的工具。

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com