PatentSBERTa

基于SBERT的专利文本相似度与分类深度学习模型

Github 模型语义搜索开源项目 Huggingface PatentSBERTa 句子转换器专利分类自然语言处理

PatentSBERTa是一个基于sentence-transformers的深度学习模型，用于专利文本分析和分类。模型将专利文本映射为768维向量，实现专利文档的语义搜索和聚类分析。通过SBERT技术计算专利间相似度，支持sentence-transformers和HuggingFace Transformers两种框架调用。

Github

Huggingface

介绍相关项目

beto - 西班牙语BERT模型：BETO

BERTBETOGithub开源项目模型西班牙语语料库

此页面介绍了一个基于大型西班牙语语料库训练的BERT模型BETO，提供无区分大小写和区分大小写的Tensorflow和Pytorch版本。BETO应用全词掩蔽技术，在多项西班牙语基准测试中表现优异，并与多语言BERT及其他模型进行了对比。用户可以在HuggingFace Model Repository下载BETO模型，并通过HuggingFace Transformers库轻松使用。此外，页面还包含示例代码和引用信息。

ColBERT - 基于BERT的快速大规模文本检索模型

BERTColBERTGithub信息检索向量相似度开源项目自然语言处理

ColBERT是一种基于BERT的检索模型，能在数十毫秒内实现大规模文本集合的高效搜索。该模型采用细粒度的上下文后期交互技术，将段落编码为令牌级嵌入矩阵，在保持检索质量的同时提高效率。ColBERT具备索引、检索和训练功能，适用于多种信息检索任务。模型提供预训练checkpoint和Python API，方便研究人员和开发者在实际项目中快速应用。

Keras-TextClassification - 多样预训练模型支持的高效文本分类工具

GithubKeras-TextClassification嵌入式模型开源项目文本分类深度学习神经网络

为中文用户提供高效的文本分类解决方案，支持FastText、BERT、Albert等多种预训练模型，涵盖词、字、句子嵌入。详细介绍数据处理与模型训练流程，通过下载与调用数据，实现多标签分类和文本相似度计算，简化复杂的自然语言处理任务。

KeyBERT - BERT驱动的智能关键词提取工具

BERT嵌入GithubKeyBERT关键词提取开源项目机器学习自然语言处理

KeyBERT是一款利用BERT嵌入技术的关键词提取工具。它通过计算文档和短语的嵌入表示之间的余弦相似度，识别出最能代表文档内容的关键词和短语。该工具支持Sentence-Transformers、Flair和Spacy等多种嵌入模型，适用于广泛的文本分析场景。KeyBERT还集成了Max Sum Distance和Maximal Marginal Relevance等算法，以提升结果多样性。此外，它还能与大型语言模型协同工作，为用户提供灵活高效的关键词提取方案。

BERTweet - 专为英语推文预训练的大规模语言模型，助力自然语言处理

BERTweetCOVID-19GithubRoBERTa开源项目英文推文语言模型

BERTweet是首个专为英语推文预训练的公共语言模型，基于RoBERTa预训练程序，使用850M条推文数据进行训练，包含普通推文和疫情相关推文。BERTweet提供多种预训练模型，能够无缝集成于transformers和fairseq框架，支持情感分析、命名实体识别等自然语言处理任务，为研究和应用提供有力支持。

spacy-transformers - 在 spaCy 中使用 BERT、XLNet 和 GPT-2 等预训练转换器

BERTGPT-2GithubXLNetspaCytransformers开源项目

spacy-transformers通过Hugging Face的transformers实现预训练模型如BERT、XLNet和GPT-2的集成，提升spaCy的功能。支持多任务学习、转换器输出自动对齐等，兼容Python 3.6以上版本，需要PyTorch v1.5+和spaCy v3.0+。

transformers - 机器学习库，覆盖文本、视觉与音频处理

GithubHugging Face人工智能多模态开源项目机器学习自然语言处理

探索🤗 Transformers——一个功能全面的机器学习库，覆盖文本、视觉与音频处理。该库提供数千种可对接JAX、PyTorch或TensorFlow的预训练模型，适用于多种语言处理与多模态任务。主要功能包括： - 文本分类 - 信息提取 - 问答系统 - 摘要生成 - 翻译 - 文本生成此外，还能处理表格问答、OCR及视觉问答等多模态任务。Transformers库易于使用，支持模型间的快速切换与无缝整合。

classifier-multi-label - 基于BERT的多标签文本分类算法实现

BERTGithubSeq2SeqTextCNNtf.nn.softmax_cross_entropy_with_logits多标签分类开源项目

本项目介绍了如何使用BERT结合TextCNN、Denses、Seq2Seq等多种算法实现多标签文本分类。涵盖了模型结构、损失函数和解码方法等细节，展示了不同方法在推理速度和分类效果上的表现，提供了实验数据和结论，帮助开发者选择最佳解决方案。

TransformerHub - 实现与参考多种Transformer模型

BERTGPTGithubTransformerTransformerHubViT开源项目

此项目实现了多种Transformer架构，包括seq2seq、仅编码器、仅解码器和统一模型，旨在提高编程技能并提供深度学习参考。特色包括多种Attention模块、位置嵌入和采样方法，当前进展是实现DINO模型。项目受到多个开源项目的启发和支持。

SwissArmyTransformer - 瑞士军刀式Transformer库，用于多样化模型的开发与优化

BERTDeepSpeedGLMGithubTransformersat开源项目

SwissArmyTransformer是一个灵活且强大的库，用于开发和优化各种Transformer变体模型，如BERT、GPT、T5等。该库通过轻量级混合组件支持多种用途，并结合DeepSpeed-ZeRO和模型并行技术，提供了大规模模型预训练和微调的最佳实践。只需几行代码即可实现前缀调优和缓存自动回归模型，适用于大规模分布式训练和高效推理。

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号