#分类

Marvin是一个轻量级AI工具包，提供可靠、可扩展的自然语言接口解决方案。它涵盖文本、图像和音频的生成、分类、实体抽取等多种功能，支持独立或组合使用，适用于各种开发场景。Marvin无需复杂的代码，即可将AI功能集成到现有软件项目中，实现快速部署。该项目开源且免费使用，由Prefect团队开发和维护。

Awesome-GPTs-Big-List - 综合从娱乐到生产多种GPT工具

GPT免费帮助分类推荐Github开源项目

本资源包含多种免费的GPT工具，涵盖娱乐、金融、艺术设计、健康健身等多个分类，方便用户查找。具体应用包括个人资料优化、社交媒体内容创作、法律咨询和旅行规划等，适用多种需求。此类工具不仅提升生产力，还为日常生活增添便利和乐趣。

tribuo - 提供分类、回归、聚类、异常检测和多标签分类的Java机器学习库

TribuoJava机器学习分类回归Github开源项目

Tribuo是一个用于分类、回归、聚类、异常检测和多标签分类的Java机器学习库。它提供加载、特征处理和数据转换的完整解决方案，并包括评估所有预测类型的类。Tribuo支持通过配置文件重复构建模型，并允许模型序列化以便跨平台部署。该库还集成了TensorFlow、ONNX和XGBoost等流行机器学习工具，并兼容多种Java平台版本。该项目由Oracle Labs领导，欢迎社区贡献。

LightAutoML - 自动化创建二分类、多分类和回归模型解决方案

LightAutoML自动机器学习模型创建机器学习分类Github开源项目

LightAutoML是一款自动化机器学习框架，专注于二分类、多分类和回归任务的模型创建。框架支持独立样本数据集处理，并运用AutoWoE库生成可解释模型。目前正在开发多表数据集和序列处理功能，还提供了GPU和Spark管道以提升计算效率。LightAutoML配有详细的文档和丰富的示例教程，适合多种机器学习需求，简化自动化模型开发。

time-series-transformers-review - 时序数据建模中的Transformers技术综述

Transformers时间序列预测异常检测分类Github开源项目

本项目专业整理了Transformers在时序数据建模中的资源，涵盖论文、代码和数据，全面总结其最新进展。内容持续更新，开放问题提交和拉取请求，覆盖时序预测、不规则时序建模、异常检测和分类等领域，适合学术研究及实际应用。

Satellite-Imagery-Datasets-Containing-Ships - 完整版雷达和光学卫星图像船舶检测分类数据集

雷达卫星数据集光学卫星数据集船舶检测分类语义分割Github开源项目

本页面列举了多个用于船舶检测、分类、语义分割和实例分割任务的雷达和光学卫星图像数据集，包括SSDD、OpenSARship、HRSID等。这些数据集涵盖了RadarSat-2、TerraSAR-X和Sentinel-1等卫星，提供了丰富的图像和详细的标注信息，非常适合多个船舶检测和分析任务。

awesome-semi-supervised-learning - 半监督学习资源汇总，减少标注成本，提升分类效果

Semi-Supervised Learning深度学习分类生成模型半监督学习方法Github开源项目

全面整理的半监督学习资源列表，包括最新研究、代码库和各种应用。半监督学习通过结合大量无标签数据和少量有标签数据，减少标注成本并提升模型准确度。资源涵盖计算机视觉、自然语言处理、生成模型、图基方法等多个领域，适用于深度学习框架。提供详细的文献综述、代码实现以及相关书籍和讲座链接，帮助用户了解和应用半监督学习技术。

GPTs - 开源项目收录泄露的GPTs提示词集合

GPTs提示词GitHub关键词分类Github开源项目

这是一个GitHub开源项目，专门收集泄露的GPTs提示词。项目汇总了来自社交媒体、GitHub用户贡献以及作者破解的GPTs提示词。收录内容涵盖多个主题和应用场景，为人工智能对话系统的研究和开发提供了丰富的参考资源。

GPTs Finder - 每小时更新的GPTs资源目录和发现平台

AI工具GPTs目录分类搜索更新

GPTs Finder是一个专注于收集和展示最新GPTs（生成式预训练变换器）的网站。该平台每小时更新目录，确保提供最新、最全面的GPTs资源。网站设有多个分类，包括研究、分析、教育、设计等领域，便于快速定位所需的GPTs。平台支持用户提交自己的GPTs，丰富内容库。GPTs Finder不仅作为发现工具，还为GPTs爱好者和开发者提供灵感源泉。

Emoji You - 全面的emoji工具和资源中心

AI工具表情符号Emoji复制粘贴搜索工具分类

Emoji You提供多样化的emoji工具和资源。主要功能有emoji搜索、快速复制、随机生成和移除功能。包含表情、动物、食物等多种emoji类别，方便用户查找。网站还展示热门emoji排行和主题集合，帮助增强数字交流的表达力。

walls - 多样化风格壁纸库满足个性化需求

壁纸图片展示分类视觉设计READMEGithub开源项目

该项目提供多样化风格的壁纸库,包括抽象、动漫、极简和自然等分类。每个类别展示精选壁纸,便于浏览和下载。从数字艺术到自然景观,项目提供丰富的壁纸选择,可为各种设备带来全新的视觉体验。

100DaysofMLCode - 100天掌握机器学习编程实践从数据预处理到深度学习

机器学习数据预处理回归分类聚类Github开源项目

100DaysofMLCode是一个为期100天的机器学习编程挑战项目，涵盖数据预处理、回归、分类、聚类、强化学习、自然语言处理和深度学习等主题。项目提供代码示例和日志记录，适合不同水平的开发者学习和实践机器学习技术。作为开源项目，它欢迎社区贡献。

lists - GitHub上实用有趣的资源列表汇总

GitHub列表资源开源分类Github开源项目

Lists项目汇集了GitHub上各种实用和有趣的资源列表，涵盖技术和非技术领域。内容包括从生活方式到编程的多个方面，为用户提供丰富的信息源。该项目鼓励社区贡献，不断更新扩展。无论是学习、娱乐还是专业发展，Lists都能为用户提供有价值的参考。

Dmeta-embedding-zh - 提供多任务处理的句子相似度与特征提取模型

Huggingface分类特征提取开源项目模型Github句子相似度Dmeta-embedding重排序

此开源项目专注于实现多语言特征提取与文本分类的多任务模型，适用于多种MTEB数据集场景。模型实现句子相似度的有效评估，并在分类、聚类、再排序和检索任务中展现出良好的性能。采用多种数学计算方法，如余弦相似度、曼哈顿距离、欧氏距离等，确保结果的精确性与适应性。项目支持中英文文本处理，适用于学术研究及商业应用中的多种场景。

multilingual-e5-large-pooled - 多语言支持的句子相似性与特征提取模型

特征提取开源项目模型GithubMTEBHuggingface分类multilingual-e5-large句子相似度

此项目基于多语言处理，融合Sentence Transformers技术，专注于句子相似性与特征提取。支持多语言，适用于分类、重排序、文本聚类等多种场景。模型在各种任务中表现优异，如MTEB AmazonCounterfactualClassification和MTEB BUCC中的分类与双语文本挖掘，表现出色。采用MIT许可证，具有高度使用灵活性。

bge-base-en-v1.5 - 增强文本处理能力的多任务学习模型

sentence-transformers特征提取句子相似性分类句子聚类Github开源项目Huggingface模型

bge-base-en-v1.5模型通过多任务学习优化自然语言处理技术，覆盖分类、检索、聚类和重排任务。在多个MTEB数据集上表现优异，例如在亚马逊情感分类任务中达到93.39%的准确率，在AskUbuntu重排任务中MRR达到74.28%。该模型具有MIT开源许可，适用于多种英语任务，为研究人员和开发者提供有效支持。

gte-large-en-v1.5 - 英语语义相似度模型用于文本分类和检索

Huggingface情感分析模型gte-large-en-v1.5Github聚类检索开源项目分类

gte-large-en-v1.5是一个英语语义相似度模型,在MTEB基准测试中表现优异。该模型在文本分类、检索和聚类等任务上成绩突出,尤其适用于亚马逊评论分类和问答检索等场景。基于Sentence-Transformers框架开发,gte-large-en-v1.5可应用于多种自然语言处理任务,为文本表示提供了有力支持。

UAE-Large-V1 - 高性能多语言语义嵌入模型

特征提取sentence embeddingHuggingface模型GithubMTEB开源项目检索分类

UAE-Large-V1是一款多语言语义嵌入模型，在文本分类、检索、聚类和语义相似度等多个自然语言处理任务中展现出优秀性能。该模型支持多语言处理，可应用于问答系统、文档检索和情感分析等多种场景。UAE-Large-V1为NLP应用开发提供了一个多功能工具，有助于提高各类自然语言处理任务的效果。

bge-small-en - 英文文本嵌入模型在多种自然语言处理任务中展现出色性能

Huggingface模型GithubMTEB聚类检索开源项目句子变换器分类

bge-small-en是一个针对英文文本优化的嵌入模型，在MTEB基准测试中展现出优异性能。该模型在分类、检索、聚类等多种自然语言处理任务中表现出色，尤其在处理Amazon评论和ArguAna论证分析等数据集时效果显著。bge-small-en为需要高质量文本表示的应用场景提供了有力支持。

mxbai-embed-large-v1 - 多语言NLP嵌入模型在MTEB基准测试中展现卓越性能

模型检索开源项目Huggingface聚类分类transformersGithubMTEB

mxbai-embed-large-v1是一个多语言嵌入模型，在MTEB基准测试中表现优异。该模型在文本分类、检索、聚类和语义相似度等NLP任务中取得了良好成绩。基于transformer技术，mxbai-embed-large-v1生成高质量文本表示，可应用于信息检索、问答系统和文本分析等领域。

multilingual-e5-small - 多语言句子嵌入模型支持100多种语言

检索模型多语言聚类Github句子转换器分类Huggingface开源项目

multilingual-e5-small是一个支持100多种语言的句子嵌入模型。该模型在MTEB基准测试的分类、检索、聚类等任务中表现良好，适用于跨语言文本匹配和相似度计算。作为轻量级模型，它可在信息检索、文本分类和机器翻译等领域发挥作用，同时保持较低的计算资源需求。

multilingual-e5-large-instruct - 支持100+语言的多语言大规模指令型自然语言处理模型

模型评估Huggingface模型Github多语言MTEB开源项目检索分类

multilingual-e5-large-instruct是一个多语言大规模指令型语言模型，支持100多种语言的文本处理。该模型在MTEB基准测试的分类、检索、聚类等任务中表现优秀，展现了优异的跨语言能力。它可应用于多语言文本嵌入、语义搜索、文本分类等场景，为自然语言处理提供了实用的多语言解决方案。

NV-Embed-v1 - 多任务自然语言处理领域的高性能嵌入式模型

检索模型聚类Githubsentence-transformers分类MTEBHuggingface开源项目

NV-Embed-v1是一款在多项自然语言处理任务中表现出色的嵌入式模型。模型在分类、检索、聚类、重排序和语义相似度等任务中均取得优异成绩，尤其在情感分析和问答系统方面表现突出。NV-Embed-v1支持多语言处理，适用范围广泛，是自然语言处理领域的实用工具。

51-languages-classifier - 多语言文本分类模型可精准识别51种语言

模型MASSIVE多语言Github语言识别XLM-Roberta分类Huggingface开源项目

该项目开发了一个基于XLM-Roberta的51语言分类器，能够精确区分51种不同语言的文本。模型使用MASSIVE数据集进行训练，该数据集包含超过100万条多语言话语样本。在评估中，模型在大多数语言上的F1分数均超过0.98，展现出优异的性能。研究人员和开发者可通过Hugging Face Transformers库轻松集成和使用这一多语言分类模型。

snowflake-arctic-embed-m - 多语言句子嵌入模型助力相似度计算和语义搜索

模型检索开源项目Huggingface聚类分类相似度计算sentence-transformersGithub

snowflake-arctic-embed-m是一个开源的句子嵌入模型，主要用于多语言环境下的相似度计算和语义搜索。在MTEB基准测试中，该模型在分类、聚类和检索等任务上展现了不错的性能。它能够处理多种语言，有效提取句子的语义信息，为各类自然语言处理应用提供嵌入表示。模型适用于文本分类、信息检索和语义相似度计算等场景。

gte-base-en-v1.5 - 英文文本嵌入模型在自然语言处理任务中的应用

模型检索开源项目Huggingface分类transformerssentence-transformersGithubMTEB

gte-base-en-v1.5是一个英文文本嵌入模型,在MTEB基准测试中展现出优秀性能。该模型在句子相似度、文本分类和信息检索等自然语言处理任务中表现突出,能有效捕捉文本语义并为下游应用提供高质量的文本表示。测试结果显示,gte-base-en-v1.5在多个评估指标上取得了良好成绩,体现了其在不同应用场景中的实用价值。

snowflake-arctic-embed-xs - 轻量级多语言句子嵌入模型，专注文本相似度分析

模型检索开源项目Huggingface聚类语义相似度分类sentence-transformersGithub

snowflake-arctic-embed-xs是一款轻量级句子嵌入模型，针对多语言相似度任务优化。该模型在MTEB基准测试中展现出优异性能，尤其在文本分类、信息检索和聚类分析方面表现突出。尽管体积小巧，它仍在多个数据集上保持较高的准确率和F1分数，适合需要高效文本表示的各类应用场景。

NV-Embed-v2 - 多语言嵌入模型提升各类自然语言处理任务性能

检索模型聚类语义文本相似度Github分类MTEBHuggingface开源项目

NV-Embed-v2是一款多语言嵌入模型，针对多种自然语言处理任务进行了优化。该模型在文本分类、检索、聚类和语义相似度等基准测试中展现出优异表现，体现了其在跨语言和跨领域应用中的实力。通过深度学习技术，NV-Embed-v2能够生成高质量的文本表示，为各类NLP应用奠定了良好基础。

SFR-Embedding-2_R - 增强自然语言处理性能的多任务算法模型

检索评估开源项目Salesforce/SFR-Embedding-2_R模型分类HuggingfaceGithub

SFR-Embedding-2_R项目结合分类、检索、聚类及重排序任务，提供高级自然语言处理解决方案。在MTEB多个数据集上进行测试，展示了在情感分类、亚马逊评论分类等任务中的高性能表现，适用于需要高效灵活性的应用场景，尤其在复杂数据集中的表现更加出色。

cde-small-v1 - 增强文本分类与信息检索能力的多任务模型

MTEB分类聚类检索Huggingface句子嵌入Github开源项目模型

该项目在多任务环境下表现优异，尤其在文本分类与检索任务中。模型在多个数据集上表现出高准确率与精度，广泛适用于商业、教育与研究领域。其卓越的性能满足了对高精确度的需求，提供了一致而可靠的结果。

bge-en-icl - 先进的多语言自然语言处理模型

分类检索Huggingfacesentence-transformersGithub开源项目模型特征提取句子相似度

bge-en-icl是一个开源的句子嵌入模型，在MTEB基准测试的多项自然语言处理任务中表现出色。该模型支持多语言处理，适用于句子相似度计算、文本分类和信息检索等应用场景。在AmazonPolarity分类任务中，bge-en-icl达到了96.98%的准确率；在FEVER检索任务中，准确率达到92.83%。此外，该模型在其他任务如ArguAna检索和Banking77分类中也取得了优异成绩。bge-en-icl为研究人员和开发者提供了一个强大的工具，用于处理和分析各种文本数据。

roberta-fake-news-classification - 基于RoBERTa的新闻真假识别模型

roberta-baseGithub开源项目虚假新闻分类KaggleHuggingface模型

此模型使用roberta-base进行微调，旨在识别虚假新闻，在特定数据集上达到100%的准确率。模型可供下载，并易于在代码中集成，通过输入新闻标题和内容来验证新闻的真实性。此外，Gradio接口提供了实时测试功能。

e5-large - 句子嵌入模型应用于文本分类与检索，提升准确率

MTEB分类Sentence Transformers检索HuggingfaceGithub开源项目模型sentence-similarity

项目利用Sentence Transformers技术，提升自然语言处理任务中的句子嵌入效率，涵盖分类、检索、聚类及重排序等。该模型在多数据集上优异，尤其是在Amazon极性分类的准确率达90.05%。通过优化句子相似性，增强了在BIOSSES等任务中的相关性得分，是语义搜索和信息检索的理想之选，支持多语言文本分析。

snowflake-arctic-embed-m-long - 探索句子相似性与特征提取的新前沿

Huggingface特征提取开源项目模型Githubsentence-transformers数据集句子相似性分类

Snowflake-arctic-m-long模型基于transformers.js框架，提升了句子相似性和特征提取能力。支持的任务包括分类、检索与聚类，尤其在MTEB数据集上的表现优异。在Amazon分类任务中，其准确率超过78%，在ArguAna和CQADupstack检索任务中，检索性能高达50%以上。通过优化多项评测指标，如准确率、F1得分和检索率，这一模型为文本处理与分析提供了坚实的支持。

Linq-Embed-Mistral - 多任务文本分析工具

重排聚类Huggingface开源项目模型Github分类Linq-Embed-Mistral检索

Linq-Embed-Mistral模型在多任务文本处理表现优秀，如情感分析、分类及信息检索。在MTEB AmazonPolarityClassification中准确率达95.7%，在MTEB FEVER的MAP@1为82.52%，适用于大规模文本数据的分析，支持电商、银行、出版等领域。

sentence-transformers-multilingual-e5-small - 多语言句子相似性和分类模型，覆盖多种语言选择

Github开源项目multilingual-e5-smallAmazonReviews分类多语言Huggingface句子相似性模型

该项目提供多语言句子相似性和分类功能，适用范围广泛。采用MIT许可证，通过英语、德语、法语、西班牙语和中文等语言实现较高的精准度。通过Amazon反事实分类和情感极性任务表现出色，涵盖丰富的数据集和评估任务，如重排序和语义文本相似等，有效支持文本分类及自动化分析。

100天机器学习编码挑战：踏上人工智能之旅

2024年09月05日

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com