#分类

marvin - 多功能AI工具包,提供文本、图像与音频处理功能
MarvinAI工具包实体提取分类数据生成Github开源项目
Marvin是一个轻量级AI工具包,提供可靠、可扩展的自然语言接口解决方案。它涵盖文本、图像和音频的生成、分类、实体抽取等多种功能,支持独立或组合使用,适用于各种开发场景。Marvin无需复杂的代码,即可将AI功能集成到现有软件项目中,实现快速部署。该项目开源且免费使用,由Prefect团队开发和维护。
Awesome-GPTs-Big-List - 综合从娱乐到生产多种GPT工具
GPT免费帮助分类推荐Github开源项目
本资源包含多种免费的GPT工具,涵盖娱乐、金融、艺术设计、健康健身等多个分类,方便用户查找。具体应用包括个人资料优化、社交媒体内容创作、法律咨询和旅行规划等,适用多种需求。此类工具不仅提升生产力,还为日常生活增添便利和乐趣。
tribuo - 提供分类、回归、聚类、异常检测和多标签分类的Java机器学习库
TribuoJava机器学习分类回归Github开源项目
Tribuo是一个用于分类、回归、聚类、异常检测和多标签分类的Java机器学习库。它提供加载、特征处理和数据转换的完整解决方案,并包括评估所有预测类型的类。Tribuo支持通过配置文件重复构建模型,并允许模型序列化以便跨平台部署。该库还集成了TensorFlow、ONNX和XGBoost等流行机器学习工具,并兼容多种Java平台版本。该项目由Oracle Labs领导,欢迎社区贡献。
LightAutoML - 自动化创建二分类、多分类和回归模型解决方案
LightAutoML自动机器学习模型创建机器学习分类Github开源项目
LightAutoML是一款自动化机器学习框架,专注于二分类、多分类和回归任务的模型创建。框架支持独立样本数据集处理,并运用AutoWoE库生成可解释模型。目前正在开发多表数据集和序列处理功能,还提供了GPU和Spark管道以提升计算效率。LightAutoML配有详细的文档和丰富的示例教程,适合多种机器学习需求,简化自动化模型开发。
time-series-transformers-review - 时序数据建模中的Transformers技术综述
Transformers时间序列预测异常检测分类Github开源项目
本项目专业整理了Transformers在时序数据建模中的资源,涵盖论文、代码和数据,全面总结其最新进展。内容持续更新,开放问题提交和拉取请求,覆盖时序预测、不规则时序建模、异常检测和分类等领域,适合学术研究及实际应用。
Satellite-Imagery-Datasets-Containing-Ships - 完整版雷达和光学卫星图像船舶检测分类数据集
雷达卫星数据集光学卫星数据集船舶检测分类语义分割Github开源项目
本页面列举了多个用于船舶检测、分类、语义分割和实例分割任务的雷达和光学卫星图像数据集,包括SSDD、OpenSARship、HRSID等。这些数据集涵盖了RadarSat-2、TerraSAR-X和Sentinel-1等卫星,提供了丰富的图像和详细的标注信息,非常适合多个船舶检测和分析任务。
awesome-semi-supervised-learning - 半监督学习资源汇总,减少标注成本,提升分类效果
Semi-Supervised Learning深度学习分类生成模型半监督学习方法Github开源项目
全面整理的半监督学习资源列表,包括最新研究、代码库和各种应用。半监督学习通过结合大量无标签数据和少量有标签数据,减少标注成本并提升模型准确度。资源涵盖计算机视觉、自然语言处理、生成模型、图基方法等多个领域,适用于深度学习框架。提供详细的文献综述、代码实现以及相关书籍和讲座链接,帮助用户了解和应用半监督学习技术。
GPTs - 开源项目收录泄露的GPTs提示词集合
GPTs提示词GitHub关键词分类Github开源项目
这是一个GitHub开源项目,专门收集泄露的GPTs提示词。项目汇总了来自社交媒体、GitHub用户贡献以及作者破解的GPTs提示词。收录内容涵盖多个主题和应用场景,为人工智能对话系统的研究和开发提供了丰富的参考资源。
GPTs Finder - 每小时更新的GPTs资源目录和发现平台
AI工具GPTs目录分类搜索更新
GPTs Finder是一个专注于收集和展示最新GPTs(生成式预训练变换器)的网站。该平台每小时更新目录,确保提供最新、最全面的GPTs资源。网站设有多个分类,包括研究、分析、教育、设计等领域,便于快速定位所需的GPTs。平台支持用户提交自己的GPTs,丰富内容库。GPTs Finder不仅作为发现工具,还为GPTs爱好者和开发者提供灵感源泉。
Emoji You - 全面的emoji工具和资源中心
AI工具表情符号Emoji复制粘贴搜索工具分类
Emoji You提供多样化的emoji工具和资源。主要功能有emoji搜索、快速复制、随机生成和移除功能。包含表情、动物、食物等多种emoji类别,方便用户查找。网站还展示热门emoji排行和主题集合,帮助增强数字交流的表达力。
walls - 多样化风格壁纸库满足个性化需求
壁纸图片展示分类视觉设计READMEGithub开源项目
该项目提供多样化风格的壁纸库,包括抽象、动漫、极简和自然等分类。每个类别展示精选壁纸,便于浏览和下载。从数字艺术到自然景观,项目提供丰富的壁纸选择,可为各种设备带来全新的视觉体验。
100DaysofMLCode - 100天掌握机器学习编程实践从数据预处理到深度学习
机器学习数据预处理回归分类聚类Github开源项目
100DaysofMLCode是一个为期100天的机器学习编程挑战项目,涵盖数据预处理、回归、分类、聚类、强化学习、自然语言处理和深度学习等主题。项目提供代码示例和日志记录,适合不同水平的开发者学习和实践机器学习技术。作为开源项目,它欢迎社区贡献。
lists - GitHub上实用有趣的资源列表汇总
GitHub列表资源开源分类Github开源项目
Lists项目汇集了GitHub上各种实用和有趣的资源列表,涵盖技术和非技术领域。内容包括从生活方式到编程的多个方面,为用户提供丰富的信息源。该项目鼓励社区贡献,不断更新扩展。无论是学习、娱乐还是专业发展,Lists都能为用户提供有价值的参考。
Dmeta-embedding-zh - 提供多任务处理的句子相似度与特征提取模型
Huggingface分类特征提取开源项目模型Github句子相似度Dmeta-embedding重排序
此开源项目专注于实现多语言特征提取与文本分类的多任务模型,适用于多种MTEB数据集场景。模型实现句子相似度的有效评估,并在分类、聚类、再排序和检索任务中展现出良好的性能。采用多种数学计算方法,如余弦相似度、曼哈顿距离、欧氏距离等,确保结果的精确性与适应性。项目支持中英文文本处理,适用于学术研究及商业应用中的多种场景。
multilingual-e5-large-pooled - 多语言支持的句子相似性与特征提取模型
特征提取开源项目模型GithubMTEBHuggingface分类multilingual-e5-large句子相似度
此项目基于多语言处理,融合Sentence Transformers技术,专注于句子相似性与特征提取。支持多语言,适用于分类、重排序、文本聚类等多种场景。模型在各种任务中表现优异,如MTEB AmazonCounterfactualClassification和MTEB BUCC中的分类与双语文本挖掘,表现出色。采用MIT许可证,具有高度使用灵活性。
bge-base-en-v1.5 - 增强文本处理能力的多任务学习模型
sentence-transformers特征提取句子相似性分类句子聚类Github开源项目Huggingface模型
bge-base-en-v1.5模型通过多任务学习优化自然语言处理技术,覆盖分类、检索、聚类和重排任务。在多个MTEB数据集上表现优异,例如在亚马逊情感分类任务中达到93.39%的准确率,在AskUbuntu重排任务中MRR达到74.28%。该模型具有MIT开源许可,适用于多种英语任务,为研究人员和开发者提供有效支持。
gte-large-en-v1.5 - 英语语义相似度模型用于文本分类和检索
Huggingface情感分析模型gte-large-en-v1.5Github聚类检索开源项目分类
gte-large-en-v1.5是一个英语语义相似度模型,在MTEB基准测试中表现优异。该模型在文本分类、检索和聚类等任务上成绩突出,尤其适用于亚马逊评论分类和问答检索等场景。基于Sentence-Transformers框架开发,gte-large-en-v1.5可应用于多种自然语言处理任务,为文本表示提供了有力支持。
UAE-Large-V1 - 高性能多语言语义嵌入模型
特征提取sentence embeddingHuggingface模型GithubMTEB开源项目检索分类
UAE-Large-V1是一款多语言语义嵌入模型,在文本分类、检索、聚类和语义相似度等多个自然语言处理任务中展现出优秀性能。该模型支持多语言处理,可应用于问答系统、文档检索和情感分析等多种场景。UAE-Large-V1为NLP应用开发提供了一个多功能工具,有助于提高各类自然语言处理任务的效果。
bge-small-en - 英文文本嵌入模型在多种自然语言处理任务中展现出色性能
Huggingface模型GithubMTEB聚类检索开源项目句子变换器分类
bge-small-en是一个针对英文文本优化的嵌入模型,在MTEB基准测试中展现出优异性能。该模型在分类、检索、聚类等多种自然语言处理任务中表现出色,尤其在处理Amazon评论和ArguAna论证分析等数据集时效果显著。bge-small-en为需要高质量文本表示的应用场景提供了有力支持。
mxbai-embed-large-v1 - 多语言NLP嵌入模型在MTEB基准测试中展现卓越性能
模型检索开源项目Huggingface聚类分类transformersGithubMTEB
mxbai-embed-large-v1是一个多语言嵌入模型,在MTEB基准测试中表现优异。该模型在文本分类、检索、聚类和语义相似度等NLP任务中取得了良好成绩。基于transformer技术,mxbai-embed-large-v1生成高质量文本表示,可应用于信息检索、问答系统和文本分析等领域。
multilingual-e5-small - 多语言句子嵌入模型支持100多种语言
检索模型多语言聚类Github句子转换器分类Huggingface开源项目
multilingual-e5-small是一个支持100多种语言的句子嵌入模型。该模型在MTEB基准测试的分类、检索、聚类等任务中表现良好,适用于跨语言文本匹配和相似度计算。作为轻量级模型,它可在信息检索、文本分类和机器翻译等领域发挥作用,同时保持较低的计算资源需求。
multilingual-e5-large-instruct - 支持100+语言的多语言大规模指令型自然语言处理模型
模型评估Huggingface模型Github多语言MTEB开源项目检索分类
multilingual-e5-large-instruct是一个多语言大规模指令型语言模型,支持100多种语言的文本处理。该模型在MTEB基准测试的分类、检索、聚类等任务中表现优秀,展现了优异的跨语言能力。它可应用于多语言文本嵌入、语义搜索、文本分类等场景,为自然语言处理提供了实用的多语言解决方案。
NV-Embed-v1 - 多任务自然语言处理领域的高性能嵌入式模型
检索模型聚类Githubsentence-transformers分类MTEBHuggingface开源项目
NV-Embed-v1是一款在多项自然语言处理任务中表现出色的嵌入式模型。模型在分类、检索、聚类、重排序和语义相似度等任务中均取得优异成绩,尤其在情感分析和问答系统方面表现突出。NV-Embed-v1支持多语言处理,适用范围广泛,是自然语言处理领域的实用工具。
51-languages-classifier - 多语言文本分类模型可精准识别51种语言
模型MASSIVE多语言Github语言识别XLM-Roberta分类Huggingface开源项目
该项目开发了一个基于XLM-Roberta的51语言分类器,能够精确区分51种不同语言的文本。模型使用MASSIVE数据集进行训练,该数据集包含超过100万条多语言话语样本。在评估中,模型在大多数语言上的F1分数均超过0.98,展现出优异的性能。研究人员和开发者可通过Hugging Face Transformers库轻松集成和使用这一多语言分类模型。
snowflake-arctic-embed-m - 多语言句子嵌入模型助力相似度计算和语义搜索
模型检索开源项目Huggingface聚类分类相似度计算sentence-transformersGithub
snowflake-arctic-embed-m是一个开源的句子嵌入模型,主要用于多语言环境下的相似度计算和语义搜索。在MTEB基准测试中,该模型在分类、聚类和检索等任务上展现了不错的性能。它能够处理多种语言,有效提取句子的语义信息,为各类自然语言处理应用提供嵌入表示。模型适用于文本分类、信息检索和语义相似度计算等场景。
gte-base-en-v1.5 - 英文文本嵌入模型在自然语言处理任务中的应用
模型检索开源项目Huggingface分类transformerssentence-transformersGithubMTEB
gte-base-en-v1.5是一个英文文本嵌入模型,在MTEB基准测试中展现出优秀性能。该模型在句子相似度、文本分类和信息检索等自然语言处理任务中表现突出,能有效捕捉文本语义并为下游应用提供高质量的文本表示。测试结果显示,gte-base-en-v1.5在多个评估指标上取得了良好成绩,体现了其在不同应用场景中的实用价值。
snowflake-arctic-embed-xs - 轻量级多语言句子嵌入模型,专注文本相似度分析
模型检索开源项目Huggingface聚类语义相似度分类sentence-transformersGithub
snowflake-arctic-embed-xs是一款轻量级句子嵌入模型,针对多语言相似度任务优化。该模型在MTEB基准测试中展现出优异性能,尤其在文本分类、信息检索和聚类分析方面表现突出。尽管体积小巧,它仍在多个数据集上保持较高的准确率和F1分数,适合需要高效文本表示的各类应用场景。
NV-Embed-v2 - 多语言嵌入模型提升各类自然语言处理任务性能
检索模型聚类语义文本相似度Github分类MTEBHuggingface开源项目
NV-Embed-v2是一款多语言嵌入模型,针对多种自然语言处理任务进行了优化。该模型在文本分类、检索、聚类和语义相似度等基准测试中展现出优异表现,体现了其在跨语言和跨领域应用中的实力。通过深度学习技术,NV-Embed-v2能够生成高质量的文本表示,为各类NLP应用奠定了良好基础。
SFR-Embedding-2_R - 增强自然语言处理性能的多任务算法模型
检索评估开源项目Salesforce/SFR-Embedding-2_R模型分类HuggingfaceGithub
SFR-Embedding-2_R项目结合分类、检索、聚类及重排序任务,提供高级自然语言处理解决方案。在MTEB多个数据集上进行测试,展示了在情感分类、亚马逊评论分类等任务中的高性能表现,适用于需要高效灵活性的应用场景,尤其在复杂数据集中的表现更加出色。
cde-small-v1 - 增强文本分类与信息检索能力的多任务模型
MTEB分类聚类检索Huggingface句子嵌入Github开源项目模型
该项目在多任务环境下表现优异,尤其在文本分类与检索任务中。模型在多个数据集上表现出高准确率与精度,广泛适用于商业、教育与研究领域。其卓越的性能满足了对高精确度的需求,提供了一致而可靠的结果。
bge-en-icl - 先进的多语言自然语言处理模型
分类检索Huggingfacesentence-transformersGithub开源项目模型特征提取句子相似度
bge-en-icl是一个开源的句子嵌入模型,在MTEB基准测试的多项自然语言处理任务中表现出色。该模型支持多语言处理,适用于句子相似度计算、文本分类和信息检索等应用场景。在AmazonPolarity分类任务中,bge-en-icl达到了96.98%的准确率;在FEVER检索任务中,准确率达到92.83%。此外,该模型在其他任务如ArguAna检索和Banking77分类中也取得了优异成绩。bge-en-icl为研究人员和开发者提供了一个强大的工具,用于处理和分析各种文本数据。
roberta-fake-news-classification - 基于RoBERTa的新闻真假识别模型
roberta-baseGithub开源项目虚假新闻分类KaggleHuggingface模型
此模型使用roberta-base进行微调,旨在识别虚假新闻,在特定数据集上达到100%的准确率。模型可供下载,并易于在代码中集成,通过输入新闻标题和内容来验证新闻的真实性。此外,Gradio接口提供了实时测试功能。
e5-large - 句子嵌入模型应用于文本分类与检索,提升准确率
MTEB分类Sentence Transformers检索HuggingfaceGithub开源项目模型sentence-similarity
项目利用Sentence Transformers技术,提升自然语言处理任务中的句子嵌入效率,涵盖分类、检索、聚类及重排序等。该模型在多数据集上优异,尤其是在Amazon极性分类的准确率达90.05%。通过优化句子相似性,增强了在BIOSSES等任务中的相关性得分,是语义搜索和信息检索的理想之选,支持多语言文本分析。
snowflake-arctic-embed-m-long - 探索句子相似性与特征提取的新前沿
Huggingface特征提取开源项目模型Githubsentence-transformers数据集句子相似性分类
Snowflake-arctic-m-long模型基于transformers.js框架,提升了句子相似性和特征提取能力。支持的任务包括分类、检索与聚类,尤其在MTEB数据集上的表现优异。在Amazon分类任务中,其准确率超过78%,在ArguAna和CQADupstack检索任务中,检索性能高达50%以上。通过优化多项评测指标,如准确率、F1得分和检索率,这一模型为文本处理与分析提供了坚实的支持。
Linq-Embed-Mistral - 多任务文本分析工具
重排聚类Huggingface开源项目模型Github分类Linq-Embed-Mistral检索
Linq-Embed-Mistral模型在多任务文本处理表现优秀,如情感分析、分类及信息检索。在MTEB AmazonPolarityClassification中准确率达95.7%,在MTEB FEVER的MAP@1为82.52%,适用于大规模文本数据的分析,支持电商、银行、出版等领域。
sentence-transformers-multilingual-e5-small - 多语言句子相似性和分类模型,覆盖多种语言选择
Github开源项目multilingual-e5-smallAmazonReviews分类多语言Huggingface句子相似性模型
该项目提供多语言句子相似性和分类功能,适用范围广泛。采用MIT许可证,通过英语、德语、法语、西班牙语和中文等语言实现较高的精准度。通过Amazon反事实分类和情感极性任务表现出色,涵盖丰富的数据集和评估任务,如重排序和语义文本相似等,有效支持文本分类及自动化分析。