#机器学习模型

label-studio - 多功能开源数据标注工具，支持多种数据类型及模型集成

Label Studio开源数据标注机器学习模型Docker安装多用户标注Github开源项目

Label Studio 是开源的数据标注工具，支持音频、文本、图像、视频和时间序列等多种数据类型。用户通过直观的 UI 进行数据标注，并导出多种模型格式。它还提供多用户标注、项目管理、机器学习模型集成及定制化标签格式功能，适用于高精度机器学习模型的构建和优化。

vespa - 大规模数据集搜索与推荐的高性能解决方案

Vespa搜索机器学习模型高可用性性能Github开源项目

Vespa 是一个高性能平台，专为大规模数据集的搜索、推荐和个性化任务设计。它支持向量、张量、文本和结构化数据的实时组织和推断，具备高可用性和可扩展性。Vespa 被广泛应用于大规模互联网服务，每秒处理数十万次查询。用户可以选择在云端或本地部署应用，平台提供详尽的文档和不断更新的博客，帮助用户开发和集成。

modelscope - 整合与应用前沿AI模型的开放平台

ModelScope模型服务API接口机器学习模型开源库Github开源项目

ModelScope简化了AI模型在推理、训练和评估方面的流程，支持CV、NLP、语音、多模态和科学计算等领域的应用。该平台提供统一接口和丰富的API层级，便于开发者轻松集成和使用700多种最新开源模型。适合初学者和专业人士快速上手，体验强大功能。

rag-search - 智能数据检索和排名优化工具

RAG Search APIthinkany.aiFastAPIAPI 请求机器学习模型Github开源项目

RAG Search API是由thinkany.ai开发，旨在优化搜索结果的效率与准确性。这一API实现了多样化的搜索功能，包括信息重排、筛选详细数据等，并能通过FastAPI快速部署。其简便的安装过程使得开发者能够轻松集成此技术，从而提升数据处理的效能。

models - 探索最先进的机器学习模型与技术

ONNX Model Zoo机器学习模型图像分类对象检测语言处理Github开源项目

ONNX Model Zoo是一个开源平台，汇集了各种预训练且处于技术前沿的机器学习模型，涵盖计算机视觉、自然语言处理等多个领域。旨在为开发者、研究人员和技术爱好者提供高效实用的AI工具，加速机器学习技术的应用和发展。此外，ONNX Model Zoo支持多种框架和工具，通过共同的文件格式和操作集，促进了AI开发的灵活性和互操作性。平台以开放性和社区驱动的特性为己任，含有诸如图像分类、对象检测等主要模型，并通过简易接口及高级工具满足不同用户需求，使其既适应初学者也满足专业人士的需求。

simpleAI - 自托管的AI API替代方案，涵盖文本、聊天、编辑和嵌入功能

SimpleAIgRPCPython机器学习模型开源Github开源项目

SimpleAI项目提供自托管的AI API替代方案，可快速试验文本补全、聊天、编辑和嵌入等主要端点。支持多种响应模式，通过gRPC协议实现多语言的模型推理分离，降低对特定API提供商的依赖。项目包含多种示例和详细的安装使用指南，适合开发者构建、测试和优化自己的AI应用。

melusine - 邮件处理优化工具，智能路由和邮件优先级管理

Melusine电子邮件处理深度学习机器学习模型Apache 2.0Github开源项目

Melusine 是一款全面的邮件处理库，具有智能路由和急件优先等功能，优化邮件工作流程。其模块化架构允许无缝集成各种 AI 框架，实现高效的邮件过滤和分类。项目已在 MAIF 生产环境得到验证，具备稳健性和稳定性。用户可通过详细文档和教程快速上手，提升工作效率。

meerkat - 专为可视化、探索和注释各类数据集而设计的开源Python库

Meerkat数据可视化未结构化数据机器学习模型开源库Github开源项目

Meerkat是一个开源的Python库，专为可视化、探索和注释各类数据集而设计，特别适合处理非结构化数据类型（如文本、PDF、图像和视频）。Meerkat支持与Pandas、Arrow和HF Datasets无缝整合，无需数据移动。用户能够使用简洁的Python代码嵌入机器学习模型，实现搜索、分组和自动完成等功能。借助Meerkat的高度定制化可视化组件，适用于探索性数据分析和快速验证数据标注等多种应用场景。

ai-hub-models - 一系列性能优化的机器学习模型

Qualcomm AI Hub机器学习模型设备部署性能优化PythonGithub开源项目

Qualcomm® AI Hub Models提供了一系列性能优化的机器学习模型，适用于视觉、语音、文本和生成式AI。这些模型可以在Qualcomm设备上高效部署，并提供开源的量化、优化和部署指南。用户可以通过Hugging Face访问模型，并通过示例应用程序在本地设备上部署。支持多种操作系统和计算单元，兼容多款Snapdragon芯片，并提供详细的性能指标和文档。

CoreML-Models - 为iOS开发者提供的Core ML机器学习模型下载与集成资源库

Core ML机器学习模型iOS开发XcodeImage ClassifierGithub开源项目

提供多种分类、检测、分割、超分辨率、低光增强、图像恢复和生成等Core ML模型资源，方便iOS开发者下载并集成到Xcode项目。通过Google Drive下载并参照示例项目了解具体使用方法。

NSFWDetector - 用于检测不适当图片的轻量级17kB CoreML模型

NSFWDetectorCoreMLCreateML图像检测机器学习模型Github开源项目

NSFWDetector是一个17 kB的CoreML模型，用于侦测不适当图片。该模型使用CreateML训练，能够区分色情内容和正常图片，特别适用于分辨Instagram风格照片与色情内容。用户可以根据平台需求设置不同的置信度阈值，支持iOS 12及以上版本。可通过Swift Package Manager或Cocoapods安装，更多信息和下载可在GitHub获得。

truss - 简便的AI/ML模型生产环境部署工具

TrussBaseten模型部署机器学习模型Python框架Github开源项目

Truss是一个用于在生产环境中轻松打包和部署AI/ML模型的工具。它具有一次编写即可在任何地方运行的特性，确保开发和生产环境的一致性。支持所有主流的Python框架，如transformers、diffusers、PyTorch和TensorFlow等，并包含快速开发反馈机制。Truss由Baseten维护，提供便捷的云端部署，通过Baseten的API密钥即可轻松实现远程部署。

hummingbird - 用于将经过训练的传统 ML 模型编译为张量计算的库

Hummingbird机器学习模型PyTorch神经网络加速推理Github开源项目

Hummingbird通过将训练好的传统机器学习模型编译为张量计算，使其能够借助神经网络框架（如PyTorch）加速。用户可利用神经网络框架的优化和硬件加速，无需重新设计模型。支持多种模型如决策树、随机森林、LightGBM和XGBoost，并提供易于替换的推理API。支持转换为PyTorch、TorchScript、ONNX和TVM格式。

keras-tuner - 兼具易用性和可扩展性的超参数优化工具

KerasTuner超参数优化Python 3.8+TensorFlow 2.0+机器学习模型Github开源项目

KerasTuner是一个便捷且可扩展的超参数优化工具，可以有效解决超参数搜索过程中遇到的问题。用户可以通过define-by-run语法轻松配置搜索空间，并使用贝叶斯优化、Hyperband和随机搜索算法找到模型的最佳参数值。该工具对研究人员十分友好，便于进行新搜索算法的实验。KerasTuner适用于Python 3.8+和TensorFlow 2.0+，并提供详细的开发者指南和API参考文档。

model-optimization - TensorFlow 模型优化工具包, 支持量化和稀疏化

TensorFlow Model Optimization Toolkit机器学习模型量化剪枝KerasGithub开源项目

TensorFlow Model Optimization Toolkit 提供稳定的 Python API，帮助用户通过量化和稀疏化技术优化机器学习模型，包括针对 Keras 的专用 API。该工具包还提供详细的安装指南、教程和 API 文档，显著提升模型在部署和执行时的性能。该项目由 TensorFlow 团队维护，并遵循其行为准则，开发者可以通过 GitHub 提交问题和贡献代码。

AIX360 - 全面支持多种数据类型和机器学习模型解释的开源工具包

AI Explainability 360解释性工具包机器学习模型算法AIX360Github开源项目

工具包提供全面支持机器学习模型和数据集的可解释性，涵盖多种解释算法和指标，包括表格、文本、图像及时间序列数据。该项目提供互动体验、教程和示例，并提供指导材料和分类树帮助选择算法。工具包易于扩展，欢迎贡献新的算法、指标和用例。

gam-changer - 交互式工具助力编辑和优化广义加性模型

GAM Changer机器学习模型可视化工具模型编辑可解释性Github开源项目

GAM Changer是一个开源的可视化工具，用于编辑和优化广义加性模型(GAMs)。该工具提供直观的界面，支持在计算笔记本中使用，可修改模型特征并保存编辑历史。它旨在提高模型的可解释性和准确性，促进机器学习与人类知识的结合。GAM Changer源于多家研究机构的合作，包括微软研究院、纽约大学朗格尼健康中心等。

recurrent-memory-transformer - 记忆增强型Transformer为Hugging Face模型提升长序列处理能力

Recurrent Memory Transformer长文本处理机器学习模型自然语言处理Hugging FaceGithub开源项目

Recurrent Memory Transformer (RMT)是为Hugging Face模型设计的记忆增强型循环Transformer。通过在输入序列中添加特殊记忆标记，RMT实现了高效的记忆机制，能够处理长达1M及以上的token序列。项目提供RMT实现代码、训练示例和评估工具，在BABILong等长文本基准测试中表现优异，为研究长序列处理提供了有力支持。

ortex - Elixir实现的ONNX模型并发推理框架

OrtexONNX Runtime机器学习模型Elixir模型推理Github开源项目

Ortex是基于ONNX Runtime的Elixir封装库，通过Nx.Serving实现ONNX模型的并发和分布式部署。该框架支持CUDA、TensorRT和Core ML等多种后端，能够高效加载和推理主流机器学习库导出的ONNX模型。Ortex还提供了便捷的存储型张量实现，为开发者提供了灵活且高效的机器学习模型部署方案。

modelscan - 开源AI模型安全扫描工具助力高效检测风险

ModelScan机器学习模型安全扫描序列化攻击开源项目Github

ModelScan是Protect AI开发的开源AI模型安全扫描工具,支持H5、Pickle和SavedModel等多种格式。它可快速识别PyTorch、TensorFlow、Keras等框架中的模型安全风险,有效防范模型序列化攻击。ModelScan易于集成到机器学习流程中,为AI模型全生命周期提供安全保障,保护数据和系统安全。

IngestAI - 硅谷创新企业提供全方位AI技术咨询服务

AI工具IngestAI人工智能咨询AI产品开发数据策略机器学习模型

IngestAI作为硅谷AI技术咨询公司，专注于企业数据和人工智能解决方案。公司提供AI产品设计、商业案例分析和全栈开发服务，助力企业构建AI竞争优势。背靠斯坦福大学AI研究生态，IngestAI获得业界认可，致力于通过创新AI应用提升企业效能，推动数字化转型。

pytriton - 优化Python环境下NVIDIA Triton推理服务器的应用

PyTriton推理服务机器学习模型Python框架NVIDIAGithub开源项目

PyTriton是一款类似Flask/FastAPI的框架，旨在优化NVIDIA Triton推理服务器在Python环境中的应用。该框架支持直接从Python部署机器学习模型，具有原生Python支持、框架无关性和性能优化等特点。通过简洁的接口，PyTriton简化了模型部署、性能优化和API开发过程。不论使用PyTorch、TensorFlow还是JAX，开发者均可将Python代码轻松转换为HTTP/gRPC API。

KANbeFair - KAN与MLP神经网络性能对比研究

KANbeFair神经网络比较机器学习模型网络架构性能评估Github开源项目

本项目对KAN和MLP神经网络进行了全面比较。研究表明,KAN在符号公式表示方面更优,MLP则在计算机视觉、机器学习、文本和音频处理任务中表现更佳。通过网络架构消融实验,发现KAN的主要优势源于B样条函数的应用。项目提供了安装指南、运行说明及参数量和FLOPs计算方法,为神经网络研究提供了有价值的实验资源。

narrator - AI实时生活解说，模拟David Attenborough风格

AI应用开发Replicate机器学习模型API接口语音合成Github开源项目

David Attenborough narrates your life 项目是一款基于AI技术的创新应用，能将日常生活场景实时转化为纪录片风格的解说。该项目整合了Replicate平台的机器学习模型、OpenAI的自然语言处理能力和ElevenLabs的语音合成技术，通过实时摄像头捕捉和AI语音生成，模仿著名纪录片解说员David Attenborough的风格，为普通生活场景添加独特的叙事视角。项目采用Python编写，支持简单的环境配置和API设置。开发者可以通过Replicate平台轻松部署和运行相关机器学习模型，结合OpenAI的语言生成能力和ElevenLabs的语音合成技术，实现实时视频捕捉和AI驱动的解说功能。这种创新应用为探索AI在日常生活中的创意应用提供了新的思路。

hub - 机器学习预训练模型分享与复用平台

TensorFlow HubKaggle Models机器学习模型模型迁移SavedModelGithub开源项目

TensorFlow Hub是机器学习预训练模型的开源分享平台，现已迁移至Kaggle Models。平台提供SavedModel格式的TensorFlow 2模型和tensorflow_hub Python库，支持快速下载和重用模型。开发者可轻松获取预训练模型，加速机器学习项目开发。尽管迁移，tensorflow_hub库仍支持下载原有tfhub.dev模型。

speech-emotion-recognition - 开源多模型语音情感识别系统

语音情感识别机器学习模型深度学习模型特征提取Emo-db数据集Github开源项目

speech-emotion-recognition是一个开源的语音情感识别系统，基于Emo-db数据集开发。该项目支持SVM、随机森林、神经网络、CNN和LSTM等多种机器学习和深度学习模型。系统使用Python实现，提供完整的数据预处理、特征提取和模型训练工作流程。项目设计简单易用，适合研究人员和开发者进行语音情感分析的研究和应用开发。该系统可应用于客户服务、情感计算、人机交互等领域，具有模型多样化、使用灵活、易于扩展等优点。

fonnx - 跨平台加速Flutter应用的ONNX模型运行库

FONNX机器学习模型跨平台开发ONNXFlutterGithub开源项目

FONNX是一个专为Flutter设计的跨平台ONNX模型运行库，支持在iOS、Android、Web等多个平台上原生执行机器学习模型。该库充分利用各平台的本地加速能力，如iOS的CoreML和Android的Neural Networks API，显著提升机器学习应用的性能。FONNX不仅支持直接使用Hugging Face的ONNX模型，还提供了将PyTorch、TensorFlow等格式模型转换为ONNX的便捷工具。

fc_6 - PyTorch模型Hub集成方式解析

PyTorch模型Github开源项目HuggingfaceHugging Face机器学习模型模型集成深度学习

该模型采用PyTorchModelHubMixin集成推送至Hub，用户可方便地访问和部署。使用此功能，开发者能够高效管理和共享模型资源，提升模型的可重复性和扩展性，简化研究人员和工程师的模型管理流程。

e5-large-v2 - 多语言文本任务的高性能句子嵌入模型

Sentence TransformersHuggingface模型信息检索机器学习模型Github开源项目自然语言处理文本分类

e5-large-v2是一款针对多语言文本任务优化的句子嵌入模型。在MTEB基准测试中，该模型在分类、检索和聚类等多项任务上展现出优秀性能。e5-large-v2能有效处理包括英语在内的多种语言，为自然语言处理领域提供了强大的句子表示能力。该模型可应用于改进文本相似度计算、信息检索等多种实际场景。

bertweet-base-sentiment-analysis - 英文推文情感分析模型 BERTweet-Sentiment

模型BERTweet情感分析推特数据Github机器学习模型Huggingface开源项目自然语言处理

bertweet-base-sentiment-analysis是一个基于SemEval 2017语料库训练的英文情感分析模型。它利用BERTweet作为基础，能够识别文本中的积极、消极和中性情感。作为pysentimiento库的组成部分，该开源项目主要面向非商业用途和科研领域，为自然语言处理研究提供了实用的情感分析工具。

surya_det3 - surya项目的开源文本检测模型

模型开源项目Huggingfacesurya视觉识别机器学习模型Github文本检测

surya_det3是surya项目中的一个文本检测模型，基于vikp/line_detector_3开发。该模型主要用于识别和定位文档中的文本行，可处理不同字体、布局和语言。作为开源项目的一部分，surya_det3为文档分析和信息提取提供了基础支持。

fineweb-edu-classifier - 基于深度学习的网页教育内容智能分类系统

模型教育内容分类Github网页质量评估开源项目HuggingfaceFineWeb-Edu机器学习模型数据集过滤

FineWeb-Edu classifier是一款基于Snowflake-arctic-embed模型的网页教育内容智能分类系统。该系统通过450,000个LLama3-70B-instruct模型标注的样本进行训练，能够对网页内容的教育价值进行0-5分的评估。在二元分类任务中，系统达到了82%的F1分数，为教育资源的筛选和管理提供了高效工具。尽管在特定领域存在一定局限性，但该系统为自动化筛选优质教育资源开辟了新途径，有望推动在线教育内容的质量提升。

MeaningBERT - 智能评估句子间语义保留的自动化指标

模型语义保留MeaningBERTGithub机器学习模型评估指标开源项目Huggingface自然语言处理

MeaningBERT是一种创新的自动化指标，用于评估句子间的语义保留程度。该工具基于先进的自然语言处理技术，其评估结果与人类判断高度相关。MeaningBERT不仅可用于评估任务，还支持进一步训练和微调。在相同句子和无关句子的测试中，MeaningBERT展现了卓越的表现，凸显了其在语义评估方面的可靠性和准确性。研究人员和开发者可通过HuggingFace平台便捷地使用MeaningBERT进行模型训练或评估工作。

podos_soccer_model - 开源足球比赛预测模型：基于变压器架构

数据分析模型PyTorchPodos足球比赛预测Github机器学习模型Huggingface开源项目

Podos是一个开源的足球比赛预测模型，采用变压器架构，拥有276K参数。该模型利用23个输入参数，包括赔率、球队表现和连胜连败等数据进行预测。虽然存在一定的主场偏差，但Podos为足球比赛预测提供了可靠基础，并有潜力进行进一步优化。用户可以直接使用或通过Bettensor平台集成此模型。

codebert-javascript - 基于CodeBERT的JavaScript代码评估预训练模型

代码生成评估Huggingface模型机器学习模型Github预训练模型开源项目自然语言处理CodeBERTScore

该模型基于microsoft/codebert-base-mlm架构，针对JavaScript代码进行了优化训练。使用codeparrot/github-code-clean数据集，经过100万步掩码语言建模任务训练。主要应用于CodeBERTScore项目，用于代码生成评估，同时也适用于其他相关任务。此模型为JavaScript代码分析和评估提供了有力工具，可满足研究人员和开发者的需求。

Vespa: 强大的开源搜索引擎和向量数据库

2024年08月30日

Vespa：强大的开源搜索和大数据处理引擎

2024年08月30日

Label Studio: 开源数据标注工具的全面解析

2024年08月30日

Turi Create: 简化机器学习模型开发的强大工具

2024年08月30日

ModelScope: 打造人工智能模型即服务的开源生态系统

2024年08月30日

RAG搜索：提升AI模型的知识检索与生成能力

2024年08月30日

ONNX Model Zoo: 开源预训练模型的宝库

2024年08月30日

LLaVaVision: 革新视觉辅助技术的开源项目

2024年08月30日

Vespa：强大的大规模在线AI和数据处理引擎

2024年08月30日

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com