#机器学习模型
turicreate - 简化机器学习模型开发的工具
Turi Create机器学习模型图像分类物体检测Core MLGithub开源项目
Turi Create是一款简化机器学习模型开发的工具,适合非专业人士使用。它支持添加推荐、目标检测、图像分类、图像相似度和活动分类等功能。工具兼容文本、图像、音频、视频和传感器数据,提供内置可视化和快速扩展性,并支持导出模型到Core ML,用于iOS、macOS、watchOS和tvOS应用。
label-studio - 多功能开源数据标注工具,支持多种数据类型及模型集成
Label Studio开源数据标注机器学习模型Docker安装多用户标注Github开源项目
Label Studio 是开源的数据标注工具,支持音频、文本、图像、视频和时间序列等多种数据类型。用户通过直观的 UI 进行数据标注,并导出多种模型格式。它还提供多用户标注、项目管理、机器学习模型集成及定制化标签格式功能,适用于高精度机器学习模型的构建和优化。
vespa - 大规模数据集搜索与推荐的高性能解决方案
Vespa搜索机器学习模型高可用性性能Github开源项目
Vespa 是一个高性能平台,专为大规模数据集的搜索、推荐和个性化任务设计。它支持向量、张量、文本和结构化数据的实时组织和推断,具备高可用性和可扩展性。Vespa 被广泛应用于大规模互联网服务,每秒处理数十万次查询。用户可以选择在云端或本地部署应用,平台提供详尽的文档和不断更新的博客,帮助用户开发和集成。
modelscope - 整合与应用前沿AI模型的开放平台
ModelScope模型服务API接口机器学习模型开源库Github开源项目
ModelScope简化了AI模型在推理、训练和评估方面的流程,支持CV、NLP、语音、多模态和科学计算等领域的应用。该平台提供统一接口和丰富的API层级,便于开发者轻松集成和使用700多种最新开源模型。适合初学者和专业人士快速上手,体验强大功能。
rag-search - 智能数据检索和排名优化工具
RAG Search APIthinkany.aiFastAPIAPI 请求机器学习模型Github开源项目
RAG Search API是由thinkany.ai开发,旨在优化搜索结果的效率与准确性。这一API实现了多样化的搜索功能,包括信息重排、筛选详细数据等,并能通过FastAPI快速部署。其简便的安装过程使得开发者能够轻松集成此技术,从而提升数据处理的效能。
models - 探索最先进的机器学习模型与技术
ONNX Model Zoo机器学习模型图像分类对象检测语言处理Github开源项目
ONNX Model Zoo是一个开源平台,汇集了各种预训练且处于技术前沿的机器学习模型,涵盖计算机视觉、自然语言处理等多个领域。旨在为开发者、研究人员和技术爱好者提供高效实用的AI工具,加速机器学习技术的应用和发展。此外,ONNX Model Zoo支持多种框架和工具,通过共同的文件格式和操作集,促进了AI开发的灵活性和互操作性。平台以开放性和社区驱动的特性为己任,含有诸如图像分类、对象检测等主要模型,并通过简易接口及高级工具满足不同用户需求,使其既适应初学者也满足专业人士的需求。
simpleAI - 自托管的AI API替代方案,涵盖文本、聊天、编辑和嵌入功能
SimpleAIgRPCPython机器学习模型开源Github开源项目
SimpleAI项目提供自托管的AI API替代方案,可快速试验文本补全、聊天、编辑和嵌入等主要端点。支持多种响应模式,通过gRPC协议实现多语言的模型推理分离,降低对特定API提供商的依赖。项目包含多种示例和详细的安装使用指南,适合开发者构建、测试和优化自己的AI应用。
melusine - 邮件处理优化工具,智能路由和邮件优先级管理
Melusine电子邮件处理深度学习机器学习模型Apache 2.0Github开源项目
Melusine 是一款全面的邮件处理库,具有智能路由和急件优先等功能,优化邮件工作流程。其模块化架构允许无缝集成各种 AI 框架,实现高效的邮件过滤和分类。项目已在 MAIF 生产环境得到验证,具备稳健性和稳定性。用户可通过详细文档和教程快速上手,提升工作效率。
meerkat - 专为可视化、探索和注释各类数据集而设计的开源Python库
Meerkat数据可视化未结构化数据机器学习模型开源库Github开源项目
Meerkat是一个开源的Python库,专为可视化、探索和注释各类数据集而设计,特别适合处理非结构化数据类型(如文本、PDF、图像和视频)。Meerkat支持与Pandas、Arrow和HF Datasets无缝整合,无需数据移动。用户能够使用简洁的Python代码嵌入机器学习模型,实现搜索、分组和自动完成等功能。借助Meerkat的高度定制化可视化组件,适用于探索性数据分析和快速验证数据标注等多种应用场景。
ai-hub-models - 一系列性能优化的机器学习模型
Qualcomm AI Hub机器学习模型设备部署性能优化PythonGithub开源项目
Qualcomm® AI Hub Models提供了一系列性能优化的机器学习模型,适用于视觉、语音、文本和生成式AI。这些模型可以在Qualcomm设备上高效部署,并提供开源的量化、优化和部署指南。用户可以通过Hugging Face访问模型,并通过示例应用程序在本地设备上部署。支持多种操作系统和计算单元,兼容多款Snapdragon芯片,并提供详细的性能指标和文档。
CoreML-Models - 为iOS开发者提供的Core ML机器学习模型下载与集成资源库
Core ML机器学习模型iOS开发XcodeImage ClassifierGithub开源项目
提供多种分类、检测、分割、超分辨率、低光增强、图像恢复和生成等Core ML模型资源,方便iOS开发者下载并集成到Xcode项目。通过Google Drive下载并参照示例项目了解具体使用方法。
NSFWDetector - 用于检测不适当图片的轻量级17kB CoreML模型
NSFWDetectorCoreMLCreateML图像检测机器学习模型Github开源项目
NSFWDetector是一个17 kB的CoreML模型,用于侦测不适当图片。该模型使用CreateML训练,能够区分色情内容和正常图片,特别适用于分辨Instagram风格照片与色情内容。用户可以根据平台需求设置不同的置信度阈值,支持iOS 12及以上版本。可通过Swift Package Manager或Cocoapods安装,更多信息和下载可在GitHub获得。
truss - 简便的AI/ML模型生产环境部署工具
TrussBaseten模型部署机器学习模型Python框架Github开源项目
Truss是一个用于在生产环境中轻松打包和部署AI/ML模型的工具。它具有一次编写即可在任何地方运行的特性,确保开发和生产环境的一致性。支持所有主流的Python框架,如transformers、diffusers、PyTorch和TensorFlow等,并包含快速开发反馈机制。Truss由Baseten维护,提供便捷的云端部署,通过Baseten的API密钥即可轻松实现远程部署。
hummingbird - 用于将经过训练的传统 ML 模型编译为张量计算的库
Hummingbird机器学习模型PyTorch神经网络加速推理Github开源项目
Hummingbird通过将训练好的传统机器学习模型编译为张量计算,使其能够借助神经网络框架(如PyTorch)加速。用户可利用神经网络框架的优化和硬件加速,无需重新设计模型。支持多种模型如决策树、随机森林、LightGBM和XGBoost,并提供易于替换的推理API。支持转换为PyTorch、TorchScript、ONNX和TVM格式。
keras-tuner - 兼具易用性和可扩展性的超参数优化工具
KerasTuner超参数优化Python 3.8+TensorFlow 2.0+机器学习模型Github开源项目
KerasTuner是一个便捷且可扩展的超参数优化工具,可以有效解决超参数搜索过程中遇到的问题。用户可以通过define-by-run语法轻松配置搜索空间,并使用贝叶斯优化、Hyperband和随机搜索算法找到模型的最佳参数值。该工具对研究人员十分友好,便于进行新搜索算法的实验。KerasTuner适用于Python 3.8+和TensorFlow 2.0+,并提供详细的开发者指南和API参考文档。
model-optimization - TensorFlow 模型优化工具包, 支持量化和稀疏化
TensorFlow Model Optimization Toolkit机器学习模型量化剪枝KerasGithub开源项目
TensorFlow Model Optimization Toolkit 提供稳定的 Python API,帮助用户通过量化和稀疏化技术优化机器学习模型,包括针对 Keras 的专用 API。该工具包还提供详细的安装指南、教程和 API 文档,显著提升模型在部署和执行时的性能。该项目由 TensorFlow 团队维护,并遵循其行为准则,开发者可以通过 GitHub 提交问题和贡献代码。
AIX360 - 全面支持多种数据类型和机器学习模型解释的开源工具包
AI Explainability 360解释性工具包机器学习模型算法AIX360Github开源项目
工具包提供全面支持机器学习模型和数据集的可解释性,涵盖多种解释算法和指标,包括表格、文本、图像及时间序列数据。该项目提供互动体验、教程和示例,并提供指导材料和分类树帮助选择算法。工具包易于扩展,欢迎贡献新的算法、指标和用例。
gam-changer - 交互式工具助力编辑和优化广义加性模型
GAM Changer机器学习模型可视化工具模型编辑可解释性Github开源项目
GAM Changer是一个开源的可视化工具,用于编辑和优化广义加性模型(GAMs)。该工具提供直观的界面,支持在计算笔记本中使用,可修改模型特征并保存编辑历史。它旨在提高模型的可解释性和准确性,促进机器学习与人类知识的结合。GAM Changer源于多家研究机构的合作,包括微软研究院、纽约大学朗格尼健康中心等。
recurrent-memory-transformer - 记忆增强型Transformer为Hugging Face模型提升长序列处理能力
Recurrent Memory Transformer长文本处理机器学习模型自然语言处理Hugging FaceGithub开源项目
Recurrent Memory Transformer (RMT)是为Hugging Face模型设计的记忆增强型循环Transformer。通过在输入序列中添加特殊记忆标记,RMT实现了高效的记忆机制,能够处理长达1M及以上的token序列。项目提供RMT实现代码、训练示例和评估工具,在BABILong等长文本基准测试中表现优异,为研究长序列处理提供了有力支持。
ortex - Elixir实现的ONNX模型并发推理框架
OrtexONNX Runtime机器学习模型Elixir模型推理Github开源项目
Ortex是基于ONNX Runtime的Elixir封装库,通过Nx.Serving实现ONNX模型的并发和分布式部署。该框架支持CUDA、TensorRT和Core ML等多种后端,能够高效加载和推理主流机器学习库导出的ONNX模型。Ortex还提供了便捷的存储型张量实现,为开发者提供了灵活且高效的机器学习模型部署方案。
modelscan - 开源AI模型安全扫描工具助力高效检测风险
ModelScan机器学习模型安全扫描序列化攻击开源项目Github
ModelScan是Protect AI开发的开源AI模型安全扫描工具,支持H5、Pickle和SavedModel等多种格式。它可快速识别PyTorch、TensorFlow、Keras等框架中的模型安全风险,有效防范模型序列化攻击。ModelScan易于集成到机器学习流程中,为AI模型全生命周期提供安全保障,保护数据和系统安全。
IngestAI - 硅谷创新企业提供全方位AI技术咨询服务
AI工具IngestAI人工智能咨询AI产品开发数据策略机器学习模型
IngestAI作为硅谷AI技术咨询公司,专注于企业数据和人工智能解决方案。公司提供AI产品设计、商业案例分析和全栈开发服务,助力企业构建AI竞争优势。背靠斯坦福大学AI研究生态,IngestAI获得业界认可,致力于通过创新AI应用提升企业效能,推动数字化转型。
pytriton - 优化Python环境下NVIDIA Triton推理服务器的应用
PyTriton推理服务机器学习模型Python框架NVIDIAGithub开源项目
PyTriton是一款类似Flask/FastAPI的框架,旨在优化NVIDIA Triton推理服务器在Python环境中的应用。该框架支持直接从Python部署机器学习模型,具有原生Python支持、框架无关性和性能优化等特点。通过简洁的接口,PyTriton简化了模型部署、性能优化和API开发过程。不论使用PyTorch、TensorFlow还是JAX,开发者均可将Python代码轻松转换为HTTP/gRPC API。
KANbeFair - KAN与MLP神经网络性能对比研究
KANbeFair神经网络比较机器学习模型网络架构性能评估Github开源项目
本项目对KAN和MLP神经网络进行了全面比较。研究表明,KAN在符号公式表示方面更优,MLP则在计算机视觉、机器学习、文本和音频处理任务中表现更佳。通过网络架构消融实验,发现KAN的主要优势源于B样条函数的应用。项目提供了安装指南、运行说明及参数量和FLOPs计算方法,为神经网络研究提供了有价值的实验资源。
narrator - AI实时生活解说,模拟David Attenborough风格
AI应用开发Replicate机器学习模型API接口语音合成Github开源项目
David Attenborough narrates your life 项目是一款基于AI技术的创新应用,能将日常生活场景实时转化为纪录片风格的解说。该项目整合了Replicate平台的机器学习模型、OpenAI的自然语言处理能力和ElevenLabs的语音合成技术,通过实时摄像头捕捉和AI语音生成,模仿著名纪录片解说员David Attenborough的风格,为普通生活场景添加独特的叙事视角。项目采用Python编写,支持简单的环境配置和API设置。开发者可以通过Replicate平台轻松部署和运行相关机器学习模型,结合OpenAI的语言生成能力和ElevenLabs的语音合成技术,实现实时视频捕捉和AI驱动的解说功能。这种创新应用为探索AI在日常生活中的创意应用提供了新的思路。
hub - 机器学习预训练模型分享与复用平台
TensorFlow HubKaggle Models机器学习模型模型迁移SavedModelGithub开源项目
TensorFlow Hub是机器学习预训练模型的开源分享平台,现已迁移至Kaggle Models。平台提供SavedModel格式的TensorFlow 2模型和tensorflow_hub Python库,支持快速下载和重用模型。开发者可轻松获取预训练模型,加速机器学习项目开发。尽管迁移,tensorflow_hub库仍支持下载原有tfhub.dev模型。
speech-emotion-recognition - 开源多模型语音情感识别系统
语音情感识别机器学习模型深度学习模型特征提取Emo-db数据集Github开源项目
speech-emotion-recognition是一个开源的语音情感识别系统,基于Emo-db数据集开发。该项目支持SVM、随机森林、神经网络、CNN和LSTM等多种机器学习和深度学习模型。系统使用Python实现,提供完整的数据预处理、特征提取和模型训练工作流程。项目设计简单易用,适合研究人员和开发者进行语音情感分析的研究和应用开发。该系统可应用于客户服务、情感计算、人机交互等领域,具有模型多样化、使用灵活、易于扩展等优点。
fonnx - 跨平台加速Flutter应用的ONNX模型运行库
FONNX机器学习模型跨平台开发ONNXFlutterGithub开源项目
FONNX是一个专为Flutter设计的跨平台ONNX模型运行库,支持在iOS、Android、Web等多个平台上原生执行机器学习模型。该库充分利用各平台的本地加速能力,如iOS的CoreML和Android的Neural Networks API,显著提升机器学习应用的性能。FONNX不仅支持直接使用Hugging Face的ONNX模型,还提供了将PyTorch、TensorFlow等格式模型转换为ONNX的便捷工具。
granite-3b-code-base-2k - IBM开发的多语言代码生成AI模型
模型Github代码生成开源项目Huggingface机器学习模型Granite-3B-Code-Base-2K自然语言处理人工智能
Granite-3B-Code-Base-2K是一款开源的代码生成AI模型,由IBM Research开发。该模型经过116种编程语言的大规模训练和高质量数据微调,可用于代码生成、解释和修复等多种软件工程任务。它采用Apache 2.0许可证,适合企业级应用。虽然功能强大,但使用时需考虑其局限性。
gmixer_24_224.ra3_in1k - MLP-Mixer变体:采用SwiGLU的图像分类和特征提取模型
模型神经网络ImageNet-1k开源项目Huggingface图像分类机器学习模型Githubtimm
gmixer_24_224.ra3_in1k是一个基于MLP-Mixer架构的图像分类模型,在timm库中由Ross Wightman开发。该模型采用SwiGLU激活函数,在ImageNet-1k数据集上训练,拥有2470万参数,计算复杂度为5.3 GMACs。它支持224x224尺寸的图像输入,可用于图像分类和特征提取。模型提供简洁的API,便于进行图像分类和嵌入提取,适用于多种计算机视觉应用场景。
kandinsky-2-1-prior - 先进的文本到图像扩散模型
图像编辑Huggingface模型文本生成图像机器学习模型AI绘图Github开源项目Kandinsky 2.1
Kandinsky 2.1是一款结合DALL-E 2和潜在扩散技术的文本条件扩散模型。它采用CLIP模型进行文本和图像编码,并在CLIP模态的潜在空间中引入扩散图像先验,大幅提升了视觉效果。该模型支持文本到图像生成、图像到图像转换、图像修复和插值等多种应用,为图像混合和文本引导的图像操作开辟了新的可能性。
opensearch-neural-sparse-encoding-doc-v1 - OpenSearch神经稀疏编码模型提升信息检索效率
HuggingfaceOpenSearch模型文档检索机器学习模型Github开源项目搜索引擎神经稀疏编码
opensearch-neural-sparse-encoding-doc-v1是一款为OpenSearch开发的学习型稀疏检索模型。它能将文档转换为30522维稀疏向量,并采用高效的查询处理方法。该模型经MS MARCO数据集训练,实际性能堪比BM25。模型支持基于Lucene倒排索引的学习型稀疏检索,可通过OpenSearch高级API实现索引和搜索。在BEIR基准测试的13个子集上,该模型展现了优秀的零样本性能,体现了出色的搜索相关性和检索效率。
beitv2_base_patch16_224.in1k_ft_in22k - BEiT-v2架构的ImageNet-22k微调图像分类与特征提取模型
模型开源项目Huggingface图像分类ImageNet机器学习模型GithubtimmBEiT-v2
beitv2_base_patch16_224.in1k_ft_in22k是基于BEiT-v2架构的图像分类模型,在ImageNet-1k上进行自监督预训练,并在ImageNet-22k上微调。该模型拥有1.026亿参数,支持224x224像素输入,适用于图像分类和特征提取。通过timm库可轻松加载,为计算机视觉研究和应用提供强大工具。
epiCRealism - Stable Diffusion模型实现真实感图像生成
模型开源项目HuggingfaceStable DiffusionAI绘图机器学习模型Github文本生成图像HuggingFace
epiCRealism是一个基于Stable Diffusion的开源模型,专注于生成高质量真实感图像。该模型支持多种场景创作,包括人像、风景和幻想题材,能够呈现细腻的细节和逼真效果。epiCRealism易于集成到各类图像生成项目中,为创作者和开发者提供了实现视觉创意的有力工具。
codebert-java - CodeBERT模型针对Java代码优化 助力代码生成评估
CodeBERT代码生成评估Huggingface模型机器学习模型Github开源项目自然语言处理GitHub代码数据集
这是一个基于microsoft/codebert-base-mlm模型训练的CodeBERT变体,专注于Java代码处理。经过100万步的掩码语言建模训练,该模型主要应用于CodeBERTScore项目,用于评估代码生成质量。它利用codeparrot/github-code-clean数据集的Java代码,不仅可用于代码生成评估,还能支持其他代码分析任务,为相关研究和应用提供了有力支持。
codegen-2B-multi - 提供多语言程序合成的自回归语言模型
Github开源项目自动生成代码机器学习模型Huggingface程序合成CodeGen多编程语言模型
CodeGen-Multi 2B模型是一种自回归语言模型,经过多个编程语言的大规模数据集预训练,能够合成可执行代码。模型以CodeGen-NL 2B为基础,并在多语言数据上进一步训练,能够从自然语言和编程语言中提取特征。模型在主要代码生成基准上经过评估,可用于从注释生成代码或完成部分代码。用户可借助AutoModelForCausalLM功能加载模型,适用于多种编程语言。
相关文章