#机器学习模型
turicreate - 简化机器学习模型开发的工具
Turi Create机器学习模型图像分类物体检测Core MLGithub开源项目
Turi Create是一款简化机器学习模型开发的工具,适合非专业人士使用。它支持添加推荐、目标检测、图像分类、图像相似度和活动分类等功能。工具兼容文本、图像、音频、视频和传感器数据,提供内置可视化和快速扩展性,并支持导出模型到Core ML,用于iOS、macOS、watchOS和tvOS应用。
label-studio - 多功能开源数据标注工具,支持多种数据类型及模型集成
Label Studio开源数据标注机器学习模型Docker安装多用户标注Github开源项目
Label Studio 是开源的数据标注工具,支持音频、文本、图像、视频和时间序列等多种数据类型。用户通过直观的 UI 进行数据标注,并导出多种模型格式。它还提供多用户标注、项目管理、机器学习模型集成及定制化标签格式功能,适用于高精度机器学习模型的构建和优化。
vespa - 大规模数据集搜索与推荐的高性能解决方案
Vespa搜索机器学习模型高可用性性能Github开源项目
Vespa 是一个高性能平台,专为大规模数据集的搜索、推荐和个性化任务设计。它支持向量、张量、文本和结构化数据的实时组织和推断,具备高可用性和可扩展性。Vespa 被广泛应用于大规模互联网服务,每秒处理数十万次查询。用户可以选择在云端或本地部署应用,平台提供详尽的文档和不断更新的博客,帮助用户开发和集成。
modelscope - 整合与应用前沿AI模型的开放平台
ModelScope模型服务API接口机器学习模型开源库Github开源项目
ModelScope简化了AI模型在推理、训练和评估方面的流程,支持CV、NLP、语音、多模态和科学计算等领域的应用。该平台提供统一接口和丰富的API层级,便于开发者轻松集成和使用700多种最新开源模型。适合初学者和专业人士快速上手,体验强大功能。
rag-search - 智能数据检索和排名优化工具
RAG Search APIthinkany.aiFastAPIAPI 请求机器学习模型Github开源项目
RAG Search API是由thinkany.ai开发,旨在优化搜索结果的效率与准确性。这一API实现了多样化的搜索功能,包括信息重排、筛选详细数据等,并能通过FastAPI快速部署。其简便的安装过程使得开发者能够轻松集成此技术,从而提升数据处理的效能。
models - 探索最先进的机器学习模型与技术
ONNX Model Zoo机器学习模型图像分类对象检测语言处理Github开源项目
ONNX Model Zoo是一个开源平台,汇集了各种预训练且处于技术前沿的机器学习模型,涵盖计算机视觉、自然语言处理等多个领域。旨在为开发者、研究人员和技术爱好者提供高效实用的AI工具,加速机器学习技术的应用和发展。此外,ONNX Model Zoo支持多种框架和工具,通过共同的文件格式和操作集,促进了AI开发的灵活性和互操作性。平台以开放性和社区驱动的特性为己任,含有诸如图像分类、对象检测等主要模型,并通过简易接口及高级工具满足不同用户需求,使其既适应初学者也满足专业人士的需求。
simpleAI - 自托管的AI API替代方案,涵盖文本、聊天、编辑和嵌入功能
SimpleAIgRPCPython机器学习模型开源Github开源项目
SimpleAI项目提供自托管的AI API替代方案,可快速试验文本补全、聊天、编辑和嵌入等主要端点。支持多种响应模式,通过gRPC协议实现多语言的模型推理分离,降低对特定API提供商的依赖。项目包含多种示例和详细的安装使用指南,适合开发者构建、测试和优化自己的AI应用。
melusine - 邮件处理优化工具,智能路由和邮件优先级管理
Melusine电子邮件处理深度学习机器学习模型Apache 2.0Github开源项目
Melusine 是一款全面的邮件处理库,具有智能路由和急件优先等功能,优化邮件工作流程。其模块化架构允许无缝集成各种 AI 框架,实现高效的邮件过滤和分类。项目已在 MAIF 生产环境得到验证,具备稳健性和稳定性。用户可通过详细文档和教程快速上手,提升工作效率。
meerkat - 专为可视化、探索和注释各类数据集而设计的开源Python库
Meerkat数据可视化未结构化数据机器学习模型开源库Github开源项目
Meerkat是一个开源的Python库,专为可视化、探索和注释各类数据集而设计,特别适合处理非结构化数据类型(如文本、PDF、图像和视频)。Meerkat支持与Pandas、Arrow和HF Datasets无缝整合,无需数据移动。用户能够使用简洁的Python代码嵌入机器学习模型,实现搜索、分组和自动完成等功能。借助Meerkat的高度定制化可视化组件,适用于探索性数据分析和快速验证数据标注等多种应用场景。
ai-hub-models - 一系列性能优化的机器学习模型
Qualcomm AI Hub机器学习模型设备部署性能优化PythonGithub开源项目
Qualcomm® AI Hub Models提供了一系列性能优化的机器学习模型,适用于视觉、语音、文本和生成式AI。这些模型可以在Qualcomm设备上高效部署,并提供开源的量化、优化和部署指南。用户可以通过Hugging Face访问模型,并通过示例应用程序在本地设备上部署。支持多种操作系统和计算单元,兼容多款Snapdragon芯片,并提供详细的性能指标和文档。
CoreML-Models - 为iOS开发者提供的Core ML机器学习模型下载与集成资源库
Core ML机器学习模型iOS开发XcodeImage ClassifierGithub开源项目
提供多种分类、检测、分割、超分辨率、低光增强、图像恢复和生成等Core ML模型资源,方便iOS开发者下载并集成到Xcode项目。通过Google Drive下载并参照示例项目了解具体使用方法。
NSFWDetector - 用于检测不适当图片的轻量级17kB CoreML模型
NSFWDetectorCoreMLCreateML图像检测机器学习模型Github开源项目
NSFWDetector是一个17 kB的CoreML模型,用于侦测不适当图片。该模型使用CreateML训练,能够区分色情内容和正常图片,特别适用于分辨Instagram风格照片与色情内容。用户可以根据平台需求设置不同的置信度阈值,支持iOS 12及以上版本。可通过Swift Package Manager或Cocoapods安装,更多信息和下载可在GitHub获得。
truss - 简便的AI/ML模型生产环境部署工具
TrussBaseten模型部署机器学习模型Python框架Github开源项目
Truss是一个用于在生产环境中轻松打包和部署AI/ML模型的工具。它具有一次编写即可在任何地方运行的特性,确保开发和生产环境的一致性。支持所有主流的Python框架,如transformers、diffusers、PyTorch和TensorFlow等,并包含快速开发反馈机制。Truss由Baseten维护,提供便捷的云端部署,通过Baseten的API密钥即可轻松实现远程部署。
hummingbird - 用于将经过训练的传统 ML 模型编译为张量计算的库
Hummingbird机器学习模型PyTorch神经网络加速推理Github开源项目
Hummingbird通过将训练好的传统机器学习模型编译为张量计算,使其能够借助神经网络框架(如PyTorch)加速。用户可利用神经网络框架的优化和硬件加速,无需重新设计模型。支持多种模型如决策树、随机森林、LightGBM和XGBoost,并提供易于替换的推理API。支持转换为PyTorch、TorchScript、ONNX和TVM格式。
keras-tuner - 兼具易用性和可扩展性的超参数优化工具
KerasTuner超参数优化Python 3.8+TensorFlow 2.0+机器学习模型Github开源项目
KerasTuner是一个便捷且可扩展的超参数优化工具,可以有效解决超参数搜索过程中遇到的问题。用户可以通过define-by-run语法轻松配置搜索空间,并使用贝叶斯优化、Hyperband和随机搜索算法找到模型的最佳参数值。该工具对研究人员十分友好,便于进行新搜索算法的实验。KerasTuner适用于Python 3.8+和TensorFlow 2.0+,并提供详细的开发者指南和API参考文档。
model-optimization - TensorFlow 模型优化工具包, 支持量化和稀疏化
TensorFlow Model Optimization Toolkit机器学习模型量化剪枝KerasGithub开源项目
TensorFlow Model Optimization Toolkit 提供稳定的 Python API,帮助用户通过量化和稀疏化技术优化机器学习模型,包括针对 Keras 的专用 API。该工具包还提供详细的安装指南、教程和 API 文档,显著提升模型在部署和执行时的性能。该项目由 TensorFlow 团队维护,并遵循其行为准则,开发者可以通过 GitHub 提交问题和贡献代码。
AIX360 - 全面支持多种数据类型和机器学习模型解释的开源工具包
AI Explainability 360解释性工具包机器学习模型算法AIX360Github开源项目
工具包提供全面支持机器学习模型和数据集的可解释性,涵盖多种解释算法和指标,包括表格、文本、图像及时间序列数据。该项目提供互动体验、教程和示例,并提供指导材料和分类树帮助选择算法。工具包易于扩展,欢迎贡献新的算法、指标和用例。
gam-changer - 交互式工具助力编辑和优化广义加性模型
GAM Changer机器学习模型可视化工具模型编辑可解释性Github开源项目
GAM Changer是一个开源的可视化工具,用于编辑和优化广义加性模型(GAMs)。该工具提供直观的界面,支持在计算笔记本中使用,可修改模型特征并保存编辑历史。它旨在提高模型的可解释性和准确性,促进机器学习与人类知识的结合。GAM Changer源于多家研究机构的合作,包括微软研究院、纽约大学朗格尼健康中心等。
recurrent-memory-transformer - 记忆增强型Transformer为Hugging Face模型提升长序列处理能力
Recurrent Memory Transformer长文本处理机器学习模型自然语言处理Hugging FaceGithub开源项目
Recurrent Memory Transformer (RMT)是为Hugging Face模型设计的记忆增强型循环Transformer。通过在输入序列中添加特殊记忆标记,RMT实现了高效的记忆机制,能够处理长达1M及以上的token序列。项目提供RMT实现代码、训练示例和评估工具,在BABILong等长文本基准测试中表现优异,为研究长序列处理提供了有力支持。
ortex - Elixir实现的ONNX模型并发推理框架
OrtexONNX Runtime机器学习模型Elixir模型推理Github开源项目
Ortex是基于ONNX Runtime的Elixir封装库,通过Nx.Serving实现ONNX模型的并发和分布式部署。该框架支持CUDA、TensorRT和Core ML等多种后端,能够高效加载和推理主流机器学习库导出的ONNX模型。Ortex还提供了便捷的存储型张量实现,为开发者提供了灵活且高效的机器学习模型部署方案。
modelscan - 开源AI模型安全扫描工具助力高效检测风险
ModelScan机器学习模型安全扫描序列化攻击开源项目Github
ModelScan是Protect AI开发的开源AI模型安全扫描工具,支持H5、Pickle和SavedModel等多种格式。它可快速识别PyTorch、TensorFlow、Keras等框架中的模型安全风险,有效防范模型序列化攻击。ModelScan易于集成到机器学习流程中,为AI模型全生命周期提供安全保障,保护数据和系统安全。
IngestAI - 硅谷创新企业提供全方位AI技术咨询服务
AI工具IngestAI人工智能咨询AI产品开发数据策略机器学习模型
IngestAI作为硅谷AI技术咨询公司,专注于企业数据和人工智能解决方案。公司提供AI产品设计、商业案例分析和全栈开发服务,助力企业构建AI竞争优势。背靠斯坦福大学AI研究生态,IngestAI获得业界认可,致力于通过创新AI应用提升企业效能,推动数字化转型。
pytriton - 优化Python环境下NVIDIA Triton推理服务器的应用
PyTriton推理服务机器学习模型Python框架NVIDIAGithub开源项目
PyTriton是一款类似Flask/FastAPI的框架,旨在优化NVIDIA Triton推理服务器在Python环境中的应用。该框架支持直接从Python部署机器学习模型,具有原生Python支持、框架无关性和性能优化等特点。通过简洁的接口,PyTriton简化了模型部署、性能优化和API开发过程。不论使用PyTorch、TensorFlow还是JAX,开发者均可将Python代码轻松转换为HTTP/gRPC API。
KANbeFair - KAN与MLP神经网络性能对比研究
KANbeFair神经网络比较机器学习模型网络架构性能评估Github开源项目
本项目对KAN和MLP神经网络进行了全面比较。研究表明,KAN在符号公式表示方面更优,MLP则在计算机视觉、机器学习、文本和音频处理任务中表现更佳。通过网络架构消融实验,发现KAN的主要优势源于B样条函数的应用。项目提供了安装指南、运行说明及参数量和FLOPs计算方法,为神经网络研究提供了有价值的实验资源。
narrator - AI实时生活解说,模拟David Attenborough风格
AI应用开发Replicate机器学习模型API接口语音合成Github开源项目
David Attenborough narrates your life 项目是一款基于AI技术的创新应用,能将日常生活场景实时转化为纪录片风格的解说。该项目整合了Replicate平台的机器学习模型、OpenAI的自然语言处理能力和ElevenLabs的语音合成技术,通过实时摄像头捕捉和AI语音生成,模仿著名纪录片解说员David Attenborough的风格,为普通生活场景添加独特的叙事视角。项目采用Python编写,支持简单的环境配置和API设置。开发者可以通过Replicate平台轻松部署和运行相关机器学习模型,结合OpenAI的语言生成能力和ElevenLabs的语音合成技术,实现实时视频捕捉和AI驱动的解说功能。这种创新应用为探索AI在日常生活中的创意应用提供了新的思路。
hub - 机器学习预训练模型分享与复用平台
TensorFlow HubKaggle Models机器学习模型模型迁移SavedModelGithub开源项目
TensorFlow Hub是机器学习预训练模型的开源分享平台,现已迁移至Kaggle Models。平台提供SavedModel格式的TensorFlow 2模型和tensorflow_hub Python库,支持快速下载和重用模型。开发者可轻松获取预训练模型,加速机器学习项目开发。尽管迁移,tensorflow_hub库仍支持下载原有tfhub.dev模型。
speech-emotion-recognition - 开源多模型语音情感识别系统
语音情感识别机器学习模型深度学习模型特征提取Emo-db数据集Github开源项目
speech-emotion-recognition是一个开源的语音情感识别系统,基于Emo-db数据集开发。该项目支持SVM、随机森林、神经网络、CNN和LSTM等多种机器学习和深度学习模型。系统使用Python实现,提供完整的数据预处理、特征提取和模型训练工作流程。项目设计简单易用,适合研究人员和开发者进行语音情感分析的研究和应用开发。该系统可应用于客户服务、情感计算、人机交互等领域,具有模型多样化、使用灵活、易于扩展等优点。
fonnx - 跨平台加速Flutter应用的ONNX模型运行库
FONNX机器学习模型跨平台开发ONNXFlutterGithub开源项目
FONNX是一个专为Flutter设计的跨平台ONNX模型运行库,支持在iOS、Android、Web等多个平台上原生执行机器学习模型。该库充分利用各平台的本地加速能力,如iOS的CoreML和Android的Neural Networks API,显著提升机器学习应用的性能。FONNX不仅支持直接使用Hugging Face的ONNX模型,还提供了将PyTorch、TensorFlow等格式模型转换为ONNX的便捷工具。
fc_6 - PyTorch模型Hub集成方式解析
PyTorch模型Github开源项目HuggingfaceHugging Face机器学习模型模型集成深度学习
该模型采用PyTorchModelHubMixin集成推送至Hub,用户可方便地访问和部署。使用此功能,开发者能够高效管理和共享模型资源,提升模型的可重复性和扩展性,简化研究人员和工程师的模型管理流程。
e5-large-v2 - 多语言文本任务的高性能句子嵌入模型
Sentence TransformersHuggingface模型信息检索机器学习模型Github开源项目自然语言处理文本分类
e5-large-v2是一款针对多语言文本任务优化的句子嵌入模型。在MTEB基准测试中,该模型在分类、检索和聚类等多项任务上展现出优秀性能。e5-large-v2能有效处理包括英语在内的多种语言,为自然语言处理领域提供了强大的句子表示能力。该模型可应用于改进文本相似度计算、信息检索等多种实际场景。
bertweet-base-sentiment-analysis - 英文推文情感分析模型 BERTweet-Sentiment
模型BERTweet情感分析推特数据Github机器学习模型Huggingface开源项目自然语言处理
bertweet-base-sentiment-analysis是一个基于SemEval 2017语料库训练的英文情感分析模型。它利用BERTweet作为基础,能够识别文本中的积极、消极和中性情感。作为pysentimiento库的组成部分,该开源项目主要面向非商业用途和科研领域,为自然语言处理研究提供了实用的情感分析工具。
surya_det3 - surya项目的开源文本检测模型
模型开源项目Huggingfacesurya视觉识别机器学习模型Github文本检测
surya_det3是surya项目中的一个文本检测模型,基于vikp/line_detector_3开发。该模型主要用于识别和定位文档中的文本行,可处理不同字体、布局和语言。作为开源项目的一部分,surya_det3为文档分析和信息提取提供了基础支持。
fineweb-edu-classifier - 基于深度学习的网页教育内容智能分类系统
模型教育内容分类Github网页质量评估开源项目HuggingfaceFineWeb-Edu机器学习模型数据集过滤
FineWeb-Edu classifier是一款基于Snowflake-arctic-embed模型的网页教育内容智能分类系统。该系统通过450,000个LLama3-70B-instruct模型标注的样本进行训练,能够对网页内容的教育价值进行0-5分的评估。在二元分类任务中,系统达到了82%的F1分数,为教育资源的筛选和管理提供了高效工具。尽管在特定领域存在一定局限性,但该系统为自动化筛选优质教育资源开辟了新途径,有望推动在线教育内容的质量提升。
MeaningBERT - 智能评估句子间语义保留的自动化指标
模型语义保留MeaningBERTGithub机器学习模型评估指标开源项目Huggingface自然语言处理
MeaningBERT是一种创新的自动化指标,用于评估句子间的语义保留程度。该工具基于先进的自然语言处理技术,其评估结果与人类判断高度相关。MeaningBERT不仅可用于评估任务,还支持进一步训练和微调。在相同句子和无关句子的测试中,MeaningBERT展现了卓越的表现,凸显了其在语义评估方面的可靠性和准确性。研究人员和开发者可通过HuggingFace平台便捷地使用MeaningBERT进行模型训练或评估工作。
podos_soccer_model - 开源足球比赛预测模型:基于变压器架构
数据分析模型PyTorchPodos足球比赛预测Github机器学习模型Huggingface开源项目
Podos是一个开源的足球比赛预测模型,采用变压器架构,拥有276K参数。该模型利用23个输入参数,包括赔率、球队表现和连胜连败等数据进行预测。虽然存在一定的主场偏差,但Podos为足球比赛预测提供了可靠基础,并有潜力进行进一步优化。用户可以直接使用或通过Bettensor平台集成此模型。
codebert-javascript - 基于CodeBERT的JavaScript代码评估预训练模型
代码生成评估Huggingface模型机器学习模型Github预训练模型开源项目自然语言处理CodeBERTScore
该模型基于microsoft/codebert-base-mlm架构,针对JavaScript代码进行了优化训练。使用codeparrot/github-code-clean数据集,经过100万步掩码语言建模任务训练。主要应用于CodeBERTScore项目,用于代码生成评估,同时也适用于其他相关任务。此模型为JavaScript代码分析和评估提供了有力工具,可满足研究人员和开发者的需求。
相关文章
Vespa: 强大的开源搜索引擎和向量数据库
2024年08月30日
Vespa:强大的开源搜索和大数据处理引擎
2024年08月30日
Label Studio: 开源数据标注工具的全面解析
2024年08月30日
Turi Create: 简化机器学习模型开发的强大工具
2024年08月30日
ModelScope: 打造人工智能模型即服务的开源生态系统
2024年08月30日
RAG搜索:提升AI模型的知识检索与生成能力
2024年08月30日
ONNX Model Zoo: 开源预训练模型的宝库
2024年08月30日
LLaVaVision: 革新视觉辅助技术的开源项目
2024年08月30日
Vespa:强大的大规模在线AI和数据处理引擎
2024年08月30日