Project Icon

convnext_base.fb_in22k_ft_in1k_384

高效的ConvNeXt图像分类解决方案

ConvNeXt图像分类模型经过ImageNet-22k的预训练和ImageNet-1k的微调,以384x384分辨率高效执行分类任务。拥有88.6M参数和45.2 GMACs,支持图像分类、特征提取和图像嵌入等功能。适用于多种机器学习任务,其高分辨率处理能力使其在深度学习领域具有良好表现。

vit-small-patch16-224 - Google开发的轻量级视觉Transformer模型用于高效图像分类
GithubHuggingfaceImageNetVision Transformerpytorch-image-modelssafetensors图像分类开源项目模型
vit-small-patch16-224是Google开发的轻量级视觉Transformer模型,针对高效图像分类任务进行了优化。该模型由社区成员从timm仓库转换并上传至Hugging Face平台。它与ViT-base模型具有相同的使用方式,特别适合计算资源有限的应用场景。模型在ImageNet数据集上经过训练,可用于各种计算机视觉任务,如图像识别和分类。相比ViT-base,它具有更小的模型尺寸和更快的推理速度,同时保持了良好的性能表现。需要注意的是,模型的safetensors版本要求torch 2.0或更高版本的运行环境。
Keras-TextClassification - 多样预训练模型支持的高效文本分类工具
GithubKeras-TextClassification嵌入式模型开源项目文本分类深度学习神经网络
为中文用户提供高效的文本分类解决方案,支持FastText、BERT、Albert等多种预训练模型,涵盖词、字、句子嵌入。详细介绍数据处理与模型训练流程,通过下载与调用数据,实现多标签分类和文本相似度计算,简化复杂的自然语言处理任务。
MoritzLaurer-roberta-base-zeroshot-v2.0-c-onnx - ONNX格式的零样本分类基础模型
GithubHugging FaceHuggingfaceONNX开源项目模型转换
该项目将MoritzLaurer/roberta-base-zeroshot-v2.0-c模型转成ONNX格式,旨在增强推理性能和部署灵活性,借助Hugging Face的Optimum库进行转换。适用于多任务快速处理的应用场景,在零样本分类中,无需大量手动标注数据,便可实现有效的文本分类,适合各类语言处理任务。
vision_transformer - 视觉Transformer和MLP-Mixer模型库 高性能图像识别
FlaxGithubJAXMLP-MixerVision Transformer图像识别开源项目
项目包含多种视觉Transformer(ViT)和MLP-Mixer模型实现,提供ImageNet和ImageNet-21k预训练模型及JAX/Flax微调代码。通过交互式Colab笔记本可探索5万多个模型检查点。这些高性能图像分类模型代表了计算机视觉的前沿进展。
AI-generated_images_detector - 高精度AI生成图像检测模型,适用于图像分类任务
AI-generated_images_detectorGithubHuggingface准确率图像分类开源项目模型训练和评估数据
该高精度AI生成图像检测模型专注于图像分类,适用于imagefolder数据集验证。模型训练后达到了0.9736的准确率,能够有效区分生成与真实图像。通过transformers库中的pipeline进行推理,只需将图像传递给模型即可获得分类结果,适用于对图像分类精度要求较高的应用,能够有效提升AI生成内容的识别能力。
blip-image-captioning-base - BLIP框架打造的先进图像描述生成模型
BLIPGithubHuggingface图像字幕图像理解多模态开源项目模型视觉语言预训练
blip-image-captioning-base是基于BLIP框架的图像描述生成模型,在COCO数据集上预训练。模型适用于条件和无条件图像描述任务,在图像-文本检索、图像描述和视觉问答等视觉语言任务中表现优异。它具有出色的泛化能力,可零样本迁移至视频语言任务。支持CPU和GPU运行,包括半精度模式,为开发者提供高效的图像描述生成工具。
CLIP-ViT-B-32-laion2B-s34B-b79K - 基于LAION-2B数据集训练的CLIP ViT-B/32零样本图像识别模型
CLIPGithubHuggingfaceLAION-2B图像分类多模态模型开源项目模型零样本学习
CLIP-ViT-B-32-laion2B-s34B-b79K是一个基于LAION-2B英文数据集训练的CLIP ViT-B/32模型,在ImageNet-1k上实现66.6%的零样本top-1准确率。该模型适用于零样本图像分类、图像文本检索等任务,由Stability AI提供算力支持,采用OpenCLIP框架训练。此模型为研究人员提供了探索零样本任意图像分类的有力工具。
clip-vit-base-patch32 - OpenAI CLIP模型实现零样本图像分类的视觉语言预训练
CLIPGithubHuggingfaceOpenAI图像分类开源项目模型计算机视觉零样本学习
CLIP是OpenAI开发的视觉语言预训练模型,使用ViT-B/32和Transformer架构分别作为图像和文本编码器。通过对比学习训练,CLIP能实现零样本图像分类等任务,在多项计算机视觉基准测试中表现优异。尽管在细粒度分类和物体计数方面存在局限,CLIP为研究人员提供了探索模型鲁棒性和泛化能力的重要工具。
DCNv4 - 为视觉应用设计的高效算子,通过优化空间聚合和内存访问
DCNv4Github可变形卷积开源项目深度学习神经网络计算机视觉
DCNv4是一种为视觉应用设计的高效算子。通过优化空间聚合和内存访问,它解决了DCNv3的局限性。DCNv4在图像分类、分割和生成等任务中表现优异,收敛和处理速度显著提升,前向速度提高3倍以上。其卓越的性能和效率使DCNv4成为未来视觉模型的潜力基础构建块。
siglip-so400m-patch14-384 - SigLIP模型应用sigmoid损失函数提升多模态处理能力
GithubHuggingfaceSigLIPWebLI数据集图像分类多模态模型开源项目模型零样本学习
SigLIP模型基于WebLi数据集在384x384分辨率下预训练,采用SoViT-400m架构。通过sigmoid损失函数优化CLIP模型,在零样本图像分类和图像文本检索任务中表现优异。该模型可处理更大批量,同时在小批量下也有出色表现。经16个TPU-v4芯片3天训练,为多模态任务奠定了坚实基础。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号