#Florence-2

florence2-finetuning - 视觉语言模型的高效微调实现
Florence-2微软视觉语言模型微调分布式训练Github开源项目
本项目展示了Florence-2模型的微调方法。Florence-2是一个基础视觉语言模型,特点是模型小且性能强。项目包含模型安装、数据准备和代码修改说明,并提供单GPU及分布式训练脚本。这些工具可用于Florence-2的特定任务训练,适用于各种计算机视觉和视觉语言任务。
Florence-2-large - 多任务视觉AI的统一解决方案
图像处理计算机视觉多任务学习Huggingface模型人工智能GithubFlorence-2开源项目
Florence-2是一个由微软开发的视觉基础模型,能够处理多种视觉和视觉-语言任务。该模型通过解释简单的文本提示,可以执行图像描述、目标检测和分割等任务。Florence-2基于FLD-5B数据集进行训练,在零样本和微调场景下均表现优异。模型提供不同规模的版本,支持多种视觉任务,为研究人员和开发者提供了一个versatile的视觉AI工具。
Florence-2-base - 多任务视觉处理的统一基础模型
图像处理计算机视觉多任务学习Huggingface模型人工智能GithubFlorence-2开源项目
Florence-2是一个视觉基础模型,可处理多种视觉和视觉语言任务。该模型通过解释文本提示执行图像描述、物体检测和分割等功能。Florence-2利用FLD-5B数据集进行训练,在零样本和微调场景下均表现优异。它支持图像描述、物体检测、区域描述等多项任务,为视觉应用提供了统一的基础架构。
Florence-2-base-ft - 多任务视觉AI模型实现图像理解与分析
模型Florence-2多任务学习视觉模型Github图像处理Huggingface开源项目自然语言处理
Florence-2-base-ft是一款多任务视觉AI模型,可处理多种视觉和视觉-语言任务。该模型通过解释简单的文本提示,执行图像描述、物体检测和分割等操作。在图像描述、视觉问答和引用表达理解等基准测试中,Florence-2-base-ft展现出优秀性能。这个拥有2.3亿参数的模型为各类视觉任务提供了统一的表示方法,展现了人工智能在视觉理解领域的最新进展。
Florence-2-large-no-flash-attn - 基于统一表示的多功能视觉人工智能模型
模型多任务学习Github视觉基础模型开源项目Florence-2Huggingface图像处理自然语言处理
Florence-2-large-no-flash-attn是一款由微软开发的视觉基础模型。它采用提示式方法处理多种视觉和视觉语言任务,包括图像描述、目标检测和分割。该模型利用54亿个注释的大规模数据集进行多任务学习,在零样本和微调场景下均表现出色。Florence-2的序列到序列架构使其在各类下游任务中展现优异性能,为统一视觉表示提供了新的可能性。
Florence-2-large-ft - 统一表示实现多种视觉任务的AI基础模型
图像识别计算机视觉多任务学习Huggingface模型GithubFlorence-2开源项目自然语言处理
Florence-2是一款视觉基础模型,采用提示式方法处理多种视觉和视觉语言任务。该模型基于包含54亿标注的FLD-5B数据集进行多任务学习,可通过简单文本提示执行图像描述、目标检测和分割等任务。Florence-2采用序列到序列架构,在零样本和微调场景中表现优异,展现了较强的竞争力。
Florence-2-base-ft - 基于Transformers.js的图像识别文本生成引擎
Transformers.js模型深度学习Florence-2图像识别模型转换GithubHuggingface开源项目
Florence-2-base-ft是一个基于ONNX权重的图像识别模型,专门针对Web环境优化。通过Transformers.js框架,该模型能够实现图像描述生成等功能。开发者可以通过JavaScript API将图像分析能力集成到Web应用中,项目提供在线演示展示具体应用效果。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号