图像识别AI工具大全:实用软件、网站推荐
图像识别

vit-huge-patch14-224-in21k
图像识别Huggingface
大型视觉Transformer模型实现高效图像识别与特征提取

moondream1
moondream1模型
轻量级视觉语言模型 强大性能与高效结构的完美结合

blip2-opt-2.7b
图像识别Huggingface
集成图像理解与语言生成的视觉语言模型

stable-diffusion-safety-checker
模型CLIP模型
基于CLIP模型的图像安全检查工具

Llama-3.2-11B-Vision-Instruct
Llama 3.2-Vision图像识别
Meta开发的多模态语言模型 提供图像理解与文本生成

vit-base-patch16-224-in21k
ImageNet-21kGithub
基于ImageNet-21k预训练的视觉Transformer模型

Chance: Visual Intelligence
AI工具Chance AI
视觉智能搜索,让世界触手可及

Tesseract4Android
Tesseract4AndroidOCR
基于 Tesseract 的 Android OCR 库 支持多线程识别

webcamGPT
webcamGPTOpenAI vision API
实时视频流分析工具,基于OpenAI视觉API

multi_token
multi_token多模态嵌入
将多模态嵌入到大语言模型的开源框架

LeNet5-MNIST-PyTorch
LeNet-5MNIST
PyTorch实现LeNet-5识别MNIST数据集

simple-ocr-opencv
OCRPython
基于OpenCV和NumPy的轻量级Python OCR工具

PaddleOCR-json
PaddleOCR-jsonOCR
基于PaddleOCR的跨平台离线文字识别组件

MLKit
MLKit机器学习
Android机器学习开发的高效工具库

gImageReader
gImageReaderOCR软件
基于tesseract-ocr的开源图像文字识别工具 支持多格式处理

tesserocr
tesserocrOCR
Python封装的OCR引擎简化技术集成

gosseract
gosseractOCR
Go语言OCR解决方案 利用Tesseract C++库

tesseract-ocr-for-php
Tesseract OCRPHP
用于PHP的Tesseract OCR封装库

trace.moe
trace.moe动漫场景搜索
将动漫截图精准溯源的开源搜索引擎

SikuliX1
SikuliX自动化测试
跨平台的图像识别自动化工具
推荐工具精选
AI云服务特惠
懂AI专属折扣关注微信公众号
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号