图像识别AI工具大全:实用软件、网站推荐

图像识别

vit-huge-patch14-224-in21k

vit-huge-patch14-224-in21k

图像识别Huggingface

大型视觉Transformer模型实现高效图像识别与特征提取

moondream1

moondream1

moondream1模型

轻量级视觉语言模型 强大性能与高效结构的完美结合

blip2-opt-2.7b

blip2-opt-2.7b

图像识别Huggingface

集成图像理解与语言生成的视觉语言模型

stable-diffusion-safety-checker

stable-diffusion-safety-checker

模型CLIP模型

基于CLIP模型的图像安全检查工具

Llama-3.2-11B-Vision-Instruct

Llama-3.2-11B-Vision-Instruct

Llama 3.2-Vision图像识别

Meta开发的多模态语言模型 提供图像理解与文本生成

vit-base-patch16-224-in21k

vit-base-patch16-224-in21k

ImageNet-21kGithub

基于ImageNet-21k预训练的视觉Transformer模型

Chance: Visual Intelligence

Chance: Visual Intelligence

AI工具Chance AI

视觉智能搜索,让世界触手可及

Tesseract4Android

Tesseract4Android

Tesseract4AndroidOCR

基于 Tesseract 的 Android OCR 库 支持多线程识别

webcamGPT

webcamGPT

webcamGPTOpenAI vision API

实时视频流分析工具,基于OpenAI视觉API

multi_token

multi_token

multi_token多模态嵌入

将多模态嵌入到大语言模型的开源框架

LeNet5-MNIST-PyTorch

LeNet5-MNIST-PyTorch

LeNet-5MNIST

PyTorch实现LeNet-5识别MNIST数据集

simple-ocr-opencv

simple-ocr-opencv

OCRPython

基于OpenCV和NumPy的轻量级Python OCR工具

PaddleOCR-json

PaddleOCR-json

PaddleOCR-jsonOCR

基于PaddleOCR的跨平台离线文字识别组件

MLKit

MLKit

MLKit机器学习

Android机器学习开发的高效工具库

gImageReader

gImageReader

gImageReaderOCR软件

基于tesseract-ocr的开源图像文字识别工具 支持多格式处理

tesserocr

tesserocr

tesserocrOCR

Python封装的OCR引擎简化技术集成

gosseract

gosseract

gosseractOCR

Go语言OCR解决方案 利用Tesseract C++库

tesseract-ocr-for-php

tesseract-ocr-for-php

Tesseract OCRPHP

用于PHP的Tesseract OCR封装库

trace.moe

trace.moe

trace.moe动漫场景搜索

将动漫截图精准溯源的开源搜索引擎

SikuliX1

SikuliX1

SikuliX自动化测试

跨平台的图像识别自动化工具