热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#图像Transformer
trocr-base-stage1 - 以Transformer为基础的图像文字识别预训练模型
Hugging Face
文本Transformer
开源项目
光学字符识别
TrOCR
模型
Huggingface
图像Transformer
Github
此预训练模型使用Transformer进行光学字符识别(OCR),为TrOCR模型的一部分。其图像编码器采用BEiT权重初始化,文本解码器则使用RoBERTa权重,处理图像为固定大小的16x16像素块并线性嵌入。适用于单行文本图像的OCR任务,并支持针对特定任务进行微调,兼容PyTorch实现。
1
1
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号