#TrOCR
pix2text-mfr - 精确数学公式识别,转换为LaTeX文本
Pix2Text模型性能HuggingfaceTrOCR数学公式识别LaTeX开源项目模型Github
Pix2Text-MFR模型基于TrOCR架构,支持将数学公式图片转化为LaTeX文本,适用于印刷体和手写公式的高效识别。最新版Pix2Text V1.0提升了模型精度,但该模型的使用面仅限于数学公式图片。
trocr-base-stage1 - 以Transformer为基础的图像文字识别预训练模型
Hugging Face文本Transformer开源项目光学字符识别TrOCR模型Huggingface图像TransformerGithub
此预训练模型使用Transformer进行光学字符识别(OCR),为TrOCR模型的一部分。其图像编码器采用BEiT权重初始化,文本解码器则使用RoBERTa权重,处理图像为固定大小的16x16像素块并线性嵌入。适用于单行文本图像的OCR任务,并支持针对特定任务进行微调,兼容PyTorch实现。