#DPT
dpt-beit-base-384 - 基于BEiT主干的DPT模型实现单目深度估计
图像处理神经网络计算机视觉深度估计Huggingface模型Github开源项目DPT
DPT (Dense Prediction Transformer) 是一个基于BEiT主干的模型,专门用于单目深度估计。该模型在140万张图像上训练,可进行零样本深度估计。采用Transformer架构,具备强大的密集预测能力,能生成高质量深度图。模型可通过Python代码或pipeline API轻松使用,为计算机视觉任务提供了有力工具。
dpt-beit-large-512 - BEiT架构驱动的高性能单目深度估计模型
BEiTGithub开源项目计算机视觉DPTHuggingface单目深度估计MiDaS模型
dpt-beit-large-512是一款基于BEiT架构的单目深度估计模型,采用512x512高分辨率在140万张图像上训练。模型能从单一图像推断详细深度信息,在多项基准测试中表现卓越。作为MiDaS v3.1系列中的佼佼者,该模型在3D重建、自动驾驶等计算机视觉任务中展现出强大的深度估计能力。