hcaptcha-challenger
hCaptcha Challenger是一款通过嵌入MoE(ONNX)技术解决hCaptcha挑战的项目,无需依赖Tampermonkey脚本或第三方反机器人服务。支持ResNet、YOLOv8和ViT等多种模型,涵盖图像分类和选择题等多种挑战类型。项目提供详细的工作流程与数据集处理方法,并持续更新模型和资源,确保解决方案的高效与先进。
ffcv-imagenet
ffcv-imagenet是一个高效的ImageNet训练框架,采用单文件PyTorch脚本实现。该项目能在标准方法1/10的时间内达到相同精度,支持多GPU并行和多模型同时训练。框架提供丰富的配置选项,结合FFCV数据加载和优化训练流程,使研究人员能更快迭代实验并获得高质量模型。项目还包含多种预设配置,适用于不同的训练需求和硬件环境。
bit-50
Big Transfer (BiT) 是一种通过扩展预训练提升视觉任务中深度神经网络表现的方法,优化样本效率和超参数调整。该方法在超过20个数据集上具备优异的迁移能力,并可适应不同数据规模的需求。在ILSVRC-2012数据集上,BiT达到了87.5%的top-1准确率,在CIFAR-10数据集上取得99.4%的准确率,并在19项视觉任务基准测试中获得76.3%的成绩。这使得BiT在图像分类任务中得到广泛应用。
resnet50_gn.a1h_in1k
resnet50_gn.a1h_in1k是基于ResNet-B架构的图像分类模型,集成了多项先进训练技术。模型采用ReLU激活函数、单层7x7卷积与池化、1x1卷积快捷连接下采样等结构。在ImageNet-1k数据集上训练时,应用了LAMB优化器、增强型dropout、随机深度和RandAugment等方法。模型参数量为25.6M,GMACs为4.1,训练输入尺寸为224x224,测试输入尺寸为288x288。该模型可应用于图像分类、特征提取和图像嵌入等多种计算机视觉任务。
vit_base_r50_s16_384.orig_in21k_ft_in1k
本模型结合ResNet与Vision Transformer优势,在大规模ImageNet-21k数据集上预训练,并在ImageNet-1k上微调,实现高效准确的图像分类。具备9900万参数,支持384x384像素输入,可用于分类任务和特征提取。研究人员可通过timm库轻松应用此模型,进行推理或深入研究。
resnet152.a1h_in1k
resnet152.a1h_in1k是基于ResNet Strikes Back改进的ResNet152模型。该模型采用ReLU激活函数、单层7x7卷积加池化、1x1卷积shortcut下采样等特性,在ImageNet-1k数据集上训练。模型参数量60.2M,GMACs 11.6,激活大小22.6M。288x288图像输入下Top-1准确率83.46%,Top-5准确率96.54%。可用于图像分类和特征提取。
resnet101.a1h_in1k
resnet101.a1h_in1k是基于ResNet-B架构的图像分类模型,在ImageNet-1k数据集上训练。模型采用ReLU激活函数、7x7卷积和池化层、1x1卷积短路下采样等结构。支持图像分类、特征图提取和图像嵌入功能,参数量44.5M,224x224输入下GMAC为7.8。在ImageNet验证集上Top-1准确率82.8%,Top-5准确率96.32%。
resnet-18
ResNet-18是一种基于深度残差学习的图像分类模型,在ImageNet-1k数据集上训练。通过引入残差连接,该模型突破了深度网络训练的限制,实现了高达1000层的网络结构。ResNet-18在2015年ILSVRC和COCO竞赛中的胜利,标志着计算机视觉领域的重要进展。这个模型适用于多种图像分类任务,并支持快速部署和微调。研究者和开发者可以通过Hugging Face的transformers库轻松使用ResNet-18进行图像识别研究和应用开发。
res2next50.in1k
res2next50.in1k是基于Res2Net架构的图像分类模型,在ImageNet-1k数据集上训练。该模型采用多尺度ResNet结构,参数量为2470万,计算复杂度为4.2 GMACs。它不仅可用于图像分类,还支持特征图提取和图像嵌入等任务。res2next50.in1k在性能和灵活性方面表现出色,适用于广泛的计算机视觉应用。研究人员可通过timm库便捷地使用和评估此模型。