Project Icon

EasyCV

基于PyTorch的全能计算机视觉工具箱,支持自监督学习和Transformer模型

EasyCV是基于PyTorch的全能计算机视觉工具箱,专注于自监督学习、Transformer模型和主要视觉任务,包括图像分类、度量学习、目标检测和姿态估计。该工具箱提供了最先进的自监督算法如SimCLR、MoCO V2、Swav、DINO和基于掩码图像建模的MAE。它拥有简单综合的推理接口,并支持多种预训练模型。EasyCV支持多GPU和多工作者训练,利用DALI优化数据处理,使用TorchAccelerator和fp16加速训练,并通过PAI-Blade优化推理性能。

deep_sort_pytorch - 使用PyTorch实现的Deep Sort多目标追踪算法
Deep SortGithubMask RCNNPyTorchYOLOv3YOLOv5开源项目
本项目实现了基于PyTorch的Deep Sort多目标追踪算法,结合CNN模型进行特征提取,并采用YOLOv3和YOLOv5等先进检测器代替原始的FasterRCNN。项目还支持多GPU训练和多类别目标追踪,并引入了Mask RCNN实例分割模型。用户可以使用Python和PyTorch轻松启动和自定义项目,适用于行人再识别等任务。详细的更新日志和使用指南使其对机器学习及计算机视觉爱好者和研究人员尤为有用。
myvision - 免费在线图像标注工具
COCO-SSDGithubMyVision图像注释工具开源项目数据集机器学习
MyVision是一款免费在线图像标注工具,旨在生成计算机视觉机器学习训练数据。它具有快速标注、多种数据集格式支持和现有项目导入功能。还利用COCO-SSD预训练模型自动标注对象,保障数据隐私。无需任何设置,只需打开index.html文件即可使用。适用于大数据集的高效工作流程,并支持英文和中文。
torch-cam - 利用 PyTorch 中卷积层的特定于类的激活的简单方法
GithubGrad-CAMPyTorchTorchCAMVisualize heatmapclass activation map开源项目
TorchCAM使用PyTorch的钩子机制,简化了获取卷积层类激活图的过程。该工具支持多种CAM方法,能够与任意PyTorch模型集成。用户只需几行代码即可设置并检索激活图,并可进行可视化。项目提供详尽的文档和多种演示应用,适用于深度学习模型解释需求的开发人员。
pylabel - 图像数据集转换与标注工具
GithubPyLabelPython包图像数据集开源项目注释转换目标检测
PyLabel是一个Python包,可用于为计算机视觉模型(如PyTorch和YOLOv5)准备图像数据集。该工具支持在不同标注格式之间进行转换(如COCO到YOLO),并在Jupyter notebook中提供AI辅助标注功能。PyLabel允许使用单行代码转换标注格式,将注释数据存储在pandas DataFrame中便于分析,按类分层将数据集分为训练集、测试集和验证集,并支持带边界框的图像可视化,从而使图像数据处理更高效便捷。
facenet-pytorch - Pytorch下基于预训练模型和快速MTCNN的人脸识别技术
Face RecognitionGithubInception Resnet V1MTCNNPytorchVGGFace2开源项目
facenet-pytorch是一个开源项目,利用Pytorch实现的Inception Resnet (V1)模型,已在VGGFace2和CASIA-Webface上预训练。项目还包括高效的MTCNN实现,用于人脸检测。其特点包括快速人脸检测、生成面部识别嵌入、视频流中的人脸跟踪以及从TensorFlow到Pytorch的参数转换。开发者可以通过简单的安装和使用指引快速集成和应用这些高精度、高性能的预训练模型和工具。
DALLE-pytorch - 文本到图像转换的先进实现
DALL-EGithubPytorch图像生成开源项目文本到图像转换自动编码器
基于OpenAI的DALL-E以及CLIP技术,DALLE-pytorch是一种开源的AI解决方案,可将文本高效转化为图像。该工具在Pytorch框架下开发,支持包括OpenAI预训练的VAE在内的多种训练模式。DALLE-pytorch不仅采用了深度可逆网络和稀疏注意力技术,而且提供了高灵活性和可扩展性,适合多种数据集。
C-Tran - Transformer在多标签图像分类中的应用
GithubTransformers图像分类多标签分类开源项目深度学习计算机视觉
C-Tran是一个探索Transformer在多标签图像分类中应用的开源项目。该项目提出了一种通用多标签图像分类方法,在COCO80和VOC20等数据集上展现出优秀性能。项目包含完整的训练和运行指南,涵盖数据处理和模型训练等关键步骤。C-Tran为计算机视觉领域提供了新的研究方向,对推进多标签图像分类技术具有重要意义。
InstructCV - 自然语言指令引导的多任务计算机视觉模型
GithubInstructCV开源项目文本到图像生成深度学习生成扩散模型计算机视觉
InstructCV 项目通过指令调优的文本到图像扩散模型,简化了计算机视觉任务的执行方式。该项目将多个计算机视觉任务转化为文本描述的图像生成问题,并使用涵盖分割、物体检测、深度估计和分类等任务的数据集进行训练。利用大型语言模型生成任务提示,该模型从生成模型转变为指令引导的多任务视觉学习者。项目实现了多种环境配置,包括在Huggingface Spaces的Gradio演示和Google Colab的运行示例,并支持PyTorch 1.5+。
notebooks - 使用 SOTA 计算机视觉模型和技术的示例和教程
DETRGPT-4 VisionGithubRoboflowYOLO开源项目计算机视觉
提供详尽的计算机视觉教程,包括ResNet、YOLO、DETR等经典模型,以及最新的Grounding DINO、SAM和GPT-4 Vision技术。这个资源库适合初学者和专家学习最前沿的计算机视觉方法和应用。
SparseBEV - 多摄像头视频中的高性能稀疏3D目标检测技术
GithubICCV 2023PyTorchSparseBEVnuScenes开源项目立体检测
SparseBEV利用多摄像头视频实现高性能稀疏3D目标检测,得到ICCV 2023的认可,并提供PyTorch实现、训练和评估指南。新发布的SparseOcc展示了全稀疏架构支持多种预训练权重和配置文件。用户可使用提供的代码进行可视化和模型优化,实现高效3D检测。兼容不同版本的PyTorch和CUDA,表现卓越。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号