pytracking

基于PyTorch的开源视觉目标跟踪和视频对象分割框架

视觉目标跟踪视频目标分割 PyTorch 深度学习计算机视觉 Github 开源项目

PyTracking是基于PyTorch的开源视觉目标跟踪和视频对象分割框架。它实现了多个先进的跟踪算法,如TaMOs、RTS和ToMP,并提供完整的训练代码和预训练模型。该框架包含用于实现和评估视觉跟踪器的库,涵盖常用数据集、性能分析脚本和通用构建模块。其LTR训练框架支持多种跟踪网络的训练,提供丰富的数据集和功能。

Github

介绍相关项目

Transfer-Learning-Library - 高效且易用的迁移学习库，支持多种算法和任务

APIGithubPyTorchTLlibTransfer Learning开源项目机器学习

Transfer Learning Library (TLlib) 是一个开源的迁移学习库，基于PyTorch设计，具备高性能和易用性。该库支持多种方法，如域对齐、域转换和半监督学习，适用于分类、回归、目标检测、分割和关键点检测等任务。提供丰富的示例代码和详细文档，并支持pip安装。这是研发新算法或应用现有算法的理想工具，适用于研究和工程实践。

benchmark_results - 前沿视觉追踪技术的最新论文和研究动态

AAAICVPRGithubICCVSiamRPN++开源项目视觉跟踪

本页面汇总了包括CVPR、AAAI、和ICCV在内的顶级会议上视觉对象跟踪领域的论文。详细介绍包括Siam R-CNN、PrDiMP等在内的多种跟踪技术及其实现代码与研究要点。

lightning-pose - 基于PyTorch Lightning的高效姿态估计框架

GithubLightning Pose姿态估计开源项目深度学习计算机视觉

Lightning Pose是一个基于PyTorch Lightning的姿态估计框架，利用NVIDIA DALI加速未标记视频的训练。框架集成了TensorBoard、FiftyOne和Streamlit等评估工具，支持已标记数据和未标记视频的模型训练与评估。项目还提供浏览器应用，涵盖数据标注、模型训练到结果可视化的完整流程。此外，团队开发的Ensemble Kalman Smoother (EKS)后处理器可与多种姿态估计包兼容。

vision3d - PyTorch驱动的开源激光雷达感知库

3D检测GithubLIDAR感知PV-RCNNPyTorchSECOND模型开源项目

Vision 3D是一个基于PyTorch的开源库，专注于激光雷达感知领域。该项目以代码简洁性为核心，便于扩展新模型和数据集。目前已实现SECOND算法，并部分完成PV-RCNN。虽然开发已暂停，但项目仍提供详细文档和示例，支持研究人员和开发者在3D目标检测领域的应用。Vision 3D作为开源工具，欢迎社区贡献，为激光雷达感知研究提供了有价值的资源。

DeepLabCut - 无标记动物姿态估计工具箱

DeepLabCutGithub动物姿态估计开源工具箱开源项目神经科学应用行为追踪

DeepLabCut是一个无标记动物姿态估计工具箱。此工具适用于各类动物行为的分析，并通过TensorFlow和PyTorch加强模型训练功能。它整合了多种新技术，如MobileNetV2s与EfficientNets，有效提升了效率与准确性。项目提供多语种文档与在线课程，方便用户快速掌握实时多动物追踪及三维姿态估计技术。DeepLabCut已应用于多种场合并获得验证，通过社区持续的优化适用于从神经科学到生态研究的广泛领域。

GeoSeg - 遥感图像语义分割框架支持多种数据集和先进模型

GeoSegGithubVision Transformer开源项目深度学习语义分割遥感图像

GeoSeg是一个开源的遥感图像语义分割工具箱,基于PyTorch等框架开发。它专注于先进视觉Transformer模型,支持多个遥感数据集,提供统一训练脚本和多尺度训练测试功能。项目实现了Mamba、Vision Transformer和CNN等多种网络架构,为遥感图像分割研究提供统一基准平台。

robotic-transformer-pytorch - RT1机器人控制Transformer模型的PyTorch实现

GithubRT1人工智能开源项目机器人变形金刚深度学习计算机视觉

本项目是Google Robotics团队RT1（Robotic Transformer）的PyTorch实现版本。RT1是一个结合视觉和自然语言处理的机器人控制Transformer模型。该实现包含MaxViT视觉主干网络和RT1核心模型，支持视频输入和文本指令处理。项目提供简洁API，实现了条件采样和跨注意力等功能，可应用于多种机器人控制场景。

open-metric-learning - 开源的PyTorch度量学习框架支持多模态嵌入训练

GithubPyTorchopen-metric-learning嵌入向量度量学习开源项目检索系统

open-metric-learning是一个基于PyTorch的开源度量学习框架，用于训练和验证高质量嵌入模型。它提供端到端流水线、实用案例和预训练模型库，支持图像和文本等多种模态。该框架具有统一的检索结果处理和评估方法，适用于人脸识别、商品搜索等嵌入学习任务。已被多家知名公司和机构采用，是一个功能丰富、易于上手的度量学习工具。

jetson-inference - 深度学习部署与实时视觉识别

GithubNVIDIA JetsonPyTorchTensorRT实时视觉开源项目深度学习

NVIDIA Jetson设备上的深度学习推理和实时视觉处理库。使用TensorRT优化GPU网络运行，支持C++和Python, 以及PyTorch模型训练。功能包括图像分类、物体检测、语义分割等，适用于多种应用场景，如实时摄像头流和WebRTC网络应用。

multimodal - PyTorch多模态模型开发框架

GithubPyTorchTorchMultimodal多模态模型开源项目机器学习深度学习

TorchMultimodal是基于PyTorch的多模态模型开发框架，提供模块化构建块和预训练模型，支持ALBEF、BLIP-2、CLIP等多种架构。该框架包含训练、微调和评估示例，可用于构建内容理解和生成模型。TorchMultimodal整合了PyTorch生态系统，便于研究人员复现和开发先进的多模态多任务模型。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号