Project Icon

Vehicle-Detection

深度学习与YOLO算法实现的车辆检测系统

Vehicle-Detection项目结合深度学习和YOLO算法实现车辆检测。项目提供完整工作流程,涵盖数据集准备、模型训练和测试。采用YOLOv5预训练模型微调,集成wandb工具监控性能。项目包含自定义车辆数据集,并提供详细的安装、训练和测试指南。

End-to-end-Autonomous-Driving - 端到端自动驾驶研究资源综合集成
CARLAGithub开源项目机器学习端到端自动驾驶计算机视觉
该项目整合端到端自动驾驶研究资源,涵盖学习材料、研讨会、论文集、基准测试、数据集及竞赛信息。旨在为自动驾驶研究提供全面参考,推动技术发展。内容定期更新,欢迎社区参与贡献。
trt_yolo_video_pipeline - 基于TensorRT的多路视频分析处理框架
GithubTensorRT多路并发开源项目目标检测硬件编解码视频分析
TRT-VideoPipeline是一个基于TensorRT的多路视频分析处理框架。该项目支持YOLO系列模型推理,实现单模型多显卡多实例负载调度,并利用GPU进行数据处理。框架支持NVIDIA硬件编解码,可处理RTSP、RTMP、MP4等多种视频格式。其模块化设计便于功能节点的灵活组合,适应不同应用场景。
ssd.pytorch - PyTorch实现的高效SSD目标检测器,兼容多数据集与实时可视化
GithubPyTorchSSD开源项目数据集训练评估
该项目实现了基于PyTorch的SSD目标检测器,支持VOC和COCO数据集,并可使用Visdom进行训练过程中的实时损失可视化。页面包含详细的安装、训练和评估指南,并提供预训练模型的使用说明。项目展示了高效性能,并包含未来功能更新计划,帮助开发者快速上手并扩展应用。
Cam2BEV - 深度学习实现多视角车载图像到语义分割鸟瞰图转换
Cam2BEVGithub开源项目深度学习自动驾驶语义分割鸟瞰图
该项目提出一种深度学习方法,将多个车载摄像头图像转换为语义分割鸟瞰图(BEV)。采用合成数据集训练,可良好泛化到真实场景。方法使用语义分割图像作为输入,缩小了仿真与真实数据的差距,无需手动标注。项目开源了代码、网络架构和数据集,适用于自动驾驶环境感知研究。相比传统逆透视映射,该方法在处理3D物体和遮挡区域时表现更佳。
multispectral-object-detection - 多光谱图像融合的高效目标检测方法
GithubTransformerYOLOv5多光谱目标检测开源项目计算机视觉跨模态融合
该项目提出了Cross-Modality Fusion Transformer (CFT)多光谱目标检测方法,利用Transformer架构融合RGB和热红外图像信息。CFT在FLIR、LLVIP等数据集上取得了优秀的检测结果,尤其在夜间场景表现突出。这为多光谱目标检测提供了一种新的解决方案。
Pytorch-UNet - PyTorch实现的高效U-Net语义分割模型
CarvanaGithubPyTorchU-Net开源项目深度学习语义分割
Pytorch-UNet项目提供定制的U-Net实现,支持多类别分割任务,包括车体遮罩、肖像分割和医学图像分割。兼容PyTorch 1.13及以上版本,提供Docker镜像和预训练模型,便于集成和使用。模型在高分辨率图像上训练,取得了0.988的Dice系数,并支持自动混合精度,可通过Weights & Biases实时监控训练进度。
3D-deformable-attention - 3D可变形注意力技术提升自动驾驶物体检测精度
3D目标检测BEVFormerDFA3DGithub开源项目深度估计特征提升
3D-deformable-attention项目提出了3D可变形注意力(DFA3D)操作符,用于2D到3D特征提升。该方法首先利用深度估计将2D特征扩展到3D空间,再通过DFA3D聚合3D特征。这种方法缓解了深度歧义问题,并支持逐层特征细化。在多个基准测试中,DFA3D平均提高1.41 mAP,高质量深度信息下最高提升15.1 mAP。研究结果显示DFA3D在自动驾驶3D目标检测等任务中具有较大潜力。
carla_garage - 突破端到端自动驾驶模型的隐藏偏差 高性能仿真平台
CARLAGithub开源项目深度学习端到端模型自动驾驶计算机视觉
基于CARLA仿真器的端到端自动驾驶研究开源项目。提供可配置代码、文档和高性能预训练模型,揭示了端到端驾驶模型的隐藏偏差。在多个基准测试中表现优异,支持数据生成、模型训练和评估,有助于研究人员探索自动驾驶前沿问题。
YOLOv8-TensorRT-CPP - 用C++和TensorRT实现高效的YOLOv8模型推理
CPPGithubTensorRTYOLOv8开源项目深度学习目标检测
本文介绍了如何使用TensorRT的C++ API实现YOLOv8模型的推理,支持目标检测、语义分割和身体姿态估计,包括系统要求、安装步骤、模型转换和项目构建方法。内容中强调了在GPU上运行推理的注意事项和性能基准测试,提供了从PyTorch到ONNX模型转换的详细步骤,是开发计算机视觉应用的参考资料。
license_plate_recognizer - 精准识别车牌文字的OCR模型,适合自动化监控应用
GithubHuggingfaceLicense Plate RecognitionOCRTransformer模型字符错误率开源项目模型自动监控
此模型基于微软的trocr-base-handwritten,专门开发用于从车牌图像中提取文本,特别适用于OCR车牌识别任务,字符错误率为0.0036,适合各类车辆自动化监控系统。利用TrOCR模型并在PawanKrGunjan/license_plates数据集上微调,能高效将图像转换为文本。在低光或者低分辨率下,性能可能下降,且可能会受到不同地区车牌设计差异的影响。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号