Project Icon

UCF-SST-CitySim1-Dataset

无人机车辆轨迹数据集,实现安全研究和数字孪生应用

CitySim数据集包含从12个不同地点录制的1140分钟无人机视频中提取的高精度车辆轨迹,采用30 FPS,覆盖多种道路类型。通过五步程序确保轨迹精度,并提供旋转边界框信息来改进安全评估。相较于其他视频基础轨迹数据集,CitySim记录了更多严重的安全事件,支持自动驾驶和位置安全分析研究。此外,还提供录制地点的3D基础地图和信号定时信息,助力数字孪生应用。

Vehicle-Detection - 深度学习与YOLO算法实现的车辆检测系统
GithubYOLO算法开源项目数据集模型训练深度学习车辆检测
Vehicle-Detection项目结合深度学习和YOLO算法实现车辆检测。项目提供完整工作流程,涵盖数据集准备、模型训练和测试。采用YOLOv5预训练模型微调,集成wandb工具监控性能。项目包含自定义车辆数据集,并提供详细的安装、训练和测试指南。
caldera - 开源USD场景数据集 推动环境几何研究
CalderaCall of DutyGithubOpenUSD场景编辑开源项目环境几何
Caldera是基于《使命召唤:战区》地图的OpenUSD场景数据集,包含1750万几何体和20亿点数据,覆盖4平方英里区域。该数据集提供丰富的空间元素关系,旨在推动大规模环境几何构建和分析研究。它还包含玩家行为数据点云,为游戏环境编辑和更新研究提供了宝贵资源。
city-roads - 城市道路可视化工具 全面呈现城市街道
GitHubGithubOpenStreetMapoverpass API城市道路渲染开源项目数据可视化
city-roads是一款开源的城市道路可视化工具,能够渲染任意城市的全部道路。该工具使用OpenStreetMap数据和overpass API获取道路信息,提供简洁的用户界面和丰富的脚本功能。city-roads预先索引了3000多个大型城市,支持快速渲染,同时也可处理自定义区域。这个开源项目适用于城市规划、地图可视化和艺术创作等多个领域。虽然在渲染超大区域时可能存在性能限制,但它仍是创建城市艺术作品的理想选择。
abstreet - 开源城市交通规划与模拟工具
A/B StreetGithubOpenStreetMap交通模拟城市规划开源软件开源项目
A/B Street是一个开源城市交通项目,专注于规划、模拟和优化城市交通方案。该项目提供交通模拟、街道编辑和自行车网络规划等功能,适用于全球范围。通过透明、可重现的分析工具和游戏化方式,A/B Street使城市规划变得易懂且有趣,鼓励公众参与城市未来的塑造。
L-SVD - 推动人工智能情感分析研究的大规模视频数据集
GithubL-SVD开源项目情感识别机器学习深度学习视频数据集
L-SVD数据集包含20,000多个短视频片段,涵盖8种人类情绪,为情感识别研究提供重要资源。该数据集特点包括精确的情感标注、统一的视频质量和全球社区参与。L-SVD致力于推动认知科学、心理学、计算机科学和医学等领域的研究,为情感AI、机器学习和深度学习的发展奠定基础。
4DMOS - 3D LiDAR数据中的稀疏4D卷积移动物体分割
4DMOSGithubLiDAR开源项目移动物体分割稀疏4D卷积语义KITTI
4DMOS是一个基于稀疏4D卷积的3D LiDAR数据移动物体分割项目。该方法通过MinkowskiEngine处理点云序列,提取时空特征实现移动目标识别。项目开源了预训练模型、Docker环境和使用说明,支持在SemanticKITTI数据集上应用。研究成果发表于IEEE RA-L,为自动驾驶和机器人导航提供了新的技术方案。
segformer-b5-finetuned-cityscapes-1024-1024 - SegFormer-b5模型在CityScapes数据集上微调的语义分割应用
GithubHuggingfaceSegFormerTransformer图像处理开源项目模型深度学习语义分割
SegFormer-b5是一个在CityScapes数据集上微调的语义分割模型。它结合层次化Transformer编码器和轻量级MLP解码头,在1024x1024分辨率下展现优秀性能。该模型经ImageNet-1k预训练后,通过添加解码头并在特定数据集微调,可应用于自动驾驶场景理解等多种语义分割任务。
MiraData - 长时视频数据集助力AI视频生成研究
GithubMiraData开源项目结构化标注视频数据集视频生成长视频
MiraData是一个为长视频生成任务设计的大规模数据集。其特点包括平均72秒的视频长度和详细的结构化字幕。数据集提供330K、93K、42K和9K四个版本,每个视频配有六类字幕:主要对象、背景、风格、相机运动、简短摘要和详细描述。这些特性使MiraData成为改进长序列视频处理和镜头转换建模的重要资源。
CamLiFlow - 双向相机LiDAR融合实现光流和场景流联合估计
CamLiRAFTGithub光流估计双向融合场景流估计开源项目计算机视觉
CamLiFlow和CamLiRAFT是利用双向相机-LiDAR融合进行光流和场景流联合估计的开源方法。这两种算法在FlyingThings3D和KITTI等数据集上实现了领先性能。CamLiRAFT改进了训练流程,增强了泛化能力,能够处理非刚性运动。该项目开源了预训练模型、结果和多数据集评估训练代码,为相关研究提供了有力基线。
RGBD-semantic-segmentation - RGB-D语义分割技术发展综述及性能评估
GithubRGBD语义分割开源项目性能对比数据集深度学习评估指标
本项目汇总了RGB-D语义分割领域的最新研究成果,提供详尽的论文列表和性能对比。涵盖NYUDv2等主流数据集的基准结果,包括像素精度、平均精度、mIoU等关键指标。通过定期更新反映该领域最新进展,为计算机视觉研究人员提供全面的参考资源。项目内容还包括数据集介绍、评估指标说明和详细的性能对比表格,全面呈现RGB-D语义分割技术的发展脉络。对于想深入了解该领域的研究人员和工程师而言,这是一个高价值的信息聚合平台。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号