Project Icon

PHALP

基于3D外观、位置和姿态预测的人体跟踪技术

PHALP是一个开源的3D人体跟踪项目,利用人体3D外观、位置和姿态预测实现精确跟踪。该项目提供完整代码实现,包含安装指南、演示代码、数据集准备和评估工具。PHALP可处理视频文件、YouTube视频和图像目录等多种输入源,并具备多样化的可视化功能。这一工具为人体动作分析和计算机视觉研究提供了有力支持。

Awesome-Human-Activity-Recognition - 人类活动识别领域的全面资源集合
GithubIMU人类活动识别传感器数据可穿戴设备开源项目深度学习
该项目提供了人类活动识别(HAR)领域的全面资源集合,包括最新研究、方法、数据集、工具和潜在研究方向。资源涵盖基于惯性测量单元(IMU)的技术,并按年份整理了重要论文。内容从基础理论到前沿应用,为HAR领域的研究人员和开发者提供了宝贵的参考。
awesome-digital-human - 数字人技术资源集锦 涵盖3D头像生成到虚拟试衣
3D头像生成3D重建Github人体动画开源项目数字人类计算机图形学
该项目整理了数字人领域的前沿研究和资源,包括3D人体重建、头部重建、动画生成等多个方向。内容涉及学术论文和工业应用,涵盖3D头像生成、服装建模、人体重塑等热点。为研究人员和开发者提供了解数字人技术最新进展的全面参考。
phasellm - 探索和评估大型语言模型的框架
API集成GithubPhaseLLM大语言模型开源开源项目性能评估
PhaseLLM是一个创新的框架,旨在帮助用户管理和测试由大型语言模型(LLM)驱动的体验,如ChatGPT及其变种。该框架提供标准化API,兼容OpenAI、Cohere、Anthropic等多家服务提供商,构建评估体系,并新增自动化功能,使开发者和数据科学家能更容易地启动新的产品。适合各类品牌和产品经理,简化和加速大型语言模型的集成与评估过程。
BlendArMocap - Blender的无标记动作捕捉与骨骼动画转换工具
BlendArMocapBlenderFreemocapGithubMediapipe动作捕捉开源项目
BlendArMocap是基于Google Mediapipe的Blender插件,用于无标记动作捕捉和骨骼动画转换。该工具支持从实时视频流或录像中检测人体、手部和面部特征,并能高效将捕捉数据转换到3D角色骨骼上。它还支持导入Freemocap会话数据,并与Rigify人形骨骼兼容。这个开源项目为3D动画制作提供了高效的动作捕捉和骨骼动画转换功能。虽然目前已停止活跃维护,BlendArMocap仍是动画制作者的实用动作捕捉解决方案。
Video-LLaVA - 视频多模态模型,具备像素级定位能力
GithubLMMPG-Video-LLaVA像素级别定锚开源项目视频理解音频上下文
PG-Video-LLaVA通过模块化设计,首次实现视频多模态模型具备像素级定位能力。该框架使用现成的追踪器和创新的定位模块,能够根据用户指令在视频中实现空间定位。引入新的基准测试用于评估基于提示的对象定位性能,并结合音频上下文完善视频内容理解,提高在对话和新闻视频等场景中的适用性。改进的定量基准测试确保更高的透明度和可重复性。
FLAME-Universe - FLAME 3D头部模型的开源资源库
3D头部模型FLAMEGithub人脸重建开源资源开源项目表情动画
FLAME-Universe汇集了FLAME 3D头部模型相关的代码仓库、数据集和研究论文。项目涵盖3D人脸重建、表情合成和说话头像生成等领域,为计算机视觉和图形学研究提供丰富资源。这个开源资源库助力FLAME模型在学术和工业界的广泛应用。
Deep-Learning-for-Tracking-and-Detection - 使用深度学习进行对象检测和跟踪的论文与资源合集
GithubRCNNYOLOdeep learningmulti object trackingobject detection开源项目
本项目汇集了有关深度学习在对象检测和跟踪领域的论文、数据集、代码及各种资源。内容涵盖静态检测、视频检测、多对象跟踪和单对象跟踪等主题,并提供了多种经典模型如RCNN、YOLO、SSD的实现和改进方案。此外,项目还涵盖了图像和视频分割、光流、运动预测等任务的资源,为研究人员和开发者提供了详尽的参考资料。
3D-BoundingBox - 使用深度学习与几何方法,实现高效的3D边界框估计
3D Bounding BoxGithubKittiPyTorchYOLOv3开源项目深度学习
项目提供基于PyTorch的深度学习解决方案,通过结合YOLOv3和2D-3D几何转换,实现高效3D边界框估计。主要功能包括下载预训练权重、通过视频和图像数据进行模型推理和训练,依赖PyTorch和其他深度学习库。项目未来计划是在Kitti数据集上训练自定义YOLO网络和姿态可视化。目前版本每帧处理时间约为0.4秒,并计划进一步提升速度。文档中详细介绍了模型训练步骤及实际应用操作。
SIFU - 单图高精度3D人体重建技术 适用于实际应用场景
3D人体重建GithubSIFU开源项目深度学习计算机视觉隐式函数
SIFU是一项创新的3D人体重建技术,能够从单一图像生成高质量的3D clothed human模型。该技术采用Side-view Conditioned Implicit Function提升特征提取和几何精度,并通过3D Consistent Texture Refinement改善纹理质量。SIFU在处理复杂姿势和宽松服装方面表现突出,适用于3D打印和场景创建等实际应用。作为CVPR 2024的亮点论文,SIFU为真实世界的人体重建任务提供了有效解决方案。
alpaca_farm - 仿真框架助力人类反馈学习研究
AlpacaFarmGithub人工智能偏好反馈开源项目指令跟随语言模型
AlpacaFarm是一个人类反馈学习方法的仿真框架。它提供模拟成对反馈、自动评估和基准实现等功能,降低了指令跟随和对齐研究的成本。框架包含模拟偏好反馈、自动评估和参考方法实现等组件,旨在促进该领域的开放研究。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号