Project Icon

AiOS

先进的全流程人体姿态与形状估计框架

AiOS是一个创新的人体姿态和形状估计框架,采用全新的全流程方法。该项目通过三阶段的渐进式处理,实现高精度的SMPL-X参数回归。AiOS支持多人场景分析,并能有效处理复杂遮挡情况。在AGORA和BEDLAM等多个基准数据集上,AiOS展现出卓越的性能表现。这一开源项目为计算机视觉和人机交互等领域提供了有力的研究工具。

Parts2Whole - 多参考框架实现可控人像生成
GithubParts2Whole人像生成参考框架开源项目深度学习计算机视觉
Parts2Whole提出新型框架,利用多个参考图像生成定制人像。该框架包含语义感知外观编码器和多图像条件生成的共享自注意力机制,能精确选择人体部位实现高度可控生成。项目开源全套代码、模型和数据集,为人像生成研究提供完整解决方案。
ai2thor - AI智能体交互研究的高仿真仿真环境
AI2-THORGithub交互式环境人工智能开源项目机器人学习计算机视觉
AI2-THOR是一个高仿真的交互式AI研究框架。它包含200多个精细场景、2600多个家居物品和200多种交互动作,支持多类智能体和图像模态。框架具备逼真的物理交互,适用于导航和操作任务研究。同时提供丰富元数据和自定义奖励功能。AI2-THOR为体现式AI研究提供了功能全面的仿真环境。
LivePortrait - 高效的面部动画技术与重定向控制
GithubLivePortraitPyTorch实现人像动画实时渲染开源项目深度学习热门
LivePortrait是一种基于PyTorch实现的先进面部动画技术,支持高效的人像动画合成与重定向控制。项目提供了全面的预训练模型和易于使用的界面,支持Windows、macOS和Linux系统。用户可以快速开始,利用预训练权重生成高质量的动画肖像。支持静态图像与视频的动画生成,可广泛应用于虚拟现实、游戏开发和在线教育等领域。
awesome-virtual-try-on - 虚拟试衣研究的综合资源汇总
Github人工智能图像生成开源项目深度学习虚拟试衣计算机视觉
该项目整理了虚拟试衣(VTON)领域的研究资源,包括最新论文、代码、数据集和演示。内容涵盖基于提示、2D/3D图像、混搭、野外场景和多姿态引导等多个研究方向,并提供相关会议workshop信息。为虚拟试衣技术的研究人员和开发者提供全面的参考资料。
ailia-models - 跨平台AI推理SDK,支持多种编程语言和模型
AI模型GPU加速Githubailia SDK开源项目跨平台高性能推理
ailia SDK 是一款跨平台高速AI推理工具,适用于Windows、Mac、Linux、iOS、Android、Jetson和Raspberry Pi平台,并支持Unity (C#)、Python、Rust、Flutter (Dart) 和 JNI。该SDK通过Vulkan和Metal利用GPU增强计算性能。用户可通过pip3安装并使用丰富的预训练模型库,包括动作识别、异常检测和音频处理等领域。最新更新增加了mahalanobis-ad和t5_base_japanese_ner模型。
flame - 基于自然语言的3D人体动作生成与编辑框架
FLAMEGithub人体动画动作合成开源项目深度学习自然语言
FLAME是一个开源的3D人体动作生成和编辑框架,能够根据自然语言描述合成和修改动作。该项目利用深度学习技术将文本转换为人体动作,适用于动画制作、游戏开发等领域。FLAME支持多样化的动作生成和精确编辑,为研究人员和开发者提供了灵活的工具。
OpenShape_code - 革新3D形状表示方法 实现开放世界理解
3D形状表示GithubOpenShape多模态检索开放世界理解开源项目零样本分类
该项目开发了新型3D形状表示方法,通过大规模训练实现开放世界理解。这一技术在零样本3D形状分类、检索和语义理解任务中表现优异,支持多模态交互并能进行点云描述和图像生成。提供的在线演示、预训练模型和训练代码为3D视觉研究与应用拓展了新方向。
unified-io-2 - 跨模态人工智能的开源新标杆
GithubUnified-IO 2人工智能多模态模型开源项目机器学习深度学习
Unified-IO 2是一个开源的多模态AI框架,集成视觉、语言、音频和动作处理能力。项目提供完整代码支持演示、训练和推理,适用于TPU和GPU环境。基于T5X优化,内含多规格预训练模型和丰富数据集。其跨模态学习和生成能力为AI研究与应用提供了新的可能性。项目采用模块化设计,便于研究人员和开发者进行二次开发和定制。Unified-IO 2支持多种数据格式和预处理流程,为不同任务场景提供灵活解决方案。其开源性质促进了AI社区的协作与创新,为多模态AI技术的进步做出贡献。
Depth-Anything - 大规模无标注数据驱动的强大单目深度估计模型
Depth AnythingGithub人工智能图像处理开源项目深度估计计算机视觉
Depth Anything是一款基于大规模数据训练的单目深度估计模型。它利用150万标注图像和6200万无标注图像进行训练,提供小型、中型和大型三种预训练模型。该模型不仅支持相对深度和度量深度估计,还可用于ControlNet深度控制、场景理解和视频深度可视化等任务。在多个基准数据集上,Depth Anything的性能超越了此前最佳的MiDaS模型,展现出优异的鲁棒性和准确性。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号