#视频处理

DreamScene4D: 从单目视频生成动态多物体场景的突破性技术

3 个月前
Cover of DreamScene4D: 从单目视频生成动态多物体场景的突破性技术

VSET: 革新视频处理的图形化工具

3 个月前
Cover of VSET: 革新视频处理的图形化工具

Wav2Lip: 准确实现视频口型同步的智能工具

3 个月前
Cover of Wav2Lip: 准确实现视频口型同步的智能工具

Vid2Avatar: 从野外视频重建3D人体模型的突破性技术

3 个月前
Cover of Vid2Avatar: 从野外视频重建3D人体模型的突破性技术

TurnVoice: 革新视频声音转换和翻译的开源工具

3 个月前
Cover of TurnVoice: 革新视频声音转换和翻译的开源工具

ComfyUI-AdvancedLivePortrait: 为静态人像照片赋予生命的AI工具

3 个月前
Cover of ComfyUI-AdvancedLivePortrait: 为静态人像照片赋予生命的AI工具

Deep-Live-Cam: 革命性的实时人脸替换和一键式视频换脸技术

3 个月前
Cover of Deep-Live-Cam: 革命性的实时人脸替换和一键式视频换脸技术

Subvert:革新视频字幕生成的开源项目

3 个月前
Cover of Subvert:革新视频字幕生成的开源项目

深入探索Dolphin项目:一个基于大语言模型的视频交互平台

3 个月前
Cover of 深入探索Dolphin项目:一个基于大语言模型的视频交互平台

X-AnyLabeling: 革新数据标注的智能工具

3 个月前
Cover of X-AnyLabeling: 革新数据标注的智能工具
相关项目
Project Cover

backgroundremover

BackgroundRemover是一款使用AI技术为图像和视频去除背景的命令行工具。该工具支持高效的背景处理能力,提供多种模型选择及高级设置以适应不同的处理需求。无论是静态图像还是动态视频,BackgroundRemover均能高质量完成背景透明处理,是设计师和视频制作人员的得力助手。

Project Cover

X-AnyLabeling

X-AnyLabeling是一个集合先进模型技术的强大标注工具,集成AI推理引擎,支持图像与视频处理。该工具支持单帧与批量预测,适用于分类、检测、分割和OCR等视觉任务,兼容多种标注样式与主流标签格式。通过使用GPU加速推理,X-AnyLabeling 保证高效率和高精度的处理性能,突出其技术优势。

Project Cover

dolphin

Dolphin是一个基于大型语言模型的通用视频互动平台,专注于视频理解、处理和生成。该平台支持视频问答、视频剪辑、字幕添加、音频提取及生成等功能,旨在提升视频处理的智能化水平。用户可通过文本生成视频、姿态到视频转换及视频图像转换等多种方式进行创作。项目持续更新,欢迎社区贡献和拉取请求,适用于北航和南洋理工大学的科研项目。

Project Cover

subvert

Subvert是一款开源工具,可以借助OpenAI技术快速生成视频字幕、章节和摘要。只需通过Docker进行简单安装和一行命令即可启动应用,实现高效的视频处理。用户可通过调整项目设置生成所需的章节和摘要,非常适合YouTube等平台上的内容创作者。该项目仍在开发中,欢迎反馈问题以优化用户体验。

Project Cover

Macaw-LLM

Macaw-LLM项目通过整合图像、视频、音频和文本数据,创新了多模态语言建模。该项目基于CLIP、Whisper和LLaMA等先进模型,实现了高效的数据对齐和一步到位的指令微调,创建了丰富的多模态指令数据集,涵盖多种任务。项目强调简单快速的对齐策略,展示出强大的多模态处理能力,有效提升了跨模态数据的解析和理解。

Project Cover

FILTER.js

FILTER.js是一款纯JavaScript库,专注于图像和视频处理,支持HTML5特性如Canvas、Web Workers、WebAssembly和WebGL,并兼容Node.js环境。提供多种功能强大的滤镜和插件,实现高效的CPU和GPU并行处理。支持自定义构建,适用于各种应用需求。

Project Cover

ComfyUI-AdvancedLivePortrait

ComfyUI-AdvancedLivePortrait是一个开源的人像动画工具,提供实时预览功能。这个项目允许用户编辑照片中的面部表情,将表情插入视频,创建多表情动画,并从样本照片中提取表情。它支持部分表情提取,可通过ComfyUI-Manager安装。该工具提供工作流和样本数据,支持视频表情添加以及表情数据的保存和加载。

Project Cover

roop-unleashed

roop-unleashed是一个开源的AI换脸项目,无需训练即可实现高质量图像和视频换脸。该工具提供浏览器图形界面,支持多种换脸模式、批量处理、遮罩生成和人脸增强等功能。项目还包括实时换脸摄像头和视频处理工具,主要用于技术研究和学术目的。roop-unleashed定期更新,不断改进性能和用户体验。

Project Cover

gpupixel

GPUPixel是一个实时高性能图像和视频滤镜库,基于OpenGL/ES开发,支持iOS、Android、Mac、Windows和Linux平台。采用C++11编写,内置商用级美颜滤镜。GPUPixel体积小巧,易于编译和集成,适合需要跨平台滤镜功能的开发者。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号