virtual-background

浏览器内实时视频流虚拟背景替换，支持多个机器学习模型

Virtual Background BodyPix MediaPipe ML Kit WebAssembly Github 开源项目

该项目展示了如何在浏览器实时视频流中，添加虚拟背景并切换三种预训练机器学习模型，包括BodyPix、MediaPipe Meet Segmentation和ML Kit Selfie Segmentation。用户可以对桌面和移动设备上的不同模型性能进行比较。此项目提供了详细的实现细节、性能分析及改进建议。

访问官网

Github

介绍相关项目

WebGPT - 基于WebGPU的Transformer模型实现与性能分析

GPUGithubJavaScriptWebGPTWebGPU开源项目模型

WebGPT项目是一款基于WebGPU的Transformer模型应用，使用纯JavaScript和HTML实现。该项目不仅用于技术演示，同时也作为教育资源，支持在主流浏览器中运行，并能管理最多500M参数的模型。主要优化在Chrome v113和Edge Canary等浏览器上，通过WebGPU技术提高运行效率，适合用于学习和研究深度学习模型。

VideoSwap - 通过语义点对应技术实现自定义主体替换的新型视频编辑框架

GithubVideoSwap开源项目扩散模型自定义概念视频主体替换语义点对应

VideoSwap是一种新型视频编辑框架，通过语义点对应技术实现自定义主体替换，同时保持背景不变。该方法支持用户交互，可对齐主体运动轨迹并修改形状。相比现有技术，VideoSwap在真实视频中展现出优越的主体替换效果，为视频编辑开辟新方向。

DeepSwapper - AI在线换脸工具支持照片和视频的高质量面部替换

AI工具AI换脸DeepSwapper人脸替换在线工具视频人脸替换

DeepSwapper是一款AI驱动的在线换脸工具，支持照片和视频的高质量面部替换。该工具提供无水印效果，可实现单人或多人面部交换。用户能将自己的脸与名人或模特的脸进行替换，快速创造有趣内容。DeepSwapper操作简单，几秒内即可生成逼真结果。此外，它还提供商业API，适用于多种创意需求。该平台注重用户隐私和数据安全，是一个功能全面、易用的在线换脸解决方案。

jeelizFaceFilter - 精确的面部检测与追踪库，适用于多种3D引擎的增强现实应用

GithubJavaScriptWebGL增强现实开源项目轻量化面部追踪

这款JavaScript库利用WebRTC技术从摄像头视频流中实时检测和追踪面部，并可以叠加3D内容用于增强现实应用。该库设计轻量，独立于任何第三方库或3D引擎，提供原始面部数据确保能兼容任意框架。涵盖多个示例和辅助工具，便于快速实现高级应用，如头部运动追踪和面部滤镜。支持THREE.JS、BABYLON.JS等多种主流3D引擎，且持续更新新演示，是开发基于面部增强现实应用的理想选择。

Personify - 虚拟头像和视频会议增强工具的创新平台

AI工具ChromaCamPresenter头像虚拟背景视频会议

Personify提供创新的虚拟头像和视频会议增强工具。其主要产品Presenter和ChromaCam支持用户在视频会议中使用个性化头像、替换背景或添加模糊效果,兼容多种主流视频会议软件。该平台还提供SDK工具供集成使用,并已通过SOC2安全认证。Personify致力于提升远程沟通的互动性和效果,为用户带来全新的视频会议体验。

LivePortrait - 高效的面部动画技术与重定向控制

GithubLivePortraitPyTorch实现人像动画实时渲染开源项目深度学习热门

LivePortrait是一种基于PyTorch实现的先进面部动画技术，支持高效的人像动画合成与重定向控制。项目提供了全面的预训练模型和易于使用的界面，支持Windows、macOS和Linux系统。用户可以快速开始，利用预训练权重生成高质量的动画肖像。支持静态图像与视频的动画生成，可广泛应用于虚拟现实、游戏开发和在线教育等领域。

web-stable-diffusion - 浏览器内完全独立运行的稳定扩散模型

GithubML模型部署TVM UnityWeb Stable DiffusionWebGPU开源项目机器学习编译

本项目实现了稳定扩散模型的全浏览器内运行，无需服务器支持。这项技术降低服务成本的同时增强了个性化和隐私保护。基于WebGPU和WebAssembly等技术，用户只需通过浏览器即可体验强大的AI功能。该项目利用开源生态系统，支持Python优先环境，便于开发和优化AI模型，能够广泛部署并提供可重复和可操作的工作流程。

HumanVid - 创新的相机控制人物图像动画技术

GithubHumanVid人像动画图像生成开源项目相机控制训练数据

HumanVid是一项致力于相机可控人物图像动画的研究项目。该项目通过优化训练数据利用，旨在实现对人物图像的精确控制和自然动画效果。HumanVid简化了图像处理流程，为研究者和开发者提供了新的工具。项目团队计划在近期发布相关数据，并将于2024年9月底开源训练和推理代码以及模型检查点，有望为计算机视觉和图形学领域带来新的研究方向。HumanVid项目致力于探索如何通过优化训练数据来实现相机可控的人物图像动画，为该领域的进步贡献力量。

ViViD - 视频虚拟试衣技术运用扩散模型实现逼真效果

GithubViViD开源项目扩散模型数据集深度学习视频虚拟试穿

ViViD是一个基于扩散模型的视频虚拟试衣开源项目。该技术能将静态服装图片自然融入动态视频，实现逼真的虚拟试衣效果。项目提供完整代码、预训练模型和数据集，便于研究和开发。ViViD在计算机视觉和AI领域展现潜力，为时尚电商和虚拟现实等行业提供新的应用可能。

mirror - 本地运行的实时AI视频分析开源项目

AI镜像GithubMirror人工智能可定制开源项目本地运行

Mirror是一个开源项目，通过本地运行的AI模型实时分析网络摄像头视频流。项目完全在本地执行，保障用户隐私，无需联网且免费使用。通过修改提示，Mirror可适应多种场景需求。该项目基于Bakllava模型和llama.cpp，为开发者提供了探索AI视觉分析的平台。

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号