Project Icon

vvdec

弗劳恩霍夫研究所开发的开源H.266/VVC视频解码器

VVdeC是一款支持H.266/VVC Main10配置文件全部特性的开源视频解码器软件实现。由弗劳恩霍夫研究所开发,提供多平台支持,包括Windows、Linux、MacOS、Android和浏览器(WASM)。VVdeC以高性能和全面的VVC解码功能著称,适用于各种视频处理应用。该项目欢迎社区贡献,致力于提供高效的VVC解码解决方案。

VideoPipe - 跨平台的视频分析和结构化解决方案
GithubVideoPipe开源项目深度学习行为分析视频分析视频结构化
VideoPipe 是一个用 C++ 编写的开源视频分析和结构化框架,依赖少且易于上手。适用于视频结构化、图片搜索、人脸识别、交通和安防领域的行为分析。支持多种视频流协议和解码方式,集成深度学习和传统图像算法,具备目标检测、图像分类、特征提取等功能。插件化设计允许根据需求灵活组合,适用于多种平台,性能优良,广泛适用于各类应用场景。
fly-cut - 基于Webcodecs的开源网页视频剪辑工具
GithubVue3WebAVWebcodecsWeb剪辑工具开源项目音视频处理
fly-cut是一个基于Webcodecs和Vue3开发的开源网页视频剪辑工具。它在浏览器中提供音视频编辑功能,结合了WebAV的处理能力和CcClip的界面设计。用户可以直接在网页上进行视频剪辑,无需安装专门软件。该项目旨在为开发者和用户提供一个便捷的在线视频编辑解决方案。
nwjs-ffmpeg-prebuilt - 为NW.js定制的FFmpeg预构建包含专有编解码器
FFmpegGithubNW.js专有编解码器开源项目跨平台支持预构建二进制文件
nwjs-ffmpeg-prebuilt为NW.js提供包含专有编解码器的FFmpeg预构建二进制文件,支持Windows、Linux和macOS。项目提供预构建下载和自定义构建指南,覆盖x86、x64和arm架构。该项目为开发者提供了灵活的选择,可直接使用预构建文件或按需自行编译。同时项目还提供了命令行工具,方便用户指定NW.js版本和目标架构进行构建。值得注意的是,使用MP3和H.264编解码器时需考虑相关专利费用和许可问题。
X-Decoder - 像素、图像和语言的统一解码模型
GithubX-Decoder图像分割多任务学习开放词汇分割开源项目计算机视觉
X-Decoder是一个通用解码模型,可生成像素级分割和标记级文本。该模型在多个数据集上实现了开放词汇分割和指代分割的最佳结果,在分割和视觉语言任务上表现出色。X-Decoder支持语义、实例和全景分割,以及图像描述、图像-文本检索等多种任务。此外,它还能进行区域检索、指代描述、图像编辑等零样本任务组合。
FLAVR - 创新视频帧插值方法实现快速多帧预测
FLAVRGithub帧率提升开源项目深度学习视频插帧计算机视觉
FLAVR是一种新型视频帧插值方法,无需光流估计即可实现快速多帧预测。该方法采用特殊的编码器-解码器架构,结合时空卷积和通道门控,能有效捕捉复杂运动轨迹并生成高质量高帧率视频。相比现有技术,FLAVR在速度和准确性间取得更好平衡,为视频慢动作和帧率提升等应用提供新选择。
FFmpeg - 开源多媒体处理框架 支持编解码转换和流媒体
FFmpegGithub命令行工具多媒体处理开源软件开源项目音视频编解码
FFmpeg是一套开源的多媒体处理框架,包含多个核心库和命令行工具。它支持广泛的编解码器、流媒体协议和容器格式,可用于音频、视频和字幕的处理与转换。FFmpeg提供libavcodec、libavformat等库,以及ffmpeg、ffplay和ffprobe等工具,为多媒体开发提供全面解决方案。
Jvedio - 本地视频管理软件 自动分类整理影音资源
FFmpegGithubJvedio人工智能开源项目本地视频视频管理
Jvedio是一款功能全面的本地视频管理软件。它可扫描并导入本地视频,自动提取识别码进行分类,支持标签管理和演员识别。软件基于FFmpeg实现视频截图,界面设计流畅美观。Jvedio提供多语言和多种皮肤,搜索和筛选功能丰富,可满足个性化的视频管理需求。此外,软件还具备NFO识别、信息编辑、视频重命名等实用功能,是管理本地视频资源的理想工具。
ffmpeg-rockchip - Rockchip平台全硬件转码管道的开源项目
FFmpegGithubMPPRGARockchip开源项目硬件转码
ffmpeg-rockchip是一个为Rockchip平台开发的开源项目,旨在提供完整的硬件转码管道。该项目利用MPP和RGA技术,实现了高达8K分辨率的视频处理能力。它支持硬件解码、编码和滤镜,包括AFBC图像格式、去隔行扫描和异步编码等功能。通过零拷贝DMA传输,项目提高了多媒体处理效率,尤其适合RK3588/3588s等设备。
vime - 多功能、跨平台的开源媒体播放器
GithubVimeWeb组件媒体播放器开源开源项目跨框架
Vime是一个开源的媒体播放器项目,支持HTML5、HLS、YouTube等多种媒体源。它提供统一API,确保跨浏览器兼容性,支持国际化和无障碍访问。Vime基于Web组件设计,易于定制和扩展,并提供主流前端框架的集成。其轻量级设计和丰富功能使其成为构建现代媒体播放器的有力工具。
SemantiCodec-inference - 超低比特率音频编解码器优化潜在空间语义
GithubSemantiCodec低比特率开源项目神经网络语义空间音频编解码
SemantiCodec是一个开源的神经音频编解码器项目,提供0.31-1.40 kbps的超低比特率音频压缩。通过优化潜在空间的语义表示,实现高效的音频编码和解码。支持25-100每秒的灵活令牌率,兼容CPU、CUDA和MPS平台。项目提供简单的API接口,适用于需要高压缩率同时保持音质的应用场景。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号