Project Icon

deffcode

基于FFmpeg的跨平台视频帧解码处理库

DeFFcode是一个基于FFmpeg的跨平台视频帧解码库。它可实时生成低延迟的视频帧,支持多种输入源,提供对底层管道的完整控制,并保持与OpenCV兼容的编码语法。DeFFcode支持GPU加速、关键帧提取和元数据提取等功能,适用于计算机视觉应用开发。

efficientdet - EfficientDet目标检测模型的PyTorch实现
COCO数据集EfficientDetGithub开源项目深度学习目标检测计算机视觉
本项目提供了EfficientDet目标检测模型的PyTorch实现。支持COCO数据集的训练、评估和测试,在COCO val2017上达到0.314 mAP。包含预训练权重、视频测试功能和使用说明。适合研究人员和开发者参考使用。
deepflame-dev - 深度学习赋能的开源多相反应流CFD软件
CFDDeepFlameGithubOpenFOAM反应流开源项目深度学习
DeepFlame是一款开源的深度学习赋能计算流体动力学软件包,适用于单相或多相、层流或湍流、全速域反应流模拟。它整合了OpenFOAM、Cantera和PyTorch的功能,提供GPU加速、自适应网格细化、多种求解器和燃烧模型。该软件旨在支持下一代异构超级计算和AI加速基础设施,促进反应流仿真技术的进步。
Android-Video-Trimmer - Android视频裁剪压缩开源工具 精准高效
Android Video TrimmerGithub开源项目视频压缩视频处理视频裁剪
Android-Video-Trimmer是一款为Android平台开发的开源视频处理工具,具备精确裁剪、高效压缩、参数自定义和帧预览功能。该项目采用FFmpeg进行核心处理,结合Android原生组件优化界面,旨在为Android生态提供简洁强大的视频编辑解决方案。项目采用MIT许可证,支持视频资源获取、播放和帧图片展示,为开发者提供了灵活的视频处理工具。此外,项目还计划未来优化压缩算法、添加滤镜特效、扩展视频格式支持,以及引入批量处理和云存储集成功能。
DKVideoPlayer - 轻量级高性能Android视频播放框架
Android视频播放器DKVideoPlayerGithub媒体格式支持开源项目移动应用开发
DKVideoPlayer是一个开源的Android视频播放框架。该项目支持多种媒体协议和格式,提供简洁的API接口,便于开发者集成。框架具有可扩展性,允许自定义UI和播放内核。项目提供详细文档和示例代码,有助于解决开发中遇到的问题。
faceswap - 面部识别与交换工具,支持图片和视频处理
AI换脸FaceSwapGithub人脸识别开源项目深度学习视频处理
FaceSwap是一款深度学习驱动的面部识别和交换工具,适用于图片和视频。该项目支持Windows、Linux和MacOS操作系统,通过提取、训练和转换步骤实现面部交换,并支持GPU加速处理。FaceSwap提供详细的安装和使用指南,并拥有活跃的社区支持,包括Discord服务器和专门论坛。项目遵循严格的道德标准,倡导合理合法的使用,致力于推动AI技术的学习与应用。
SFML - 简单快速的跨平台多媒体开发库
C++GithubSFML多媒体库开源开源项目跨平台
SFML是一个跨平台的开源多媒体开发库,提供窗口、图形、音频和网络功能。它使用C++编写,支持C、.Net、Ruby、Python等多种语言。SFML适用于商业和个人项目,无使用限制。该库提供完善的文档和教程,并拥有活跃的社区,有助于开发者快速构建多媒体应用。
blur - 视频运动模糊效果生成器
BlurGithub帧率插值开源项目视频处理视频编辑运动模糊
Blur是一款开源的视频运动模糊处理程序。它利用帧混合技术生成高质量的运动模糊效果,可自定义模糊程度和帧率插值。该工具能够智能识别视频中的静止部分,仅对运动元素应用模糊效果。Blur提供图形界面和命令行操作,适用于游戏录像、影视后期等多种场景。其独特的插值算法可在低帧率视频中实现流畅的运动模糊效果。
pyvideotrans - 视频翻译与多语言配音解决方案
Githubpyvideotrans开源项目翻译模型视频翻译语音识别配音工具
这款工具支持将视频内容翻译为多种指定语言,并自动生成字幕和配音。集成了faster-whisper、openai-whisper、GoogleSpeech等多个语音识别、翻译和文本合成模块,支持中文、英语、韩语、日语等20多种语言。用户可以进行视频翻译、字幕生成和批量处理,并可以选择保留背景音乐,适用于Windows、MacOS、Linux等多种平台。
FunCodec - 开源神经语音编解码工具包
FunCodecGithubLibriTTS开源工具开源项目神经网络语音编解码
FunCodec是一个高效的开源神经语音编解码工具,提供高质量的文本到语音转换功能,并支持丰富的预训练模型。它易于安装,适用于多种数据集,持续集成最新技术,适合专业开发者和研究人员使用。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号