Project Icon

DOVER

创新解耦视频质量评估方法

DOVER是一种创新的视频质量评估方法,将审美和技术两个维度解耦,为用户生成内容提供全面评估。该方法从现有UGC-VQA数据集中分离这两个维度,并提供了包括轻量级DOVER-Mobile在内的多个版本。项目开源了代码、演示和权重,支持单视频和批量视频集评估,并提供了详细的安装使用说明。DOVER在多个基准数据集上取得了领先性能,为视频质量评估领域带来了新的研究方向。

awesome-video - 优化视频开发的全面资源集锦
Github多媒体处理开源项目播放器编码工具视频资源
该项目汇集了视频开发领域的各类资源,涵盖分析工具、AR/VR/360、字幕、会议、播放器、特定语言库、元数据和媒体处理等方面。包含丰富的学习教程、开发文档、实用工具和程序库,为不同水平的视频开发者提供全面支持。资源内容涉及FFmpeg、HLS、DASH等主流技术,并包括多个开源项目,有助于开发者深入了解和实践视频技术。
Video-MME - 全面评估多模态大语言模型视频分析能力的基准
GithubVideo-MME人工智能基准评估多模态大语言模型开源项目视频分析
Video-MME是一个创新的多模态评估基准,用于评估大语言模型的视频分析能力。该项目包含900个视频和2,700个人工标注的问答对,覆盖多个视觉领域和时间跨度。其特点包括视频时长多样性、类型广泛性、数据模态丰富性和高质量标注。Video-MME为研究人员提供了一个全面评估多模态大语言模型视频理解能力的工具。
dreamscene4d - 从单目视频生成动态多目标3D场景的突破性技术
3D场景生成DreamScene4DGithub多目标跟踪开源项目视频处理计算机视觉
DreamScene4D是一种从单目视频生成动态多目标3D场景的开源技术。它采用3D高斯和形变优化方法,能处理不同长度的视频和多个目标。项目提供自动化和分阶段优化脚本,支持处理有遮挡和无遮挡的视频。DreamScene4D在复杂场景和长视频序列处理方面表现优异,为计算机视觉和图形学研究提供了新思路。
iSeeBetter - 时空融合视频超分辨率方法
GithubPyTorch图像质量开源项目深度学习生成对抗网络视频超分辨率
iSeeBetter是一种新型视频超分辨率算法,结合循环生成反投影网络和SRGAN,从相邻帧中提取时空信息。采用四重损失函数优化模型,在多数场景下超越现有方法,实现更高质量的视频放大效果。该方法融合了单帧和多帧超分辨率技术,为视频画质提升提供了新的解决方案。
CoDeF - 视频内容变形场技术实现时序一致的视频处理
CoDeFGithub内容变形场图像算法提升开源项目时间一致性视频处理
CoDeF项目提出了内容变形场这一新型视频表示方法。它包含规范内容场和时间变形场两个部分,能够将图像算法应用于视频处理。这种设计实现了高质量的视频转换和关键点跟踪,同时保持了良好的跨帧一致性。CoDeF还能跟踪水和烟雾等非刚性物体,为视频处理带来新的可能性。
ffmpeg-quality-metrics - FFmpeg视频质量多指标评估工具
FFmpegGithubPSNRSSIMVMAF开源项目视频质量评估
FFmpeg Quality Metrics是一个开源的视频质量评估工具,支持PSNR、SSIM、VMAF和VIF等多种指标计算。它可输出逐帧指标、各平面/组件指标及全局统计数据。该工具跨平台兼容,支持Python 3.8+。通过命令行即可对视频进行质量评估,并提供多种可配置选项以满足不同评估需求。
FLAVR - 创新视频帧插值方法实现快速多帧预测
FLAVRGithub帧率提升开源项目深度学习视频插帧计算机视觉
FLAVR是一种新型视频帧插值方法,无需光流估计即可实现快速多帧预测。该方法采用特殊的编码器-解码器架构,结合时空卷积和通道门控,能有效捕捉复杂运动轨迹并生成高质量高帧率视频。相比现有技术,FLAVR在速度和准确性间取得更好平衡,为视频慢动作和帧率提升等应用提供新选择。
awesome-video - 视频流媒体技术全面开源资源库
DASHFFmpegGithubHLS开源项目编码视频流
awesome-video项目汇集了全面的视频流媒体技术资源,包括入门到高级的学习材料、主流流媒体协议、编解码技术、传输方案、服务器、播放器和测试工具等。该项目为开发者和工程师提供了丰富的参考资料,有助于深入理解和应用这一复杂的技术领域。
videollm-online - 流式视频实时理解与交互的先进模型
GithubVideoLLM-online大语言模型实时交互开源项目流媒体视频视频处理
VideoLLM-online是一款针对流媒体视频的在线大语言模型。该模型支持视频流实时交互,可主动更新响应,如记录活动变化和提供实时指导。项目通过创新的数据合成方法将离线注释转化为流式对话数据,并采用并行化推理技术实现高速处理,在A100 GPU上处理速度可达10-15 FPS。VideoLLM-online在在线和离线环境中均表现出色,能高效处理长达10分钟的视频,为视频理解与交互领域带来新的可能性。
Awesome-Video-Diffusion - 人工智能视频生成与编辑技术资源大全
AI视频Github开源项目扩散模型文本到视频视频生成视频编辑
本文汇集了视频生成、编辑、修复和理解领域的最新扩散模型研究。内容包括开源工具箱、基础模型、评估基准和指标等。涵盖基础视频生成、可控生成、长视频生成、3D视频生成等多个方向,为视频AI技术研究和开发提供全面参考。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号