#ShareGPT4Video
ShareGPT4Video - 通过字幕提高视频理解和生成
Github开源项目AI模型视频生成视频字幕视频理解ShareGPT4Video
ShareGPT4Video项目通过应用高精度字幕显著提升视频理解与生成的效果。该项目提供功能强大的文本至视频模型,支持多种视频时长和分辨率,并设有两种优化效率与质量的推断模式。该项目的目标是通过高质量视频字幕数据集改善文本到视频的转换效果,从而提升大型视频语言模型的理解能力。
sharegpt4video-8b - 基于视频指令数据训练的开源视频对话模型
Github开源项目机器学习模型HuggingfaceShareGPT4Video视频聊天机器人视频语言模型视频指令数据
sharegpt4video-8b是一个开源视频对话模型,基于153K多样化视频指令数据和28K高质量视频字幕数据进行全模型微调。该模型能处理视频问答、描述和分析等任务,旨在推进视频-语言模型研究。它主要面向计算机视觉、自然语言处理和人工智能领域的研究人员,用于探索大规模视频-语言模型和视频聊天机器人的潜力。