Project Icon

Chenyme-AAVT

AI多语言视频翻译和字幕生成工具

Chenyme-AAVT是一款功能全面的AI视频翻译工具,支持多语言和多种文件格式。该工具集成OpenAI API和Faster-Whisper识别引擎,具备GPU加速和VAD辅助功能。通过ChatGPT、KIMI等翻译引擎,实现字幕生成、视频预览和内容总结。此外,Chenyme-AAVT还提供字幕微调和图文博客生成等功能,为视频处理提供全方位解决方案。

AI 自动视频(音频)翻译

简体中文 徽章 英文 徽章 在 Colab 中打开 下载 PyPI - 版本

Chenyme-AAVT V0.8.5

非常感谢您来到我的全自动视频翻译项目!该项目旨在提供一个简单易用的自动识别、翻译工具和其他视频辅助工具,帮助快速识别视频字幕、翻译字幕、辅助图文。

  • 注意1:推荐选用 Faster-whisper 和 Large 模型以获得最好的断句、识别体验!
  • 注意2:由于考研,更新速度可能会放缓,学业为重,感谢理解~~~ 大家有想法、有问题、想交流的朋友们可以加群一起讨论噢!
  • 【紧急公告】Pytorch近期 2.4.x 版本,部分用户会直接报错:OSError找不到指定的模块fbgemm.dll,目前尚未知任何原因!

若发生此类错误,请尝试将对应的安装脚本(.bat文件)中的 torch 版本 修改为 2.3.1 并删除已安装 env 文件,重新运行安装脚本!

(示例)原:pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

(示例)改:pip install torch==2.3.1 torchvision==0.18.1 torchaudio==2.3.1 --index-url https://download.pytorch.org/whl/cu121

给一颗免费的星支持一下叭~感谢!AAVT安装教程 | AAVT常见问题 | AAVT电报群组

本项目开源可魔改,发布请保留原作者 @chenyme 和 项目链接,感谢支持!请勿在任何平台收费项目源码!(代码这么烂也能收?)

由于微信群聊人数限制,入群请直接在电报私信我。

测试效果 点击下载

项目亮点

  • 支持 OpenAI APIFaster-Whisper 识别后端。
  • 支持 GPU 加速VAD辅助FFmpeg加速
  • 支持 本地部署模型ChatGPTKIMIDeepSeekChatGLMClaude等多种引擎翻译。
  • 支持识别、翻译 多种语言多种文件格式
  • 支持对 一键生成字幕微调视频预览
  • 支持对内容直接进行 AI总结、问答
  • 支持视频 生成图文博客

如何安装

修复闪退.bat请在 出现闪退/报错OMP/报错NoneType 的情况下 再运行,不要直接运行!

使用 Windows

  1. 安装 Python,请确保Python版本大于3.8

  2. 安装 FFmpegReleaseFull版本已经打包了FFmpeg库

  3. 运行 install.bat

使用 docker

docker pull eisai/chenyme-aavt

具体使用方法,请查阅:eisai/chenyme-aavt

感谢 @Eisaichen 提供此版本

使用 Colab

在 Colab 中打开

感谢 @Kirie233 提供此版本

待办事项

识别相关

  • 更换更快的Whisper项目
  • 支持本地模型加载
  • 支持个人微调Whisper模型
  • VAD辅助优化
  • 字词级断句优化
  • 更多的语种识别

翻译相关

  • 翻译优化
  • 更多的语种翻译
  • 更多的翻译模型
  • 更多的翻译引擎
  • 支持本地大语言模型翻译

字幕相关

  • 个性化字幕
  • 更多字幕格式
  • 字幕预览、实时修改
  • 自动化字幕文本校对
  • 双字幕

其他

  • 视频总结、罗列重点
  • 视频预览
  • AI助手
  • 视频生成博客*
  • 实时语音翻译
  • 视频中文配音
注:含*的功能还不稳定,可能存在某些BUG。

Star 历史

Star 历史图表

项目界面预览

主页面

1716910190616

设置

1716910203660

视频识别

参数设置

d967ac4074d0c8ecba07b95de533730

运行界面

b861c5019833b770f98344f7a4c73a4

视频生成

1716650985701

字幕微调

1716651009788

内容助手

参数设置

461474f5d96b61b70bd239a9e3ddf8d

运行界面

14575fd5efbe138f364329626501b09

字幕翻译

35bc5a96676c7f2b9d71042eb7c877f

视频博客

09f60b8099f8ce19b83f4da63b26817

鸣谢

本人是 AI 时代的受益者,本项目的开发基本是站在巨人的肩膀上实现的。主要基于 OpenAI 开发的 Whisper 来识别声音和 LLMs 辅助翻译字幕 ,利用 Streamlit 搭建快速使用的 WebUI 界面,以及 FFmpeg 来实现字幕与视频的合并。

非常感谢 OpenAI 、 Streamlit 、 FFmpeg 、Faster-whisper 等开发人员!

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

Project Cover

天工AI音乐

天工AI音乐平台支持音乐创作,特别是在国风音乐领域。该平台适合新手DJ和音乐爱好者使用,帮助他们启动音乐创作,增添生活乐趣,同时发现和分享新音乐。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号