#Pytorch

Soft MoE - PyTorch：Brain's Vision团队提出的专家混合模型的实现

3 个月前

Soft MoE Pytorch 专家混合深度学习神经网络 Github 开源项目

3 个月前

Linformer: 通过线性复杂度自注意力机制实现高效的Transformer模型

3 个月前

Linformer Pytorch 自注意力机制深度学习神经网络 Github 开源项目

3 个月前

Pytorch-Medical-Segmentation: 基于PyTorch的医学图像分割开源框架

3 个月前

Pytorch 医学图像分割深度学习神经网络开源项目 Github

3 个月前

QATM_pytorch: 深度学习中质量感知模板匹配的PyTorch实现

3 个月前

Pytorch QATM 模板匹配深度学习计算机视觉 Github 开源项目

3 个月前

MASR: 一个强大的自动语音识别框架

3 个月前

语音识别 MASR Pytorch 流式识别预训练模型 Github 开源项目

3 个月前

TiTok-PyTorch: 基于字节跳动提出的高效图像重建与生成模型

3 个月前

TiTok 图像处理深度学习 Pytorch 图像重建 Github 开源项目

3 个月前

RETRO-pytorch: 深度学习中的检索增强变压器模型

3 个月前

RETRO Pytorch 检索增强语言模型神经网络深度学习 Github 开源项目

3 个月前

SoundStorm-PyTorch: 高效并行音频生成的开源实现

3 个月前

SoundStorm 音频生成 Pytorch 深度学习人工智能 Github 开源项目

3 个月前

Video Diffusion Models: 突破性的视频生成技术

3 个月前

视频生成深度学习 Pytorch U-net 文本到视频 Github 开源项目

3 个月前

Phenaki-Pytorch: 革命性文本引导视频生成技术的开源实现

3 个月前

Phenaki 视频生成 AI 机器学习 Pytorch Github 开源项目

3 个月前

相关项目

deep-learning-for-image-processing

本教程介绍深度学习在图像处理中的应用，涵盖使用Pytorch和Tensorflow进行网络结构搭建和训练。课程内容包括图像分类、目标检测、语义分割、实例分割和关键点检测，适合研究生和深度学习爱好者。所有PPT和源码均可下载，助力学习和研究。

denoising-diffusion-pytorch

Denoising Diffusion Probabilistic Model在Pytorch中的实现，通过去噪得分匹配估计数据分布梯度，并使用Langevin采样生成样本。这种方法可能成为GANs的有力竞争者。项目支持多GPU训练，提供详细的安装和使用指南，是研究人员和开发者的高效工具，支持1D序列数据和图像数据的生成和训练。

tsai

tsai是基于Pytorch和fastai的开源深度学习库，专注时间序列分析，涵盖分类、回归和预测等任务。支持多种模型和数据集，并提供详尽的教程。适用于Pytorch 2.0，安装简便，适合开发和前沿研究。

eat_pytorch_in_20_days

本书帮助读者在20天内系统性地掌握Pytorch，从基础到进阶，涵盖核心概念与实际应用。内容基于Pytorch官方文档，优化了结构和范例，提升了用户友好度。适合有一定基础的学习者，提供每日学习计划和实用代码，并附有资源获取方式。欢迎对Pytorch感兴趣的读者前来学习和讨论，获取全面的深度学习指南。

本项目提供深度学习视频讲解及笔记资源，涵盖Pytorch、李沐、吴恩达等名师课程，并附有详细的数据集和实用工具。适合从事AI算法开发、图像处理及语音识别方向的求职者，并提供多家知名企业的内推机会，帮助自学者搭建交流平台，实现技术突破和职业发展。

DALLE2-pytorch

DALL-E 2的Pytorch实现由OpenAI开发，采用先进的神经网络技术将文本描述转化为高质量图像。本版本特别优化扩散先验网络，提供高性能的模型变体。开源项目鼓励开发者通过GitHub和Hugging Face参与贡献，并在Discord社区进行交流和支持。

Voice-Cloning-App

Voice-Cloning-App，一个基于Python/Pytorch的高效工具，使用户能在多个平台上进行人声合成和训练。特点包括支持多GPU使用、自动化数据集创建、多语言支持及系统的远程训练功能。即将支持更多语音合成技术和GPU型号，优化数据处理效率。

WaveRNN

WaveRNN通过Pytorch实现了Deepmind的高效神经音频合成技术，并包含Tacotron训练支持，提供两种预训练模型。项目向研究者和开发者开放，并附有详细使用指南与多样化的自定义功能，以便进行高质量的文本到语音转换。

EasyOCR

EasyOCR是一款支持80多种语言和主要书写系统（如拉丁文、中文、阿拉伯文等）的光学字符识别（OCR）工具。它提供简单的安装和使用指南，帮助快速实现文本检测与识别，适用于多种场景。最新版本增加了Apple Silicon支持并修复了兼容性问题。未来版本将支持手写文本识别，进一步增强其功能。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com