#Pytorch

Soft MoE - PyTorch:Brain's Vision团队提出的专家混合模型的实现

3 个月前
Cover of Soft MoE - PyTorch:Brain's Vision团队提出的专家混合模型的实现

Linformer: 通过线性复杂度自注意力机制实现高效的Transformer模型

3 个月前
Cover of Linformer: 通过线性复杂度自注意力机制实现高效的Transformer模型

Pytorch-Medical-Segmentation: 基于PyTorch的医学图像分割开源框架

3 个月前
Cover of Pytorch-Medical-Segmentation: 基于PyTorch的医学图像分割开源框架

QATM_pytorch: 深度学习中质量感知模板匹配的PyTorch实现

3 个月前
Cover of QATM_pytorch: 深度学习中质量感知模板匹配的PyTorch实现

MASR: 一个强大的自动语音识别框架

3 个月前
Cover of MASR: 一个强大的自动语音识别框架

TiTok-PyTorch: 基于字节跳动提出的高效图像重建与生成模型

3 个月前
Cover of TiTok-PyTorch: 基于字节跳动提出的高效图像重建与生成模型

RETRO-pytorch: 深度学习中的检索增强变压器模型

3 个月前
Cover of RETRO-pytorch: 深度学习中的检索增强变压器模型

SoundStorm-PyTorch: 高效并行音频生成的开源实现

3 个月前
Cover of SoundStorm-PyTorch: 高效并行音频生成的开源实现

Video Diffusion Models: 突破性的视频生成技术

3 个月前
Cover of Video Diffusion Models: 突破性的视频生成技术

Phenaki-Pytorch: 革命性文本引导视频生成技术的开源实现

3 个月前
Cover of Phenaki-Pytorch: 革命性文本引导视频生成技术的开源实现
相关项目
Project Cover

deep-learning-for-image-processing

本教程介绍深度学习在图像处理中的应用,涵盖使用Pytorch和Tensorflow进行网络结构搭建和训练。课程内容包括图像分类、目标检测、语义分割、实例分割和关键点检测,适合研究生和深度学习爱好者。所有PPT和源码均可下载,助力学习和研究。

Project Cover

denoising-diffusion-pytorch

Denoising Diffusion Probabilistic Model在Pytorch中的实现,通过去噪得分匹配估计数据分布梯度,并使用Langevin采样生成样本。这种方法可能成为GANs的有力竞争者。项目支持多GPU训练,提供详细的安装和使用指南,是研究人员和开发者的高效工具,支持1D序列数据和图像数据的生成和训练。

Project Cover

tsai

tsai是基于Pytorch和fastai的开源深度学习库,专注时间序列分析,涵盖分类、回归和预测等任务。支持多种模型和数据集,并提供详尽的教程。适用于Pytorch 2.0,安装简便,适合开发和前沿研究。

Project Cover

eat_pytorch_in_20_days

本书帮助读者在20天内系统性地掌握Pytorch,从基础到进阶,涵盖核心概念与实际应用。内容基于Pytorch官方文档,优化了结构和范例,提升了用户友好度。适合有一定基础的学习者,提供每日学习计划和实用代码,并附有资源获取方式。欢迎对Pytorch感兴趣的读者前来学习和讨论,获取全面的深度学习指南。

Project Cover

CV

本项目提供深度学习视频讲解及笔记资源,涵盖Pytorch、李沐、吴恩达等名师课程,并附有详细的数据集和实用工具。适合从事AI算法开发、图像处理及语音识别方向的求职者,并提供多家知名企业的内推机会,帮助自学者搭建交流平台,实现技术突破和职业发展。

Project Cover

DALLE2-pytorch

DALL-E 2的Pytorch实现由OpenAI开发,采用先进的神经网络技术将文本描述转化为高质量图像。本版本特别优化扩散先验网络,提供高性能的模型变体。开源项目鼓励开发者通过GitHub和Hugging Face参与贡献,并在Discord社区进行交流和支持。

Project Cover

Voice-Cloning-App

Voice-Cloning-App,一个基于Python/Pytorch的高效工具,使用户能在多个平台上进行人声合成和训练。特点包括支持多GPU使用、自动化数据集创建、多语言支持及系统的远程训练功能。即将支持更多语音合成技术和GPU型号,优化数据处理效率。

Project Cover

WaveRNN

WaveRNN通过Pytorch实现了Deepmind的高效神经音频合成技术,并包含Tacotron训练支持, 提供两种预训练模型。项目向研究者和开发者开放,并附有详细使用指南与多样化的自定义功能,以便进行高质量的文本到语音转换。

Project Cover

EasyOCR

EasyOCR是一款支持80多种语言和主要书写系统(如拉丁文、中文、阿拉伯文等)的光学字符识别(OCR)工具。它提供简单的安装和使用指南,帮助快速实现文本检测与识别,适用于多种场景。最新版本增加了Apple Silicon支持并修复了兼容性问题。未来版本将支持手写文本识别,进一步增强其功能。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号