深度学习讲义和实验
2023版本(最新)
修订和扩展
理论
主题 | 笔记 | 视频 | 代码 |
---|---|---|---|
概述 | - | - | |
监督学习 | - | - | |
多层感知器 (MLP) | - | - | |
优化 | - | - | |
正则化 | - | - | |
卷积神经网络 (CNN) | - | Notebook | |
Transformer | - | Notebook | |
自编码器 (AE) | - | AE & 降噪AE 彩图AE | |
变分自编码器 (VAE) | - | VAE 和 CVAE | |
生成对抗网络 (GAN) | - | DCGAN 和 CGAN | |
大语言模型 (LLMs) 简介 | - | - | |
LLM 数据和模型 | - | - |
实践
主题 | 笔记 | 视频 | 代码 |
---|---|---|---|
开发环境 | - | - | |
Python | - | - | |
Numpy | - | - | |
PyTorch | - | - | |
Gradio | - | Notebook | |
效率 | - | Code | |
PyTorch Lightning | - | Notebook | |
模型打包与服务 | - | ONNX 导出 ONNX 运行时 TorchScript & TensorRT PyTriton Yolo 客户端 PyTriton Yolo 服务器 | |
Docker | = | - | |
HuggingFace | - | - |
LLMs、LVMs 和代理的实验
AI,ML 和深度学习 | 笔记 | 视频 | 代码 |
---|---|---|---|
LLM | |||
LangChain | - | Jupyter | |
LLM 微调和文档查询 | - | Jupyter | |
使用 Chroma 进行文档查询 | - | - | Jupyter |
Dolly(免费 LLM) | - | - | Jupyter |
LVM | |||
任意分割模型 (SAM) | - | Prompts & 所有掩码 | |
Open CLIP & CoCa | - | - | Jupyter |
代理 | |||
HuggingGPT | - | Agents | |
大型多模态模型 (L3M) | |||
ImageBind | - | ImageBind | |
稳定扩散 | |||
扩散 | - | - | Diffusers |
ControlNet | - | - | ControlNet |
2022版本
欢迎来到2022版的深度学习课程。我们对课程的覆盖范围和内容做了重大改变,以反映该领域的最新进展。
安装
假设您已经拥有anaconda
或venv
,请安装此版本所需的python包以运行实验。
pip install -r requirements.txt
覆盖范围:
AI、ML 和深度学习 | 笔记 | 视频 | 代码 |
---|---|---|---|
概述 | YouTube | - | |
工具包 | |||
开发环境 和代码编辑器 | YouTube | - | |
Python | YouTube | - | |
Numpy | YouTube | Jupyter | |
Einsum | YouTube | Jupyter | |
Einops | YouTube | Jupyter & Jupyter (音频) | |
PyTorch & Timm | YouTube | PyTorch/Timm & 输入 Jupyter | |
Gradio & Hugging Face | YouTube | Jupyter | |
Weights and Biases | YouTube | Jupyter | |
Hugging Face Accelerator | 同 W&B | 同 W&B | Jupyter & Python |
数据集和数据加载器 | YouTube | Jupyter | |
监督学习 | YouTube | ||
PyTorch Lightning | YouTube | MNIST & KWS | |
关键词检测应用 | cd versions/2022/supervised/python && python3 kws-infer.py --gui | ||
构建模块: MLPs、CNNs、RNNs、Transformers | |||
MLP | YouTube | MLP on CIFAR10 | |
CNN | YouTube | CNN on CIFAR10 | |
Transformer | YouTube | Transformer on CIFAR10 | |
反向传播 | |||
优化 | |||
正则化 | |||
无监督学习 | 即将推出 | ||
自动编码器 | YouTube | AE MNIST CIFAR10 颜色化 | |
变分自动编码器 | 即将推出 | ||
实际应用: 视觉、语音、NLP | 即将推出 |
2022版的新特性:
-
强调使用和部署深度学习模型的工具。在过去,我们学习如何构建和训练模型以执行某些任务。然而,很多时候我们希望使用预训练模型进行即时部署、测试或演示。因此,我们将在讨论中使用诸如
huggingface
、gradio
和streamlit
等工具。 -
强调理解深度学习构建模块。构建、训练和测试模型的能力很重要。然而,当我们希望在新的硬件上优化和部署深度学习模型或在生产中运行它时,我们需要深入理解我们算法的代码实现。因此,我们将强调低级别算法及其代码实现。
-
强调实际应用。深度学习能做的不仅仅是识别。因此,我们将重点介绍在视觉(检测、分割)、语音(ASR、TTS)和文本(情感、摘要)中的实际应用。
-
各种抽象层次。我们将从低级别的
numpy
和einops
到中级框架如 PyTorch 再到高级API如huggingface
、gradio
和streamlit
介绍深度学习概念。这使我们能够根据问题的限制使用深度学习原理。 -
强调个人对作业、机器练习和项目的展示。在线学习很难。为了最大化学生的学习效果,本课程侧重于思想交流,以确保每个学生的进步。
Star、复刻、引用
如果你觉得这项工作有用,请给它一个 star、复刻或引用:
@misc{atienza2020dl,
title={Deep Learning Lecture Notes},
author={Atienza, Rowel},
year={2020},
publisher = {GitHub},
journal = {GitHub repository},
howpublished = {\url{https://github.com/roatienza/Deep-Learning-Experiments}},
}