CC6204 深度学习
这是一门介绍基于深度神经网络学习(通常称为深度学习)领域的入门课程(西班牙语授课)。在本课程中,学生将学习深度学习模型背后的理论、其工作原理和可能的应用。学生将能够构建和训练模型来解决实际问题。
- 教授:Jorge Pérez
- 助教:Gabriel Chaperon, Ho Jin Kang, Juan-Pablo Silva, Mauricio Romero, Jesús Pérez-Martín
- 课程往期版本:2018年秋季, 2019年春季
2020年春季
要求
- 一个Google账号用于使用Google Collaboratory,或者
- 安装以下Python包:
课程组织
1. 基础
介绍,人工智能 vs 机器学习 vs 深度学习,为什么是现在的深度学习?(视频)
1.1. 现代神经网络
- 感知器、激活函数和矩阵表示 (视频)
- 通用近似定理、前馈网络和输出函数(softmax)(视频)
- 梯度下降法寻找网络参数 (视频)
- 计算图和反向传播算法 (视频1, 视频2)
- 张量、爱因斯坦记号和张量链式法则 (视频)
- 交叉熵和使用张量手动反向传播 (视频)
- 训练的实际方面和在PyTorch中手动实现前馈网络 (视频)
阅读材料:第2章 线性代数, 第3章 概率论和信息论, 第6章 深度前馈网络
1.2. 初始化、正则化和优化
阅读材料:第7章 深度学习中的正则化, 第8章 深度模型训练的优化, 第11章 实用方法论
2. 卷积神经网络 (CNN)
3. 循环神经网络 (RNN)
阅读材料:第10章 序列建模:循环和递归网络, 第12章 应用
4. 高级主题
阅读材料:第14章 自编码器,第20章 深度生成模型
书籍
本课程没有强制性教科书。部分讲座会推荐阅读 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 所著的《深度学习》一书;但无需购买,因为该书在线免费提供。
- Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 所著的《深度学习》(本课程的核心参考书目)
- Aston Zhang、Zachary C. Lipton、Mu Li 和 Alexander J. Smola 所著的《动手学深度学习》
- Mohamed Elgendy 所著的《计算机视觉深度学习》
- Charu Aggarwal 所著的《异常检测的概率和统计模型》
- Daniel Jurafsky 和 James Martin 所著的《语音与语言处理》
- Antoine J.-P. Tixier 所著的《自然语言处理深度学习笔记》
- Frank Hutter、Lars Kotthoff 和 Joaquin Vanschoren 编辑的《AutoML:方法、系统、挑战》
教程
其他深度学习课程
视频
- 可视化和理解递归网络
- Jorge Pérez 的更多关于 Transformer:BERT 及其衍生模型
- Jorge Pérez 的神经注意力机制和 Transformer