项目概述
本仓库项目是个人总结的计算机视觉和大语言模型学习笔记,包含深度学习基础知识、神经网络基础部件详解、深度学习炼丹策略、深度学习模型压缩算法、深度学习推理框架代码解析及动手实战,以及 LLM
基础及推理优化的专栏笔记。
一、数学基础专栏
二、神经网络基础部件
1、神经网络基础部件:
2、深度学习基础:
三、深度学习炼丹
四、深度学习模型压缩
五、模型推理部署
1、模型部署:
2,模型推理:
3,ncnn
框架源码解析:
5,AI/NPU/GPU 芯片特性:
六,异构计算
- 移动端异构计算:
neon
编程 - GPU 端异构计算:
cuda
编程
通用矩阵乘法 gemm
算法解析与优化、neon
、cuda
编程等内容,以及 ncnn
框架代码解析总结。
七,大语言模型推理及服务化
1,LLM 基础知识:
2,Transformer 模型基础:
3,大规模模型的推理优化及部署总结:
4,DeepSpeed 框架学习笔记:
八,进阶课程
1,推荐几个比较好的深度学习模型压缩与加速的仓库和课程资料:
- 神经网络基本原理教程
- AI-System:深度学习系统,主要从底层方向讲解深度学习系统等原理、加速方法、矩阵成乘加计算等。
- pytorch-deep-learning:非常优秀的 pytorch 深度学习教程。
2,一些笔记质量较高的博客链接:
- The Illustrated Transformer:国内许多优质博客都参考了这篇文章。
- C++ 并发编程(从C++11到C++17):优质的 C++ 并发编程教程。
- What are Diffusion Models?
- annotated_deep_learning_paper_implementations
九,其他
最后,持续创作高质量内容并非易事,如果您有 5
秒空闲时间,欢迎扫码关注我的公众号-嵌入式视觉,记录 CV 算法工程师成长之路,分享技术总结、读书笔记和个人感悟。
公众号不会发布标题党文章,也不会输出给大家带来焦虑的内容!
Star History
参考资料
- 《深度学习》
- 《机器学习》
- 《动手学深度学习》
- 《机器学习系统:设计和实现》
- 《AI-EDU》
- 《AI-System》
- 《PyTorch_tutorial_0.0.5_余霆嵩》
- 《动手编写深度学习推理框架 Planer》
- distill:知识精要和在线可视化
- LLVM IR入门指南
- nanoPyC