ml-road-map

ml-road-map

机器学习基础知识的系统学习路线图

ml-road-map项目提供一份系统的机器学习学习路线图,涵盖从基础到进阶的知识体系。该路线图包括编程、数学、机器学习基础、深度学习和自然语言处理等主题,汇集了顶尖教育机构和专家的优质资源。它为学习者提供清晰的学习指南,帮助他们构建机器学习知识体系,为独立探索奠定基础。

机器学习深度学习人工智能编程数学Github开源项目

机器学习路线图

机器学习路线图涡轮

欢迎来到机器学习路线图。这是一份快速、高质量的路线图,旨在帮助你迅速掌握机器学习基础知识。它教授你理解机器学习工作原理和进行构建所需的先决条件和基础知识。目标是快速达到一个可以自主探索机器学习主题的水平。虽然许多其他路线图更加全面,但这份路线图是经过精心简化的。

这些资源汇集了最优秀的机器学习教育者的成果。我尽可能地链接了原作者。请支持他们。反馈/建议/纠正总是受欢迎和感激的。

如果你对机器学习的技术细节不太感兴趣,而更想了解机器学习将如何影响你作为消费者的生活,我专门写了一篇文章。你也可以查看谷歌AI基础课程,学习如何使用生成式AI来提高你的生产力。

**随着新的学习资源的创建和新的机器学习主题的出现,这份路线图将会不断更新。**让我们开始吧!

如果你想查看之前的路线图,可以在这里找到。


开始之前需要了解的事项

  • **机器学习将影响每个人的生活。**这是一种新的计算范式,将彻底改变消费者对设备工作方式的期望。
  • **机器学习是一个快速发展的领域。**机器学习中有许多复杂的领域。慢慢来,不要期望一下子就成为所有方面的专家。
  • **理解机器学习的最佳方式是向那些了解你想知道的主题的人学习。**我创建了一个X平台上值得关注的账号列表。我还整理了一份时事通讯、博客和频道列表,我发现这些对保持最新信息很有帮助。

机器学习先决条件

这些先决条件包含数学和编程概念的混合。你可以跳过已经理解的内容。

主题来源作者
编程
通用编程CS50哈佛大学
PythonPython入门(适合初学者)哈佛大学
谷歌Python课程(复习用)谷歌
NumPyNumPy教程谷歌
PandasPandas课程Kaggle
数学
代数代数课程可汗学院
线性代数线性代数课程可汗学院
概率CS50的不确定性部分哈佛大学
微积分导数/偏导数可汗学院
梯度可汗学院
反向传播可视化谷歌
工具
版本控制学习如何使用Git开源Git社区
GitHub教程GitHub
终端学习Shelllearnshell.org

机器学习基础

这是主要材料。完成这些内容以理解机器学习基础:

主题来源作者
简介20分钟机器学习入门谷歌
基础机器学习速成课程谷歌

高级机器学习主题

探索更高级主题的高质量资源,这些对机器学习很有帮助:

主题来源作者类型
通用高级机器学习主题机器学习问答与人工智能Sebastian Raschka书籍
大型语言模型大型语言模型入门Andrej Karpathy视频
开发、构建和微调大型语言模型Sebastian Raschka视频
从头构建大型语言模型Sebastian Raschka书籍/代码库
大型语言模型课程的量化部分Maxime Labonne课程/代码库
大型语言模型工具Maxime Labonne课程/代码库
大型语言模型工程Maxime Labonne课程/代码库
大型语言模型工程师手册Paul Iusztin, Maxime Labonne, Alex Vesa书籍
生成式人工智能生成式人工智能入门微软课程/代码库
自然语言处理(NLP)NLP课程Huggingface课程
Transformer模型NLP课程开始Huggingface课程
深度学习深度学习基础LightningAI课程
深度学习书籍Ian Goodfellow、Yoshua Bengio和Aaron Courville书籍
工程师深度学习指南Hironobu Suzuki书籍
强化学习(RL)Spinning UpOpenAI课程
计算机视觉计算机视觉Kaggle课程
无监督学习CS229后半部分Andrew Ng/斯坦福讲座
监督学习科学领域的监督机器学习Christoph Molnar & Timo Freiesleben书籍
视频游戏机器学习游戏机器学习Huggingface课程
特征工程数据准备谷歌课程
人工智能伦理人工智能伦理入门Kaggle课程
机器学习可解释性机器学习可解释性Kaggle课程
机器学习运维Made with MLGoku Mohandas课程
构建大型语言模型的虚拟课堂ML SchoolSantiago交互式课程
Python进阶The Python Coding PlaceStephen Gruppetta网站/书籍
SQLSQL入门Kaggle课程
高级SQLKaggle课程
机器学习面试准备机器学习面试学习计划Khang Pham代码库
机器学习数学机器学习的数学Tivadar Danka书籍
机器学习效率EfficientML.ai 讲座麻省理工学院课程
知识蒸馏优秀知识蒸馏资源Dmitry Kozlov代码库
系统设计系统设计面试 第一卷第二卷Alex Xu图书

机器学习的通讯、博客和频道

以下都是必须订阅的资源:

资源作者
博客/通讯
Ahead of AISebastian Raschka
AI Made SimpleDevansh
Society's BackendLogan Thorneloe
The BatchAndrew Ng
InterconnectsNathan Lambert
Deep (Learning) FocusCameron R. Wolfe
ML SpringAkshay Pachaar
Spatial IntelligenceBilawal Sidhu
The AIEdgeDamien Benveniste
Google DeepMind 博客多位作者
OpenAI 博客多位作者
Meta AI 博客多位作者
QiuByteHesam Sheikh
NLP 通讯Elvis
The PalindromeTivadar Danka
YouTube
Andrej KarpathyAndrej Karpathy
Spatial IntelligenceBilawal Sidhu
Jay AlammarJay Alammar
Mervin PraisonMervin Praison
Nicholas RenotteNicholas Renotte
Jeremy HowardJeremy Howard
Logan ThorneloeLogan Thorneloe
3Blue1BrownGrant Sanderson
RohanPaulAIRohan Paul

要查看几乎所有可用的ML YouTube课程列表,请查看Dair AI的这个仓库

用于训练的免费GPU

我整理了一份提供免费套餐用于训练机器学习模型的云服务提供商列表。任何人都可以开始学习ML - 你不需要一台功能强大的本地机器。如果有任何不正确的信息,请在X上联系我,我会进行修正。如果我遗漏了任何云计算平台,也请告诉我。

资源详情
首选
Google Colab提供免费访问GPU(通常是NVIDIA T4或P100)和TPU,但使用时间和资源有限。非常适合小型项目和实验。
Kaggle Notebooks每周免费提供30小时的GPU使用时间(NVIDIA Tesla P100或T4)。这是一个不错的选择,可以访问Kaggle的数据集和社区。
其他选项
Lightning AI提供一个免费的工作室,有22个GPU小时,之后按使用量付费。
Google Cloud Platform为新用户提供300美元的免费积分。
Amazon SageMaker提供免费套餐,可有限访问各种机器学习资源。
Paperspace Gradient提供免费的社区套餐,可以有限访问GPU资源进行实验和学习。

支持本指南

别忘了给这个仓库加星,并在X上关注我以支持本指南。**请通过我提供的链接关注这些资源的作者来支持他们。**你也可以在我的X上的ML列表中找到他们。

如果有任何信息缺失,你是某个资源的作者并希望将其删除,或有任何其他反馈,请给我发消息告诉我。

编辑推荐精选

Manus

Manus

全面超越基准的 AI Agent助手

Manus 是一款通用人工智能代理平台,能够将您的创意和想法迅速转化为实际成果。无论是定制旅行规划、深入的数据分析,还是教育支持与商业决策,Manus 都能高效整合信息,提供精准解决方案。它以直观的交互体验和领先的技术,为用户开启了一个智慧驱动、轻松高效的新时代,让每个灵感都能得到完美落地。

飞书知识问答

飞书知识问答

飞书官方推出的AI知识库 上传word pdf即可部署AI私有知识库

基于DeepSeek R1大模型构建的知识管理系统,支持PDF、Word、PPT等常见文档格式解析,实现云端与本地数据的双向同步。系统具备实时网络检索能力,可自动关联外部信息源,通过语义理解技术处理结构化与非结构化数据。免费版本提供基础知识库搭建功能,适用于企业文档管理和个人学习资料整理场景。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

TraeAI IDE协作生产力转型热门AI工具
酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

使用教程AI工具酷表ChatExcelAI智能客服AI营销产品
DeepEP

DeepEP

DeepSeek开源的专家并行通信优化框架

DeepEP是一个专为大规模分布式计算设计的通信库,重点解决专家并行模式中的通信瓶颈问题。其核心架构采用分层拓扑感知技术,能够自动识别节点间物理连接关系,优化数据传输路径。通过实现动态路由选择与负载均衡机制,系统在千卡级计算集群中维持稳定的低延迟特性,同时兼容主流深度学习框架的通信接口。

DeepSeek

DeepSeek

全球领先开源大模型,高效智能助手

DeepSeek是一家幻方量化创办的专注于通用人工智能的中国科技公司,主攻大模型研发与应用。DeepSeek-R1是开源的推理模型,擅长处理复杂任务且可免费商用。

KnowS

KnowS

AI医学搜索引擎 整合4000万+实时更新的全球医学文献

医学领域专用搜索引擎整合4000万+实时更新的全球医学文献,通过自主研发AI模型实现精准知识检索。系统每日更新指南、中英文文献及会议资料,搜索准确率较传统工具提升80%,同时将大模型幻觉率控制在8%以下。支持临床建议生成、文献深度解析、学术报告制作等全流程科研辅助,典型用户反馈显示每周可节省医疗工作者70%时间。

Windsurf Wave 3

Windsurf Wave 3

Windsurf Editor推出第三次重大更新Wave 3

新增模型上下文协议支持与智能编辑功能。本次更新包含五项核心改进:支持接入MCP协议扩展工具生态,Tab键智能跳转提升编码效率,Turbo模式实现自动化终端操作,图片拖拽功能优化多模态交互,以及面向付费用户的个性化图标定制。系统同步集成DeepSeek、Gemini等新模型,并通过信用点数机制实现差异化的资源调配。

AI IDE
腾讯元宝

腾讯元宝

腾讯自研的混元大模型AI助手

腾讯元宝是腾讯基于自研的混元大模型推出的一款多功能AI应用,旨在通过人工智能技术提升用户在写作、绘画、翻译、编程、搜索、阅读总结等多个领域的工作与生活效率。

AI 办公助手AI对话AI助手AI工具腾讯元宝智能体热门
Grok3

Grok3

埃隆·马斯克旗下的人工智能公司 xAI 推出的第三代大规模语言模型

Grok3 是由埃隆·马斯克旗下的人工智能公司 xAI 推出的第三代大规模语言模型,常被马斯克称为“地球上最聪明的 AI”。它不仅是在前代产品 Grok 1 和 Grok 2 基础上的一次飞跃,还在多个关键技术上实现了创新突破。

下拉加载更多