目录
关于
这是为那些希望在自己的时间内,免费完成数据科学本科课程的人准备的路径,课程来自世界上最好的大学。
在我们的课程中,我们优先选择MOOC(大规模开放在线课程)风格的课程,因为这些课程是考虑到我们的学习方式而创建的。
课程指南
OSSU数据科学使用数据科学本科课程指南报告作为我们课程推荐的指导。
如何使用本指南
持续时间
如果您精心规划并每周投入大约20小时的学习时间,大约2年内可以完成。学习者可以使用这个电子表格来估算结束日期。复制一份并在"Timeline"表中输入您的开始日期和预期每周学习时间。在学习课程时,您可以在课程数据表中输入实际的课程完成日期,并获得更新后的完成估算。
警告: 虽然电子表格是估算完成此课程所需时间的有用工具,但它可能不会与课程大纲保持同步。请仅使用电子表格来估算您需要的时间。使用GitHub仓库来查看需要学习的课程。
课程顺序
有些课程可以并行学习,而其他课程必须按顺序学习。每个主题内的所有课程都应按课程大纲中列出的顺序学习。下图展示了主题应该如何排序。
跟踪您的进度
将GitHub仓库Fork到您自己的GitHub账户,并在完成每个内容时在旁边标上✅。这可以作为您的看板,实施起来比任何其他解决方案都要快(让您有时间专注于课程)。
我应该使用哪些编程语言?
Python和R在数据科学社区中被广泛使用,我们的课程会教您这两种语言。请记住,每门课程的重要之处在于内化核心概念,并能够使用您选择的任何工具(编程语言)来应用这些概念。
内容政策
您只能分享您被允许分享的文件。不要违反您在课程开始时签署的行为准则。
社区
我们有一个Discord服务器!这应该是您与其他OSSU学生交流的首选地点。为什么不现在就来介绍一下自己呢?
您也可以通过GitHub issues进行互动。
将开源社区大学添加到您的LinkedIn个人资料中!
警告: 在搜索OSSU时,您可能会发现一些第三方/已废弃/过时的材料。我们建议您忽略它们,只使用OSSU数据科学GitHub仓库。一些已知的过时材料包括:
- 一个未维护和已废弃的Trello面板
- 第三方Notion模板
先决条件
课程大纲
数据科学导论
计算机科学导论
已经掌握任何语言基础编程的学生可以跳过第一门课程
数据结构与算法
算法课程使用Java教学。如果学生需要学习Java,他们应该先学习这门课程
算法IV:模式匹配、Dijkstra算法、最小生成树和动态规划算法
数据库
单变量微积分
线性代数
多变量微积分
统计学与概率论
斯坦福大学在EdX上的Python统计学习课程 (教材, 教材资源) 或 斯坦福大学在EdX上的R统计学习课程 (教材, 教材资源)
数据科学工具与方法
机器学习/数据挖掘
最终项目
学习的一部分是动手实践。 每门课程的作业和考试都是为了让你准备好运用所学知识解决现实世界的问题。
完成课程后,你应该找出一个可以运用所学知识解决的问题。 你可以创造全新的东西,也可以改进你使用的某些工具/程序,让它们变得更好。
希望获得更多项目指导的学生可以选择一系列面向项目的课程。 此页面提供了一些样本选项 (还有更多可用选项,此时你应该能够找出有趣且与你相关的系列课程)。
恭喜
完成上述课程要求后, 你将完成相当于数据科学学士学位的全部内容。 恭喜你!
接下来你可以做什么?可能性是无限的,而且相互重叠:
- 寻找数据科学家的工作!
- 查看阅读清单,阅读一些经典书籍,磨练你的技能并扩展你的知识。
- 加入当地的数据科学聚会(例如通过meetup.com)。
- 关注数据科学世界中的新兴技术。
如何贡献
你可以提出问题,给我们提供改进指南的建议,或者告诉我们如何改善学习体验。
如果你想推荐新资源,请发送拉取请求,将该资源添加到extras部分。extras部分是我们所有人都可以提交有趣的额外文章、书籍、课程和专业方向的地方。
行为准则
团队
- 课程维护者:Waciuma Wanjohi
- 贡献者:贡献者