Project Icon

data-science

开源社区大学提供的数据科学自学课程

开源社区大学提供的数据科学自学课程,汇集世界顶尖大学的在线资源。课程覆盖数据科学本科全部内容,包括编程、数学、统计学和机器学习等。学习者可自主安排进度,利用进度跟踪工具和社区支持完成学习。这一免费资源为有志于数据科学领域的学习者提供了全面的教育路径。

开源社区徽标

开源社区大学

:bar_chart: 免费自学数据科学的路径!

开源社区大学 - 数据科学

目录

关于

这是为那些希望在自己的时间内,免费完成数据科学本科课程的人准备的路径,课程来自世界上最好的大学

在我们的课程中,我们优先选择MOOC(大规模开放在线课程)风格的课程,因为这些课程是考虑到我们的学习方式而创建的。

课程指南

OSSU数据科学使用数据科学本科课程指南报告作为我们课程推荐的指导。

如何使用本指南

持续时间

如果您精心规划并每周投入大约20小时的学习时间,大约2年内可以完成。学习者可以使用这个电子表格来估算结束日期。复制一份并在"Timeline"表中输入您的开始日期和预期每周学习时间。在学习课程时,您可以在课程数据表中输入实际的课程完成日期,并获得更新后的完成估算。

警告: 虽然电子表格是估算完成此课程所需时间的有用工具,但它可能不会与课程大纲保持同步。请仅使用电子表格来估算您需要的时间。使用GitHub仓库来查看需要学习的课程。

课程顺序

有些课程可以并行学习,而其他课程必须按顺序学习。每个主题内的所有课程都应按课程大纲中列出的顺序学习。下图展示了主题应该如何排序。

主题进度图

跟踪您的进度

GitHub仓库Fork到您自己的GitHub账户,并在完成每个内容时在旁边标上✅。这可以作为您的看板,实施起来比任何其他解决方案都要快(让您有时间专注于课程)。

我应该使用哪些编程语言?

Python和R在数据科学社区中被广泛使用,我们的课程会教您这两种语言。请记住,每门课程的重要之处在于内化核心概念,并能够使用您选择的任何工具(编程语言)来应用这些概念。

内容政策

您只能分享您被允许分享的文件。不要违反您在课程开始时签署的行为准则。

社区

我们有一个Discord服务器!这应该是您与其他OSSU学生交流的首选地点。为什么不现在就来介绍一下自己呢?

您也可以通过GitHub issues进行互动。

开源社区大学添加到您的LinkedIn个人资料中!

警告: 在搜索OSSU时,您可能会发现一些第三方/已废弃/过时的材料。我们建议您忽略它们,只使用OSSU数据科学GitHub仓库。一些已知的过时材料包括:

  • 一个未维护和已废弃的Trello面板
  • 第三方Notion模板

先决条件

数据科学课程假设学生已经学习了高中数学统计学

课程大纲

数据科学导论

什么是数据科学

计算机科学导论

已经掌握任何语言基础编程的学生可以跳过第一门课程

编程导论

使用Python的计算机科学与编程导论

计算思维与数据科学导论

数据结构与算法

算法课程使用Java教学。如果学生需要学习Java,他们应该先学习这门课程

Java编程

算法I:ArrayList、LinkedList、栈和队列

算法II:二叉树、堆、跳表和哈希表

算法III:AVL和2-4树、分治算法

算法IV:模式匹配、Dijkstra算法、最小生成树和动态规划算法

数据库

数据库管理要点

数据仓库概念、设计和数据集成

数据仓库的关系数据库支持

商业智能概念、工具和应用

为商业智能实施设计和构建数据仓库

MongoDB开发者学习路径

单变量微积分

微积分1A:微分

微积分1B:积分

微积分1C:坐标系统与无穷级数

线性代数

线性代数的本质

线性代数

多变量微积分

多变量微积分

统计学与概率论

概率论导论

描述性统计学入门

推论统计学入门

斯坦福大学在EdX上的Python统计学习课程 (教材, 教材资源) 或 斯坦福大学在EdX上的R统计学习课程 (教材, 教材资源)

数据科学工具与方法

数据科学工具

数据科学方法论

数据科学:数据整理

机器学习/数据挖掘

监督机器学习:回归和分类

高级学习算法

无监督学习、推荐系统、强化学习

机器学习入门

大规模数据集挖掘

流程挖掘

最终项目

学习的一部分是动手实践。 每门课程的作业和考试都是为了让你准备好运用所学知识解决现实世界的问题。

完成课程后,你应该找出一个可以运用所学知识解决的问题。 你可以创造全新的东西,也可以改进你使用的某些工具/程序,让它们变得更好。

希望获得更多项目指导的学生可以选择一系列面向项目的课程。 此页面提供了一些样本选项 (还有更多可用选项,此时你应该能够找出有趣且与你相关的系列课程)。

恭喜

完成上述课程要求后, 你将完成相当于数据科学学士学位的全部内容。 恭喜你!

接下来你可以做什么?可能性是无限的,而且相互重叠:

  • 寻找数据科学家的工作!
  • 查看阅读清单,阅读一些经典书籍,磨练你的技能并扩展你的知识。
  • 加入当地的数据科学聚会(例如通过meetup.com)。
  • 关注数据科学世界中的新兴技术。

不断学习

如何贡献

你可以提出问题,给我们提供改进指南的建议,或者告诉我们如何改善学习体验。

你也可以复刻这个项目并发送拉取请求来修复你发现的任何错误。

如果你想推荐新资源,请发送拉取请求,将该资源添加到extras部分。extras部分是我们所有人都可以提交有趣的额外文章、书籍、课程和专业方向的地方。

行为准则

OSSU的行为准则

团队

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号