#数据工程
llm-twin-course
LLM Twin Course是一个免费课程,旨在指导学员如何设计、训练并部署生产级LLM副本。参与者将了解基于LLMOps最佳实践来构建适用于实际应用的LLM系统,涵盖从数据采集、特征处理到训练和推理的完整开发流程,并熟悉实验跟踪、模型注册和版本控制等核心MLOps技术。该课程适合有基础Python、机器学习及云服务经验的MLE、DE、DS或SWE专业人士。
applied-ml
通过精选的论文、文章和博客,学习企业如何实施数据科学与机器学习项目。了解不同公司对问题的定义、所采用的机器学习技术、背后的科学原理,以及所取得的商业成果,以便更好地评估投资回报。同时还包括最新的机器学习研究进展和实用指南。
data-engineer-handbook
该项目汇集了数据工程领域的丰富资源,包括推荐书籍、社区平台、公司简介、技术博客、白皮书、视频频道、播客和新闻通讯等。内容涵盖数据工程的方方面面,从入门基础到高阶主题,为数据工程从业者和学习者提供了全面的学习材料和行业洞察。无论是初学者还是资深专业人士,都能在此找到提升技能和把握行业动态的有价值信息。
data-engineering-interview-questions
该项目收集整理了2000多个数据工程师面试问题,涵盖数据库、数据仓库、大数据框架、云服务等多个领域。除详细问题清单外,还提供各技术的官方链接和学习资源,为数据工程师备战面试和技能提升提供全面支持。
resources-to-become-a-great-engineering-leader
此资源集锦针对工程领导者精心打造,内容涉及软件工程、系统设计、数据工程、领导力和管理等核心领域。汇集100余种精选学习材料,包括权威书籍、行业通讯、专业博客和专家推荐。项目为工程师提供系统化学习路径,助力其在2024年提升领导能力,实现职业飞跃。
data-engineering-roadmap
data-engineering-roadmap是一个开源项目,为数据工程师提供全面的职业发展路线图。该项目涵盖从初级到高级的所有层次,提供行业指导和最佳实践。作为一个动态文档,项目欢迎社区贡献,持续优化以服务整个数据工程领域。
data-engineering-zoomcamp
Data Engineering Zoomcamp是一个全面的数据工程在线课程,涵盖容器化、工作流编排、数据仓库、分析工程、批处理和流处理等关键领域。课程通过实践项目教授Docker、Terraform、Mage、BigQuery、dbt、Spark和Kafka等主流工具的应用。由行业专家授课,适合具备基础编程和SQL技能的学习者。课程提供自学和定期cohort两种学习模式,为期数周。
Dflux
Dflux整合了数据连接、工程处理、模型开发和可视化分析等功能于一体的数据科学平台。它提供端到端的数据处理和智能分析解决方案,支持无代码机器学习,适合各类用户高效进行数据分析和洞察挖掘。平台还具备交互式仪表板和自动化决策功能,有助于企业实现客户留存和业务增长。
Heimdall
Heimdall是一个无代码机器学习平台,致力于普及机器学习技术。平台提供一站式解决方案,支持多种机器学习模型的构建、部署和监控。涵盖数据科学和工程任务,如分类、回归、预测和推荐系统。平台特有的The Forge功能可将非结构化数据转换为特征向量,无需编码即可完成。通过集成多种数据源和直观的界面,Heimdall使各类用户都能轻松应用机器学习技术,促进业务创新和发展。