设计机器学习系统(Chip Huyen 2022)
机器学习系统既复杂又独特。复杂是因为它们由许多不同的组件组成,涉及许多不同的利益相关者。独特是因为它们依赖于数据,而数据在不同的用例中差异很大。在本书中,你将学习一种全面的方法来设计可靠、可扩展、可维护并能适应不断变化的环境和业务需求的机器学习系统。
本书已被翻译成西班牙语、日语、韩语、波兰语和泰语。
本书可在以下平台购买:
- 亚马逊
- O'Reilly
- Kindle
以及大多数销售技术书籍的地方。
仓库结构
本书着重于开发和部署机器学习系统时的关键设计决策。这不是一本教程书,因此没有大量的代码片段。在这个仓库中,你不会找到代码示例,但你会找到:
- 目录
- 章节摘要
- MLOps工具
- 资源
- 基础机器学习概念的简短回顾
贡献
欢迎创建问题或提交拉取请求。非常感谢你的反馈!
本书适合谁
本书适合任何想利用机器学习解决实际问题的人。本书中的机器学习既指深度学习,也指经典算法,侧重于大规模机器学习系统,如中大型企业和快速成长的初创公司中所见到的系统。小规模系统往往不那么复杂,可能从本书所述的全面方法中受益较少。
由于我的背景是工程,本书的语言面向工程师,包括机器学习工程师、数据科学家、数据工程师、机器学习平台工程师和工程经理。
你可能会与以下场景中的一个产生共鸣:
- 你被给予了一个业务问题和大量原始数据。你想要处理这些数据并选择合适的指标来解决这个问题。
- 你的初始模型在离线实验中表现良好,你想部署它们。
- 模型部署后,你对模型的表现几乎没有反馈,你想找出一种方法来快速检测、调试和解决模型在生产环境中可能遇到的任何问题。
- 你团队开发、评估、部署和更新模型的过程大多是手动的、缓慢的且容易出错。你想自动化并改进这个过程。
- 你组织中的每个机器学习用例都使用自己的工作流部署,你想建立可以在不同用例之间共享和重用的基础(例如,模型存储、特征存储、监控工具)。
- 你担心你的机器学习系统可能存在偏见,你想让你的系统负责任!
如果你属于以下群体之一,也可以从本书中受益:
- 想要识别机器学习生产中服务不足领域并弄清如何在生态系统中定位你的工具的工具开发人员。
- 寻找业界机器学习相关职位的个人。
- 正在考虑采用机器学习解决方案来改进产品和/或业务流程的技术和业务领导者。没有强大技术背景的读者可能从第1、2和11章中受益最多。
评论
-
"这无疑是你能读到的关于如何在公司构建、部署和扩展机器学习模型以获得最大影响的最好的书。Chip是一位出色的老师,她知识的广度和深度是无与伦比的。" - Josh Wills,WeaveGrid软件工程师,前Slack数据工程总监
-
"要成为一名有效的机器学习工程师,需要掌握大量信息。很难从中筛选出最相关的信息,但Chip在这本书中做到了这一点。如果你认真对待生产中的机器学习,并关心如何端到端地设计和实现机器学习系统,这本书是必不可少的。" - Laurence Moroney,谷歌人工智能和机器学习负责人
-
"这是最好的资源之一,专注于生产机器学习系统设计背后的首要原则。是导航短暂的工具和平台选择景观的必读之作。" - Goku Mohandas,Made With ML创始人
看看人们在Twitter上对这本书的评论 @designmlsys!
Chip Huyen,《设计机器学习系统》。O'Reilly Media,2022年。
@book{dmlsbook2022,
address = {USA},
author = {Chip Huyen},
isbn = {978-1801819312},
publisher = {O'Reilly Media},
title = {{Designing Machine Learning Systems}},
year = {2022}
}