#分布式机器学习
h2o-3 - 支持多编程语言的高性能内存中分布式机器学习平台
H2O-3分布式机器学习算法模型部署开源资源Github开源项目
H2O-3是一个支持多编程语言的高性能内存中分布式机器学习平台,提供广泛的算法如GLM、随机森林、深度神经网络等,并可扩展以添加自定义算法。平台与Hadoop和Spark等大数据技术完美整合,可通过POJO或MOJO格式轻松导出模型至生产环境,适合各类数据科学家在大数据场景下进行机器学习开发。
distributed-ml-patterns - 构建并优化分布式机器学习系统的方法
Distributed Machine Learning Patterns分布式机器学习KubernetesKubeflowArgo WorkflowsGithub开源项目
《Distributed Machine Learning Patterns》一书详细介绍了如何构建可扩展和高可靠性的机器学习系统。内容涵盖数据摄取、分布式训练、模型服务等方面,以及如何利用Kubernetes、TensorFlow、Kubeflow和Argo Workflows实现任务自动化。通过该书,读者将掌握关键概念与实际案例,并学会在大规模集群上管理和监控机器学习任务。本书适合具备基础机器学习知识的数据分析师、数据科学家和软件工程师。