#H2O-3
Sparkling Water: 融合H2O与Apache Spark的强大机器学习引擎
3 个月前
相关项目
h2o-3
H2O-3是一个支持多编程语言的高性能内存中分布式机器学习平台,提供广泛的算法如GLM、随机森林、深度神经网络等,并可扩展以添加自定义算法。平台与Hadoop和Spark等大数据技术完美整合,可通过POJO或MOJO格式轻松导出模型至生产环境,适合各类数据科学家在大数据场景下进行机器学习开发。
sparkling-water
Sparkling Water是一个开源项目,将H2O-3机器学习引擎与Apache Spark集成。它提供了Spark和H2O数据结构间的转换工具,支持使用Spark数据作为H2O算法输入,并提供构建机器学习应用的基础模块。项目还包含PySparkling接口,支持从PySpark直接使用。Sparkling Water支持Spark Shell集成、Spark Submit应用、以及通过Maven包使用。它提供多种后端部署模式,适应不同使用场景。项目致力于简化大规模数据处理和机器学习任务的开发流程,在Spark环境中优化机器学习解决方案的开发和部署过程。