#Scala
Scio: Scala API for Apache Beam和Google Cloud Dataflow
TransmogrifAI: 革新机器学习开发的AutoML利器
TransmogrifAI
TransmogrifAI是一个基于Apache Spark的自动化机器学习库,使用Scala编写,旨在提高开发效率。它提供类型安全、模块化和可重用的API,使用户能快速构建生产级机器学习应用,无需深厚的机器学习知识。该库显著减少模型调优时间,同时实现高精度。
scio
Scio是一个为Apache Beam和Google Cloud Dataflow设计的Scala API,灵感源自Apache Spark和Scalding。它支持统一的批处理和流处理编程模型,并与Google Cloud产品及多种工具如Avro、Cassandra、Elasticsearch、gRPC、JDBC、Neo4j、Parquet、Redis和TensorFlow等集成。Scio还具备交互模式、类型安全的BigQuery访问,并支持与Algebird和Breeze的集成,通过Scala Futures进行管道编排。其详尽的文档、示例和扩展模块为用户提供了全面的使用指南和示例。
smithy4s
Smithy4s是一个Scala工具,能够生成高性能的HTTP服务。该工具提供详尽的文档和性能基准,帮助用户比较不同实现方式的性能差异。开发环境支持Nix、direnv和sbt等多种工具,并通过YourKit Java Profiler优化性能。Smithy4s适用于多种Scala版本和构建组合,为开发者提供灵活的支持。
guardrail
guardrail是一款能够读取OpenAPI/Swagger规范文件,并为Scala和Java生成源代码的工具。其支持的库和框架包括Scala的akka-http、http4s和dropwizard,以及Java的dropwizard和spring-mvc。该工具提供适用于sbt、Maven和Gradle的插件,并通过sbt-version-policy确保模块间的二进制兼容性。适合新手和有经验的开发者,项目提供详细的贡献指南和问题追踪页面,便于社区参与项目发展。
every-single-day-i-tldr
该项目是一个每日阅读资源的合集,包括文章、博客和视频,内容涵盖Scala、数据工程、Java、大数据等技术主题。用户可以使用Ctrl+F快速查找所需内容,非常适合关注Kafka生态系统管理和最新技术趋势的人。
kafka
Apache Kafka是一个开源的分布式事件流平台,为数据管道、流分析、数据集成和关键任务应用提供支持。它采用发布/订阅模式,具有高吞吐量、可扩展性和容错能力。Kafka支持多种编程语言,提供完整的开发工具链。开发者可在本地或集群环境中运行Kafka,进行各类测试。该项目致力于社区建设,欢迎各方贡献。
weaver-test
weaver-test 是基于 cats-effect 和 fs2 构建的 Scala 测试框架,支持并行测试执行、可组合断言、聚合失败报告和懒加载日志。框架兼容 Scala 2.12、2.13 和 3.0 版本,提供 SimpleIOSuite 和 IOSuite 等多种测试套件。weaver-test 集成 Scalacheck 实现属性测试,致力于优化测试编写和运行体验。
parboiled2
parboiled2是一个用于Scala 2.12+的PEG解析器生成库。它在编译时将语法规则转换为JVM字节码,提供轻量高效的文本解析能力。该库具有简洁的DSL、准确的错误报告和高性能,可替代正则表达式,适用于多种解析场景。parboiled2无外部依赖,上手简单,是一个功能强大yet易用的解析工具。
ducktape
ducktape 是一个为 Scala 3 开发的数据转换库,实现了 case class 和枚举/密封特质间的无样板代码转换。该库能处理字段重排、类型变更和可选字段等复杂数据结构差异。适用于 JSON、protobuf 等数据模型的转换,简化开发流程并提升代码可读性。