#Scala

TransmogrifAI - 自动化机器学习工作流
TransmogrifAIApache SparkAutoMLScalaSalesforceGithub开源项目
TransmogrifAI是一个基于Apache Spark的自动化机器学习库,使用Scala编写,旨在提高开发效率。它提供类型安全、模块化和可重用的API,使用户能快速构建生产级机器学习应用,无需深厚的机器学习知识。该库显著减少模型调优时间,同时实现高精度。
scio - 用于 Apache Beam 和 Google Cloud Dataflow 的 Scala API
ScioScalaApache BeamGoogle Cloud Dataflow分布式数据处理Github开源项目
Scio是一个为Apache Beam和Google Cloud Dataflow设计的Scala API,灵感源自Apache Spark和Scalding。它支持统一的批处理和流处理编程模型,并与Google Cloud产品及多种工具如Avro、Cassandra、Elasticsearch、gRPC、JDBC、Neo4j、Parquet、Redis和TensorFlow等集成。Scio还具备交互模式、类型安全的BigQuery访问,并支持与Algebird和Breeze的集成,通过Scala Futures进行管道编排。其详尽的文档、示例和扩展模块为用户提供了全面的使用指南和示例。
smithy4s - HTTP服务生成工具
smithy4sScalaNixbloopsbtGithub开源项目
Smithy4s是一个Scala工具,能够生成高性能的HTTP服务。该工具提供详尽的文档和性能基准,帮助用户比较不同实现方式的性能差异。开发环境支持Nix、direnv和sbt等多种工具,并通过YourKit Java Profiler优化性能。Smithy4s适用于多种Scala版本和构建组合,为开发者提供灵活的支持。
guardrail - 基于OpenAPI/Swagger的多库和框架代码生成工具
guardrail代码生成工具OpenAPIScalaJavaGithub开源项目
guardrail是一款能够读取OpenAPI/Swagger规范文件,并为Scala和Java生成源代码的工具。其支持的库和框架包括Scala的akka-http、http4s和dropwizard,以及Java的dropwizard和spring-mvc。该工具提供适用于sbt、Maven和Gradle的插件,并通过sbt-version-policy确保模块间的二进制兼容性。适合新手和有经验的开发者,项目提供详细的贡献指南和问题追踪页面,便于社区参与项目发展。
every-single-day-i-tldr - 每日汇编Scala、大数据和Kafka等技术资源
KafkaData EngineeringBig DataScalaJavaGithub开源项目
该项目是一个每日阅读资源的合集,包括文章、博客和视频,内容涵盖Scala、数据工程、Java、大数据等技术主题。用户可以使用Ctrl+F快速查找所需内容,非常适合关注Kafka生态系统管理和最新技术趋势的人。
kafka - 开源分布式事件流平台
Apache Kafka分布式消息系统JavaScala构建测试Github开源项目
Apache Kafka是一个开源的分布式事件流平台,为数据管道、流分析、数据集成和关键任务应用提供支持。它采用发布/订阅模式,具有高吞吐量、可扩展性和容错能力。Kafka支持多种编程语言,提供完整的开发工具链。开发者可在本地或集群环境中运行Kafka,进行各类测试。该项目致力于社区建设,欢迎各方贡献。
weaver-test - 基于 cats-effect 和 fs2 的高效并行 Scala 测试框架
Weaver-test测试框架Scala并行测试断言Github开源项目
weaver-test 是基于 cats-effect 和 fs2 构建的 Scala 测试框架,支持并行测试执行、可组合断言、聚合失败报告和懒加载日志。框架兼容 Scala 2.12、2.13 和 3.0 版本,提供 SimpleIOSuite 和 IOSuite 等多种测试套件。weaver-test 集成 Scalacheck 实现属性测试,致力于优化测试编写和运行体验。
parboiled2 - Scala 2.12+的高效PEG解析器生成库
parboiled2解析器生成器ScalaPEGDSLGithub开源项目
parboiled2是一个用于Scala 2.12+的PEG解析器生成库。它在编译时将语法规则转换为JVM字节码,提供轻量高效的文本解析能力。该库具有简洁的DSL、准确的错误报告和高性能,可替代正则表达式,适用于多种解析场景。parboiled2无外部依赖,上手简单,是一个功能强大yet易用的解析工具。
ducktape - Scala 3 无样板代码数据转换库
ducktapeScala类型转换框架JSONGithub开源项目
ducktape 是一个为 Scala 3 开发的数据转换库,实现了 case class 和枚举/密封特质间的无样板代码转换。该库能处理字段重排、类型变更和可选字段等复杂数据结构差异。适用于 JSON、protobuf 等数据模型的转换,简化开发流程并提升代码可读性。
parquet4s - 高效实用的Scala Parquet文件操作库
Parquet4SScalaParquet文件数据序列化HadoopGithub开源项目
Parquet4S是专为Scala设计的Parquet文件处理库。该库支持使用Scala case class定义数据模式,无需额外序列化系统。兼容Apache Spark生成的文件,支持通用记录,并与Akka Streams、Pekko Streams和FS2集成。基于Parquet官方库和Hadoop Client开发,Parquet4S能连接各种Hadoop兼容存储,如AWS S3和Google Cloud Storage。支持Scala 2.12.x、2.13.x和3.3.x版本。
spark-nlp-workshop - Python和Scala自然语言处理实践资源
Spark NLP自然语言处理机器学习PythonScalaGithub开源项目
Spark NLP Workshop是一个开源项目,提供丰富的Jupyter笔记本和教程,展示如何在Python和Scala中使用Spark NLP进行自然语言处理。项目涵盖注释、评估和训练等方面,并包含适用于不同开发环境的Databricks笔记本。此资源库支持本地和Google Colab环境的简易设置,为数据科学家和开发者提供了实用的NLP工具和示例。
otoroshi - 基于Scala的轻量级API管理与HTTP反向代理
OtoroshiAPI管理HTTP反向代理微服务ScalaGithub开源项目
Otoroshi是MAIF OSS团队开发的开源轻量级API管理层和HTTP反向代理。基于Scala语言,集成akka和playframework,实现无服务定位器的微服务调用处理。支持动态配置更新,提供灵活API管理。适用于复杂分布式系统,增强微服务治理能力。
docker-sbt - Scala和sbt项目的Docker环境配置解决方案
DockerScalasbtJDK容器化Github开源项目
docker-sbt提供预配置的Scala和sbt Docker镜像,支持多种JDK版本。这些镜像简化环境设置,增强项目可移植性和一致性。支持非root用户运行,适用于不同Scala项目。每日更新确保工具链始终保持最新。
playframework - 高效构建Java和Scala Web应用的开源框架
Play FrameworkWeb开发框架JavaScala开源项目Github
Play Framework是一个面向Java和Scala开发者的开源Web开发框架。它提供简洁的开发工具,支持快速刷新工作流和内置测试。框架采用无状态和非阻塞架构,有利于应用的可扩展性。Play默认支持RESTful设计,集成了资源编译、JSON和WebSocket功能,适用于现代Web和移动应用开发。该框架旨在平衡开发效率和运行性能。
trading - Scala 3驱动的事件架构参考实现
trading微服务架构事件驱动Scala功能性编程Github开源项目
项目采用Scala 3实现事件驱动架构,包括交易处理、预测、快照和警报等微服务。使用Apache Pulsar进行消息通信,提供Web界面实现实时交易警报订阅。集成了监控、分布式追踪和自动化测试,可作为构建现代事件驱动系统的参考。
awesome-scala - Scala生态系统资源大全,库、框架与工具
Scala数据库开源项目GitHub开发工具Github
这是一个社区维护的Scala生态系统资源列表,汇集了众多实用库、框架和软件。涵盖范围广泛,从数据库访问、Web开发、测试等常用工具,到人工智能、大数据处理等前沿技术的Scala实现。该项目旨在为Scala开发者提供一个便捷的资源参考,帮助他们快速找到适合项目需求的工具,提高开发效率。