#时间序列数据
deepcell-tf
DeepCell-tf是一个用于生物图像单细胞分析的深度学习库,基于Python和TensorFlow 2构建,提供预训练模型用于图像数据分析,并支持开发新的深度学习模型。其特色包括细胞分割和追踪模型的应用,处理2D、3D图像和时间序列数据。此外,还能结合DeepCell Toolbox、DeepCell Tracking和DeepCell Kiosk等工具进行预处理、追踪和大数据集云端部署。该库支持GPU加速,提供详细文档和示例,方便快速上手和模型训练。
ydata-synthetic
ydata-synthetic项目提供了多种工具用于合成数据生成,支持前沿的生成模型如Generative Adversarial Networks (GANs)和高斯混合模型。该项目可以生成保护隐私的合成数据,且有助于消除数据偏差,平衡和扩展数据集。全新streamlit应用程序允许用户在无需编程的情况下快速生成合成数据。常见问题、快速入门指南和Jupyter Notebooks实例帮助用户轻松入门。加入Discord社区获取更多技术支持。
timescaledb
TimescaleDB是PostgreSQL的开源时序数据库扩展,提供自动时空分区和完整SQL支持。它保留标准PostgreSQL接口,同时增强时序数据处理性能。通过虚拟视图(超表)实现透明数据分片,允许用户像操作普通表一样处理大规模时序数据。TimescaleDB使SQL在时序数据领域更具扩展性,适合需要高效管理和分析时间序列数据的应用场景。
FX-1-Minute-Data
FX-1-Minute-Data是一个开源项目,提供自2000年起的外汇、商品和股指1分钟高频数据集。项目包含66多个外汇对、原油和主要股指数据,并提供Python API支持多种时间框架的历史数据下载。数据格式统一,来源可靠,适用于金融分析和算法交易研究。
DoppelGANger
DoppelGANger是一个基于生成对抗网络(GAN)的时间序列数据生成框架。它通过解决长期依赖性和复杂多维关系等挑战,在多个真实数据集上实现了比基准模型高43%的保真度。该框架为网络系统研究提供了一种共享高质量合成数据集的通用方法,有助于推动数据共享实践。DoppelGANger已获得多家公司采用,并提供开源代码实现。
rrd4j
RRD4J是一个Java实现的高性能时间序列数据管理系统,功能类似于RRDTool。该系统支持RRD文件的标准操作,如创建、更新、获取、导出和绘图。RRD4J的优势包括文件可移植性、API简洁、支持多种数据源类型(COUNTER、ABSOLUTE、DERIVE、GAUGE)和合并函数(AVERAGE、MIN、MAX、LAST、TOTAL、FIRST)。此外,它还提供MongoDB和Oracle Berkeley DB等多种后端存储选项。作为纯Java实现,RRD4J无需native函数或库,并且与RRDTool文件格式有所区别。RRD4J主要面向了解RRDTool概念但更倾向于使用纯Java实现的开发人员。
prometheus
Prometheus是由Cloud Native Computing Foundation支持的开源监控系统。它采用多维数据模型和PromQL查询语言,支持单节点自治和HTTP拉取模型。Prometheus能够收集指标、评估规则、显示结果和触发警报,同时提供服务发现、可视化展示和联邦集群功能。作为一个灵活可扩展的监控解决方案,Prometheus适用于多种场景。
kapacitor
Kapacitor是一个开源的时间序列数据处理框架,提供数据监控和告警功能。它使用TICKscript语言定义任务,支持Slack等多种告警方式。Kapacitor与InfluxDB生态系统集成,为时间序列数据管理提供全面解决方案。适用于IoT数据分析、系统性能监控等领域,为用户提供高效的数据处理和分析工具。
timescaledb-docker
TimescaleDB Docker项目提供基于PostgreSQL的时序数据库镜像,支持环境变量配置和自动性能优化。开发者可通过简单命令部署实例,灵活设置遥测级别和资源限制。该解决方案简化了高性能时序数据处理环境的搭建过程,适用于需要快速部署和管理TimescaleDB的场景。项目特点包括基于官方PostgreSQL镜像、支持环境变量配置、自动性能优化、灵活的资源管理和遥测设置。这些功能使TimescaleDB的部署和管理变得更加简单高效,为时序数据处理提供了可靠的基础设施支持。