awesome-time-series

awesome-time-series

时间序列分析资源及工具集锦

该项目汇集了丰富的时间序列和序列数据处理资源。涵盖Python、R、Java等多种语言的工具库,内容包括特征工程、分割、增强和可视化等方面。同时收录了相关数据库、标注工具、学术论文、开源模型、书籍和课程,为时间序列分析提供全面参考。

时间序列数据分析机器学习Python可视化Github开源项目
<div align="center"> <h1>📈 超棒的时间序列资源 📉</h1> <a href="https://awesome.re"><img src="https://yellow-cdn.veclightyear.com/835a84d5/cc275823-e991-49f7-b7d5-e24647f5f733.svg"/></a> </div>

用于处理序列和时间序列数据的资源集合

📦 软件包

Python

  • adtk 一个基于规则/无监督的时间序列异常检测Python工具包。
  • aeon 一个统一的时间序列机器学习框架。
  • alibi-detect 用于异常值、对抗性和漂移检测的算法。
  • AutoTS 一个为快速大规模部署高精度预测而设计的Python时间序列包。
  • Auto_TS 只需一行代码即可在时间序列数据集上自动构建ARIMA、SARIMAX、VAR、FB Prophet和XGBoost模型。现已更新Dask以处理数百万行数据。
  • cesium 开源时间序列推理平台。
  • darts 让Python中的时间序列变得简单。一个用于轻松操作和预测时间序列的Python库。
  • deeptime 用于分析时间序列数据的Python库,包括降维、聚类和马尔可夫模型估计。
  • dtw-python R语言综合动态时间规整算法包的Python移植版。
  • etna ETNA是一个易用的时间序列预测框架。
  • fost 预测开源工具旨在提供一个易用的空间-时间预测工具。
  • functime 大规模时间序列机器学习和嵌入。
  • gluon-ts AWS提供的Python概率时间序列建模工具。
  • gordo 利用时间序列数据构建数千个模型来监控系统。
  • greykite LinkedIn开发的灵活、直观且快速的预测库。
  • hmmlearn Python中的隐马尔可夫模型,具有类似scikit-learn的API。
  • HyperTS 全流程自动化时间序列(AutoTS)分析工具包。
  • kats 用于分析时间序列数据的工具包,是一个轻量级、易用、通用且可扩展的框架,用于执行时间序列分析,从了解关键统计数据和特征,检测变化点和异常,到预测未来趋势。
  • libmaxdiv 用于多变量时空时间序列异常检测的最大发散区间算法实现。
  • lifelines Python中的生存分析。
  • luminaire 一个提供机器学习驱动的时间序列数据监控解决方案的Python包。Luminaire提供多种异常检测和预测功能,结合了数据随时间的相关性和季节性模式以及不可控变化。
  • mass-ts Mueen的相似性搜索算法,一个用于在z标准化欧几里得距离下搜索时间序列子序列相似性的库。
  • matrixprofile 一个Python库,使用矩阵剖面算法,让时间序列数据挖掘任务对每个人都变得可访问。
  • Merlion 一个时间序列智能Python库。它提供了一个端到端的机器学习框架,包括加载和转换数据、构建和训练模型、后处理模型输出和评估模型性能。
  • neuralforecast 可扩展且用户友好的神经网络预测算法。
  • nixtla 自动化时间序列处理和预测。
  • orbit Uber开发的一个具有面向对象设计和概率模型的贝叶斯预测包。
  • pastas 用于分析水文时间序列的开源Python框架。
  • pmdarima 一个旨在填补Python时间序列分析能力空白的统计库,包括R语言auto.arima函数的等效实现。
  • prophet 用于生成具有多重季节性和线性或非线性增长的高质量时间序列预测的工具。
  • pyaf PyAF是一个基于流行的pydata模块构建的开源Python自动时间序列预测库。
  • PyDLM 贝叶斯时间序列建模包。基于贝叶斯动态线性模型(Harrison和West,1999),并针对快速模型拟合和推理进行了优化。
  • PyFlux Python的开源时间序列库。
  • pyFTS Python的开源模糊时间序列库。
  • Pyod 一个用于可扩展异常检测(异常检测)的Python工具箱。
  • PyPOTS 一个用于部分观测时间序列(又称不规则采样时间序列)数据挖掘的Python工具箱/库,支持对不完整多变量时间序列进行预测/插补/分类/聚类任务。
  • pyspi 多变量时间序列中成对交互的比较分析。
  • pytimetk Python的时间序列工具包。
  • rrcf 用于流数据异常检测的鲁棒随机剪切森林算法实现。
  • scalecast Python中可扩展的时间序列预测方法
  • scikit-hts 具有熟悉API的层次时间序列预测。
  • seglearn 一个用于时间序列或序列机器学习的Python包。
  • shyft Python和C++的时间序列,包括分布式存储和计算水文预测工具箱、高性能灵活堆栈,包括校准能源市场模型和微服务。
  • similarity_measures 量化任意两条曲线之间的差异。
  • skforecast 使用scikit-learn模型进行时间序列预测。
  • sktime 一个与scikit-learn兼容的Python工具箱,用于时间序列学习。
  • statsforecast 使用统计和计量经济学模型进行闪电般快速的预测。
  • statsmodels.tsa 时间序列分析(tsa) statsmodels.tsa包含对时间序列分析有用的模型类和函数。
  • stumpy 一个强大且可扩展的Python库,可用于各种时间序列数据挖掘任务。
  • TICC 一个Python求解器,用于高效地分割和聚类多变量时间序列。
  • tick 统计学习模块,特别侧重于时间依赖建模。
  • timemachines 持续评估、功能性、增量式的时间序列预测。
  • TimeSeers 基于Prophet的分层贝叶斯时间序列模型,使用PyMC3编写。
  • TimesFM TimesFM(时间序列基础模型)是谷歌研究开发的用于时间序列预测的预训练时间序列基础模型。
  • Time Series Generator 为Keras中直接多步输出限制提供解决方案。
  • tods 一个自动化时间序列异常检测系统。
  • torchtime 用于PyTorch的时间序列数据集。
  • TSDB 时间序列数据库:一个帮助轻松加载时间序列数据集的Python工具箱。
  • tsai 用于时间序列和序列的最先进深度学习库。
  • tscv 时间序列交叉验证 - scikit-learn的扩展。
  • tsflex 灵活的时间序列特征提取和处理。
  • tslearn Python中用于时间序列分析的机器学习工具包。
  • tslumen 一个用于时间序列探索性数据分析(EDA)的库。
  • tsmoothie 一个用于向量化方式进行时间序列平滑和异常检测的Python库。

日期和时间

用于处理日期和时间的库。

  • astral Python计算太阳和月亮的位置。
  • Arrow - 一个Python库,提供了一种明智且人性化的方法来创建、操作、格式化和转换日期、时间和时间戳。
  • Chronyk - 一个Python 3库,用于解析人类书写的时间和日期。
  • dateutil - 标准Python datetime 模块的扩展。
  • delorean - 一个用于解决处理日期时间时出现的不便真相的库。
  • maya - 为人类设计的日期时间。
  • moment - 一个处理日期/时间的Python库。灵感来自 Moment.js
  • Pendulum - 简化Python日期时间操作。
  • PyTime - 一个易于使用的Python模块,旨在通过字符串操作日期/时间/日期时间。
  • pytz - 世界时区定义,现代和历史。将 tz数据库 引入Python。
  • when.py - 提供用户友好的函数来帮助执行常见的日期和时间操作。

特征工程

  • AntroPy 用于计算时间序列熵和复杂度的高效算法。
  • catch22 规范时间序列特征,22个高性能时间序列特征,支持C、Python和Julia。
  • featuretools 一个用于自动化特征工程的开源Python库。
  • temporian Temporian是一个开源Python库,用于预处理⚡和特征工程🛠时间数据📈,适用于机器学习应用🤖
  • tsfeatures 计算时间序列数据的各种特征。R包tsfeatures的Python实现。
  • tsfel 一个直观的库,用于从时间序列中提取特征。
  • tsflex 灵活高效的时间序列特征提取和处理包。
  • tsfresh 该包包含许多特征提取方法和一个强大的特征选择算法。

时间序列分段和变点检测

  • bayesian_changepoint_detection 获取时间序列中变点概率的方法。提供在线和离线方法。
  • changepy 纯Python实现的时间序列变点检测。
  • RBEAST 贝叶斯变点检测和时间序列分解。
  • ruptures 一个用于离线变点检测的Python库。该包提供了非平稳信号分析和分割的方法。
  • TCPDBench 图灵变点检测基准,对变点检测算法的基准评估。

时间序列生成和增强

  • DeepEcho 混合类型、多变量时间序列的合成数据生成。
  • deltapy 表格数据增强和特征工程。
  • time_series_augmentation 使用Keras的时间序列增强方法示例。
  • TimeSynth 一个用于Python中合成时间序列的多用途库。
  • tsaug 一个用于时间序列增强的Python包。
  • tsgm 合成时间序列生成和时间序列增强。

可视化

  • atlair Python的声明式统计可视化库。
  • matplotlib 一个用于创建静态、动画和交互式可视化的综合库。
  • plotly 一个用于制作交互式、出版质量图表的绘图库。
  • seaborn 基于matplotlib的数据可视化库,提供了绘制有吸引力和信息丰富的统计图形的高级接口。
  • tsdownsample 用于可视化的极快时间序列下采样。

基准测试和竞赛

R

  • bcp 变点问题的贝叶斯分析。
  • CausalImpact 一个使用贝叶斯结构时间序列模型进行因果推断的R包。
  • changepoint 实现各种主流和专门的变点方法,用于在数据中查找单个和多个变点。
  • cpm 使用参数和非参数方法进行序列和批量变化检测。
  • EnvCpt 气候和环境时间序列的结构变化检测。
  • fable tidyverts包系列中用于整洁时间序列预测的包。
  • fasster tidyverts包系列中用于季节性、趋势和外生回归因子可加切换预测的包。
  • feasts tidyverts包系列中用于时间序列特征提取和统计的包。
  • fpop 使用最优分区和函数剪枝进行分段。
  • greybox R中的回归模型构建和预测。
  • modeltime Modeltime在一个框架中解锁时间序列预测模型和机器学习。
  • penaltyLearning 用于变化检测惩罚函数的监督学习算法。
  • Rcatch22 用于计算22个规范时间序列特征的R包。
  • smooth 用于时间序列分析和预测的平滑函数集。
  • theft 用于处理时间序列特征提取的R工具包。
  • timetk 一个用于可视化、整理和转换时间序列数据的tidyverse工具包。
  • tsibble tidyverts包系列中提供整洁时间数据框和工具的包。
  • tsrepr TSrepr:用于时间序列表示的R包。

Java

  • SFA 可扩展的时间序列数据分析。
  • tsml 与Weka兼容的Java时间序列机器学习工具包。

JavaScript

可视化

  • cubism 一个用于可视化时间序列的D3插件。使用Cubism构建更好的实时仪表板,从GraphiteCube和其他来源拉取数据。
  • echarts 一个免费、强大的图表和可视化库,提供了一种简单的方式来为商业产品添加直观、交互式和高度可定制的图表。
  • fusiontime 帮助您使用几行代码在JavaScript中可视化时间序列和股票数据。
  • highcharts 一个基于SVG的JavaScript图表库,对旧浏览器有VML和canvas的后备方案。
  • synchro-charts 一个前端组件库,提供一系列用于可视化时间序列数据的组件。

Spark

  • flint Apache Spark的时间序列库。

MATLAB

  • hctsa 高度比较的时间序列分析。

🗄️ 数据库

  • atlas Netflix的内存维度时间序列数据库。
  • cassandra Apache Cassandra是一个开源的NoSQL分布式数据库,被数千家公司信任,可提供可扩展性和高可用性,而不影响性能。
  • ClickHouse 一个开源的、高性能的列式OLAP数据库管理系统,用于使用SQL进行实时分析。
  • cratedb 用于工业物联网复杂、大规模时间序列工作负载的SQL数据库。
  • druid 一个高性能实时分析数据库。
  • fauna Fauna是一个灵活、对开发者友好的事务型数据库,以安全和可扩展的云API形式提供,具有原生GraphQL支持。
  • InfluxDB 是必不可少的时间序列工具包 - 仪表板、查询、任务和代理都集中在一处。
  • KairosDB 基于Cassandra的快速时间序列数据库。
  • opendTSDB 可扩展的时间序列数据库。
  • prometheus 一个最初由SoundCloud构建的开源系统监控和告警工具包。
  • QuestDB 一个专为处理时间序列数据而设计的开源SQL数据库,速度更快。
  • SiriDB 一个高度可扩展、稳健且超快的时间序列数据库。
  • TimeScaleDB TimescaleDB是领先的开源关系数据库,支持时间序列数据。
  • TDengine 一个开源的高性能、可扩展且支持SQL的时间序列数据库。

托管数据库服务

✏️ 标注和标记

  • AnnotateChange - 一个简单的Flask应用程序,用于收集Turing Change Point Dataset的注释,这是一个用于变点检测算法的基准数据集。
  • Curve - 一个开源工具,帮助标注时间序列数据中的异常
  • TagAnomaly - 异常检测分析和标注工具,专门用于多个时间序列(每个类别一个时间序列)
  • time-series-annotator - 时间序列注释库,实现时间序列的分类任务。
  • WDK - 可穿戴设备开发工具包(WDK)是一套工具,用于促进可穿戴设备活动识别应用的开发。

📝 附代码的论文

  • TS2Vec: 面向时间序列的通用表示, Zhihan Yue, Yujing Wang, Juanyong Duan, Tianmeng Yang, Congrui Huang, Yunhai Tong, Bixiong Xu, 2022

  • 动态时间序列的保形预测区间, Chen Xu, Yao Xie, 国际机器学习会议2021(长演讲)

  • 时间序列分类的深度学习综述, H. I. Fawaz, G. Forestier, J. Weber, L. Idoumghar, P-A. Muller, 数据挖掘与知识发现2019

  • 多变量时间序列的贪婪高斯分割, D. Hallac, P. Nystrup, and S. Boyd, 数据分析与分类进展, 13(3), 727–751, 2019.

  • U-Time:应用于睡眠分期的时间序列分割全卷积网络, Mathias Perslev, Michael Jensen, Sune Darkner, Poul Jørgen Jennum, Christian Igel, NeurIPS, 2019.

  • 分段线性时间序列分割的更佳替代方案, Daniel Lemire, SIAM数据挖掘, 2007.

  • 时间序列生成对抗网络, Jinsung Yoon, Daniel Jarrett, Mihaela van der Schaar, NeurIPS, 2019.

  • 使用LSTM循环神经网络学习诊断, Zachary C. Lipton, David C. Kale, Charles Elkan, Randall Wetzel, arXiv:1511.03677, 2015.

  • 基于相干性的时间序列标签传播用于加速主动学习, Yooju Shin, Susik Yoon, Sundong Kim, Hwanjun Song, Jae-Gil Lee, Byung Suk Lee, ICLR, 2022.

💻 包含模型的仓库

⚙️ 应用

  • binjr 一个时间序列数据浏览器。
  • CompEngine 一个自组织的时间序列数据库,允许你上传时间序列数据并交互式地可视化其他人测量的类似数据。

📚 书籍

🎓 课程

教程

💬 社区

🗃 组织

💼 商业平台

  • HAKOM TSM平台 为各种分析和操作目的提供全面的功能,用于预处理和存储来自不同来源、不同格式的时间序列。

🕶️ 更多精彩资源

编辑推荐精选

AEE

AEE

AI Excel全自动制表工具

AEE 在线 AI 全自动 Excel 编辑器,提供智能录入、自动公式、数据整理、图表生成等功能,高效处理 Excel 任务,提升办公效率。支持自动高亮数据、批量计算、不规则数据录入,适用于企业、教育、金融等多场景。

UI-TARS-desktop

UI-TARS-desktop

基于 UI-TARS 视觉语言模型的桌面应用,可通过自然语言控制计算机进行多模态操作。

UI-TARS-desktop 是一款功能强大的桌面应用,基于 UI-TARS(视觉语言模型)构建。它具备自然语言控制、截图与视觉识别、精确的鼠标键盘控制等功能,支持跨平台使用(Windows/MacOS),能提供实时反馈和状态显示,且数据完全本地处理,保障隐私安全。该应用集成了多种大语言模型和搜索方式,还可进行文件系统操作。适用于需要智能交互和自动化任务的场景,如信息检索、文件管理等。其提供了详细的文档,包括快速启动、部署、贡献指南和 SDK 使用说明等,方便开发者使用和扩展。

Wan2.1

Wan2.1

开源且先进的大规模视频生成模型项目

Wan2.1 是一个开源且先进的大规模视频生成模型项目,支持文本到图像、文本到视频、图像到视频等多种生成任务。它具备丰富的配置选项,可调整分辨率、扩散步数等参数,还能对提示词进行增强。使用了多种先进技术和工具,在视频和图像生成领域具有广泛应用前景,适合研究人员和开发者使用。

爱图表

爱图表

全流程 AI 驱动的数据可视化工具,助力用户轻松创作高颜值图表

爱图表(aitubiao.com)就是AI图表,是由镝数科技推出的一款创新型智能数据可视化平台,专注于为用户提供便捷的图表生成、数据分析和报告撰写服务。爱图表是中国首个在图表场景接入DeepSeek的产品。通过接入前沿的DeepSeek系列AI模型,爱图表结合强大的数据处理能力与智能化功能,致力于帮助职场人士高效处理和表达数据,提升工作效率和报告质量。

Qwen2.5-VL

Qwen2.5-VL

一款强大的视觉语言模型,支持图像和视频输入

Qwen2.5-VL 是一款强大的视觉语言模型,支持图像和视频输入,可用于多种场景,如商品特点总结、图像文字识别等。项目提供了 OpenAI API 服务、Web UI 示例等部署方式,还包含了视觉处理工具,有助于开发者快速集成和使用,提升工作效率。

HunyuanVideo

HunyuanVideo

HunyuanVideo 是一个可基于文本生成高质量图像和视频的项目。

HunyuanVideo 是一个专注于文本到图像及视频生成的项目。它具备强大的视频生成能力,支持多种分辨率和视频长度选择,能根据用户输入的文本生成逼真的图像和视频。使用先进的技术架构和算法,可灵活调整生成参数,满足不同场景的需求,是文本生成图像视频领域的优质工具。

WebUI for Browser Use

WebUI for Browser Use

一个基于 Gradio 构建的 WebUI,支持与浏览器智能体进行便捷交互。

WebUI for Browser Use 是一个强大的项目,它集成了多种大型语言模型,支持自定义浏览器使用,具备持久化浏览器会话等功能。用户可以通过简洁友好的界面轻松控制浏览器智能体完成各类任务,无论是数据提取、网页导航还是表单填写等操作都能高效实现,有利于提高工作效率和获取信息的便捷性。该项目适合开发者、研究人员以及需要自动化浏览器操作的人群使用,在 SEO 优化方面,其关键词涵盖浏览器使用、WebUI、大型语言模型集成等,有助于提高网页在搜索引擎中的曝光度。

xiaozhi-esp32

xiaozhi-esp32

基于 ESP32 的小智 AI 开发项目,支持多种网络连接与协议,实现语音交互等功能。

xiaozhi-esp32 是一个极具创新性的基于 ESP32 的开发项目,专注于人工智能语音交互领域。项目涵盖了丰富的功能,如网络连接、OTA 升级、设备激活等,同时支持多种语言。无论是开发爱好者还是专业开发者,都能借助该项目快速搭建起高效的 AI 语音交互系统,为智能设备开发提供强大助力。

olmocr

olmocr

一个用于 OCR 的项目,支持多种模型和服务器进行 PDF 到 Markdown 的转换,并提供测试和报告功能。

olmocr 是一个专注于光学字符识别(OCR)的 Python 项目,由 Allen Institute for Artificial Intelligence 开发。它支持多种模型和服务器,如 vllm、sglang、OpenAI 等,可将 PDF 文件的页面转换为 Markdown 格式。项目还提供了测试框架和 HTML 报告生成功能,方便用户对 OCR 结果进行评估和分析。适用于科研、文档处理等领域,有助于提高工作效率和准确性。

飞书多维表格

飞书多维表格

飞书多维表格 ×DeepSeek R1 满血版

飞书多维表格联合 DeepSeek R1 模型,提供 AI 自动化解决方案,支持批量写作、数据分析、跨模态处理等功能,适用于电商、短视频、影视创作等场景,提升企业生产力与创作效率。关键词:飞书多维表格、DeepSeek R1、AI 自动化、批量处理、企业协同工具。

下拉加载更多