你不需要的是Transformers和大语言模型

这个仓库最好地展示了为什么transformer模型在时间序列预测中不起作用

论文

Transformer在时间序列预测中是否有效? 作者:曾爱玲、陈沐希、张磊、徐强(香港中文大学、国际数字经济研究院(IDEA)，2022年) 代码 🔥🔥🔥🔥🔥
大语言模型和基础模型在时间序列预测中的应用:它们(目前)还没有你想象的那么好作者:Christoph Bergmeir (2023年) 🔥🔥🔥🔥🔥
Transformer并不是你所需要的作者:Valeriy Manokhin (2023年) 🔥🔥🔥🔥🔥
深度学习并不是你所需要的作者:Valeriy Manokhin (2022年) 🔥🔥🔥🔥🔥
为什么Transformer在时间序列预测中表现不佳作者:Devansh (2023年)
频域多层感知机在时间序列预测中是更有效的学习器作者:易坤、张琦、范伟、王守进、王鹏阳、何辉、连德富、安宁、曹龙兵、牛振东(北京理工大学、同济大学、牛津大学、悉尼科技大学、澳门大学、合肥工业大学、麦考瑞大学) (2023年) 🔥🔥🔥🔥🔥
在经济政策和地缘政治不确定性下预测CPI通胀作者:Shovon Sengupta、Tanujit Chakraborty、Sunny Kumar Singh (富达投资、索邦大学、比拉尼理工学院-海德拉巴分校) (2024年) 🔥🔥🔥🔥🔥
重新审视长期时间序列预测:对线性映射的调查作者:李哲、齐世毅、李一多、徐增林(哈尔滨工业大学深圳分校，2023年) 代码
SCINet:基于样本卷积和交互的时间序列建模与预测作者:刘敏浩、曾爱玲、陈沐希、徐志坚、赖秋霞、马玲娜、徐强(香港中文大学，2022年) 代码
WINNET:具有窗口增强周期提取和交互的时间序列预测作者:欧文杰、郭东岳、张峥、赵智硕、林毅(四川大学，中国，2023年)
用于时间序列分析的多尺度分解MLP-Mixer 作者:钟书涵、宋思哲、李冠耀、卓伟鹏、刘洋、陈绍鹤(香港科技大学，香港，2023年) 代码 🔥🔥🔥🔥🔥
TimesNet:用于一般时间序列分析的时间2D变化建模作者:(吴海旭、胡腾格、刘勇、周航、王建民、龙明生，清华大学，2023年) 代码 🔥🔥🔥🔥🔥
MTS-Mixers:基于因子化时间和通道混合的多变量时间序列预测代码 🔥🔥🔥🔥🔥
可逆实例归一化:针对分布偏移的准确时间序列预测作者:金泰星、金真熙、太允元、朴天福、崔张浩、朱在鞠(韩国科学技术院AI、Vuno、Naver公司、韩国电子通信研究院，ICLR 2022) 代码项目主页 🔥🔥🔥🔥🔥
WINNet:受小波启发的图像去噪可逆网络作者:欧文杰、郭东岳、张峥、赵智硕、林毅(四川大学计算机科学学院，中国) 代码 🔥🔥🔥🔥🔥
Mlinear:重新思考时间序列预测的线性模型作者:李伟、孟祥旭、陈楚豪、陈佳宁(哈尔滨工程大学，2023年) 🔥🔥🔥🔥🔥
极简主义交通预测:线性层就是你所需要的全部作者:段文英、饶洪、黄伟、何晓曦(南昌大学、澳门大学，2023年)
频域多层感知器在时间序列预测中是更有效的学习器，作者：易坤、张琦、范伟、王守进、王鹏洋、何辉、连德富、安宁、曹龙兵、牛振东（北京理工大学、同济大学、牛津大学、悉尼科技大学、澳门大学、中国科学技术大学、合肥工业大学、麦考瑞大学，2023年）代码 🔥🔥🔥🔥🔥
用于同时插补和预测的端到端时间序列模型，作者：Trang H. Tran、Lam M. Nguyen、Kyongmin Yeo、Nam Nguyen、Dzung Phan、Roman Vaculin、Jayant Kalagnanam（康奈尔大学运筹学与信息工程学院；IBM研究院，托马斯·J·沃森研究中心，纽约约克镇高地，美国，2023年）🔥🔥🔥🔥🔥
使用TiDE（时间序列密集编码器）进行长期预测，作者：Abhimanyu Das、Weihao Kong、Andrew Leach、Shaan Mathur、Rajat Sen、Rose Yu（谷歌云、加利福尼亚大学圣地亚哥分校，2023年）
TSMixer：用于多变量时间序列预测的轻量级MLP-Mixer模型，作者：Vijay Ekambaram、Arindam Jati、Nam Nguyen、Phanwadee Sinthong、Jayant Kalagnanam（IBM研究院，2023年）代码代码
Koopa：使用Koopman预测器学习非平稳时间序列动态，作者：刘勇、李晨宇、王建民、龙明盛（清华大学，2023年）代码 🔥🔥🔥🔥🔥
长期时间序列预测的吸引子记忆：混沌视角，作者：胡嘉曦、胡悦红、陈伟、金明、潘世瑞、温庆松、梁宇轩（2024年）🔥🔥🔥🔥🔥
何时及如何：学习非平稳时间序列预测的可识别潜在状态（2024年）🔥🔥🔥🔥🔥
用于多变量时间序列预测的深度耦合网络（2024年）
用于长序列建模的线性动力学嵌入神经网络，作者：梁桐一和李汉雄（香港城市大学，2024年）
PDETime：从偏微分方程的角度重新思考长期多变量时间序列预测（2024年）
CATS：通过构建辅助时间序列作为外生变量来增强多变量时间序列预测（2024年）🔥🔥🔥🔥🔥
Mamba对时间序列预测有效吗？代码（2024年）🔥🔥🔥🔥🔥
STG-Mamba：基于选择性状态空间模型的时空图学习（2024年）
TimeMachine：一个时间序列值4个Mamba用于长期预测代码（2024年）🔥🔥🔥🔥🔥
FITS：用10k参数建模时间序列代码（2023年）
TSLANet：重新思考用于时间序列表示学习的Transformer 代码（2024年）🔥🔥🔥🔥🔥
WFTNet：利用全局和局部周期性进行长期时间序列预测代码（2024年）🔥🔥🔥🔥🔥
SiMBA：用于视觉和多变量时间序列的简化Mamba架构代码（2024年）🔥🔥🔥🔥🔥
SOFTS：基于序列核心融合的高效多变量时间序列预测代码（2024年）🔥🔥🔥🔥🔥
整合Mamba和Transformer进行长短程时间序列预测代码（2024年）🔥🔥🔥🔥🔥
SparseTSF：用1k参数建模长期时间序列预测（2024年）🔥🔥🔥🔥🔥
使用粗化策略提升多层感知机进行长期时间序列预测 (2024) 🔥🔥🔥🔥🔥
用于长期时间序列预测的多尺度膨胀卷积网络 (2024)
ModernTCN：用于通用时间序列分析的现代纯卷积结构代码 (ICLR 2024 Spotlight)
用于多变量长序列时间序列预测的自适应提取网络 (2024) 🔥🔥🔥🔥🔥
使用神经傅里叶变换进行可解释的多变量时间序列预测 (2024) 🔥🔥🔥🔥🔥
长期序列预测的周期性解耦框架代码 (2024) 🔥🔥🔥🔥🔥
Chimera：使用二维状态空间模型有效建模多变量时间序列 🔥🔥🔥🔥🔥 (2024)
时间证据融合网络：长期时间序列预测中的多源视角代码 (2024)
ATFNet：用于长期时间序列预测的自适应时频集成网络代码 (2024) 🔥🔥🔥🔥
C-Mamba：通道相关性增强的状态空间模型用于多变量时间序列预测 (2024) 🔥🔥🔥🔥
极简主义在长序列时间序列预测中的力量
WindowMixer：时间序列预测的窗内和窗间建模
xLSTMTime：使用xLSTM进行长期时间序列预测代码 (2024)
并非所有频率都生而平等：时间序列预测中频率的动态融合 (2024) 🔥🔥🔥🔥
FMamba：基于快速注意力的Mamba用于多变量时间序列预测 (2024)
用于长时间序列预测的长输入序列网络 (2024)
使用三重分解线性建模和序列度量的时间序列预测 (2024) 🔥🔥🔥🔥
标准统计模型和大型语言模型在时间序列预测中的评估 (2024) LLM 🔥🔥🔥🔥
使用大型语言模型进行宏观经济预测 (2024) LLM 🔥🔥🔥🔥
语言模型在零样本时间序列推理方面仍然存在困难 (2024) LLM 🔥🔥🔥🔥

文章

【TimeGPT对比TiDE：零样本推理是预测的未来还是炒作？】作者：Luís Roque和Rafael Guedes（2024年）🔥🔥🔥🔥🔥
【TimeGPT-1，Hacker News上的讨论】（2023年）🔥🔥🔥🔥🔥
【TimeGPT：首个用于时间序列预测的生成式预训练Transformer】

Transformers_And_LLM_Are_What_You_Dont_Need

你不需要的是Transformers和大语言模型

目录

论文

文章

编辑推荐精选

讯飞智文

讯飞星火

Spark-TTS

Trae

咔片PPT

讯飞绘文

材料星

openai-agents-python

Hunyuan3D-2

3FS

探索AI的无限可能

推荐工具精选

Trae

豆包

讯飞文书

讯飞绘文

讯飞绘镜

阿里绘蛙

咔片PPT

AI云服务特惠

火山引擎

阿里云

腾讯云

华为云

百度智能云

AWS

关注微信公众号