PDFormer

基于传播延迟感知的动态长程模型优化交通流量预测

PDFormer 交通流预测深度学习时空数据分析人工智能 Github 开源项目

PDFormer是一种新型交通流量预测模型，结合传播延迟感知和动态长程Transformer架构提高预测准确性。该模型在多个基准数据集上展现出优异性能，能有效捕捉复杂时空依赖关系。作为交通分析工具，PDFormer可应用于交通管理和城市规划，有潜力缓解拥堵并优化路线。

Github

论文

介绍相关项目

diffusion-forcing - 创新机器学习方法结合下一步预测和全序列扩散技术

Diffusion ForcingGithub开源项目模型训练深度学习视频预测迷宫规划

Diffusion Forcing是一种结合下一步预测和全序列扩散技术的机器学习方法。该项目为视频预测、迷宫规划和时间序列分析等任务提供了框架。通过时间注意力机制，Diffusion Forcing可生成长序列预测并在复杂环境中进行规划。该方法在Minecraft和DMLab视频数据集以及迷宫规划任务中表现优异。项目包含使用说明和预训练模型，便于研究者快速上手和复现结果。

MixFormer - 基于迭代混合注意力的端到端目标跟踪框架

GithubMixFormer开源项目注意力机制深度学习目标追踪计算机视觉

MixFormer是一种创新的端到端目标跟踪框架，采用目标-搜索混合注意力(MAM)骨干网络和角点头部结构，实现了无需显式集成模块的紧凑跟踪流程。这种无后处理方法在LaSOT、GOT-10K和TrackingNet等多个基准测试中表现卓越，并在VOT2020上取得0.584的EAO成绩。项目开源了代码、模型和原始结果，为目标跟踪研究领域提供了宝贵资源。

iTransformer - 先进的时间序列预测模型，打造SOTA性能

GithubiTransformer人工智能开源项目时间序列预测注意力网络深度学习

iTransformer是一种基于注意力机制的时间序列预测模型，由清华大学和蚂蚁集团研究人员开发。该模型采用倒置Transformer结构，支持多变量和多步长预测。iTransformer引入了可逆实例归一化等技术，旨在提高预测准确性和处理长序列数据的能力。这个开源项目为时间序列分析提供了新的研究方向。项目提供Python实现，支持使用PyTorch框架。用户可通过pip安装并轻松集成到现有的时间序列分析工作流程中。该项目还包括实验性功能，如二维注意力和傅里叶变换增强版本，为研究人员提供了探索和改进的空间。

pfgmpp - 统一扩散和泊松流的生成模型框架

GithubPFGM++人工智能图像生成开源项目深度学习生成模型

PFGM++是一个统一扩散模型和泊松流生成模型的框架,通过在高维空间嵌入路径来生成数据。它可以退化为PFGM或扩散模型,并允许通过选择额外维度D来平衡模型的鲁棒性和刚性。实验显示,特定D值的PFGM++模型在CIFAR-10和FFHQ数据集上的性能超越了现有的扩散模型,并对建模误差表现出更好的鲁棒性。

neural_prophet - 易用的开源时间序列预测框架

GithubNeuralProphetPyTorch开源项目时间序列预测模型构建

NeuralProphet是一个基于PyTorch的开源框架，将神经网络与传统时间序列算法结合，专为时间序列预测而设计。它提供简便的代码接口，支持模型定制、趋势检测、季节性分析和事件影响评估，适合高频次和长期数据。项目仍在beta阶段，欢迎社区贡献。

BEVFormer_tensorrt - BEVFormer和BEVDet的TensorRT高效部署方案

BEV 3D DetectionGPU内存优化GithubTensorRT开源项目推理加速量化

本项目实现BEVFormer和BEVDet在TensorRT上的高效部署，支持FP32/FP16/INT8推理。通过优化TensorRT算子，BEVFormer base模型推理速度提升4倍，模型大小减少90%，GPU内存节省80%。同时支持MMDetection中2D目标检测模型的INT8量化部署。项目提供详细基准测试，展示不同配置下的精度和速度表现。

metaformer - 一系列视觉基线模型

CAFormerConvFormerGithubIdentityFormerMetaFormerRandFormer开源项目

MetaFormer项目推出多款视觉基线模型，包括IdentityFormer、RandFormer、ConvFormer和CAFormer。这些模型在ImageNet-1K数据集上表现出色，根据不同的token mixer架构，如身份映射、全局随机混合、可分离深度卷积和自注意机制，在224x224分辨率下的Top-1准确率均超过80%。特别是CAFormer，在无外部数据或蒸馏的条件下，达到85.5%的准确率记录。这些模型已集成到timm库中，方便应用和扩展。

timesfm - 谷歌研究院开发的时间序列预测基础模型

GithubTimesFM基础模型开源项目时间序列预测深度学习

TimesFM是谷歌研究院开发的时间序列预测基础模型，支持多种时间频率的单变量预测。模型可处理最长512个时间点的上下文和任意长度的预测范围，提供简单的API接口支持数组和pandas输入。通过外部回归器库，TimesFM能处理静态和动态协变量。此外，该模型支持微调功能，允许用户在自有数据上优化性能。

MixFormerV2 - 高效全Transformer跟踪模型实现CPU实时运行

GithubMixFormerV2Transformer开源项目模型蒸馏目标跟踪神经网络

MixFormerV2是一个统一的全Transformer跟踪模型，无需密集卷积操作和复杂评分预测模块。该模型提出四个关键预测token，有效捕捉目标模板与搜索区域的相关性。项目还引入新型蒸馏模型压缩方法，包括密集到稀疏和深层到浅层两个阶段。MixFormerV2在LaSOT和TNL2k等多个基准测试中表现优异，分别达到70.6%和57.4%的AUC，同时在GPU上保持165fps的推理速度。值得注意的是，MixFormerV2-S是首个在CPU上实现实时运行的基于Transformer的单流跟踪器。

iTransformer - 用于多变量时间序列预测的iTransformer模型

GithubTransformer模型iTransformer多变量预测开源项目时间序列预测高效注意力机制

iTransformer是一种用于多变量时间序列预测的开源模型，无需修改任何Transformer模块。它在处理大规模数据时表现出色，具备显著的性能提升和强大的泛化能力。iTransformer已在多种基准测试中表现优异，支持静态协变量和概率发射头。用户可通过pip安装，并使用项目提供的详细训练和评估脚本。更多信息请参阅官方论文。

相关项目

推荐项目

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

稿定AI

稿定设计是一个多功能的在线设计和创意平台，提供广泛的设计工具和资源，以满足不同用户的需求。从专业的图形设计师到普通用户，无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑，稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合，帮助用户轻松实现创意设计。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com