Awesome Tensor 编译器

一个关于 Tensor 计算和深度学习优秀编译器项目和论文的列表。

开源项目

论文

深度学习编译器：全面综述，作者：Mingzhen Li 等人，TPDS 2020年
深度神经网络硬件编译器的深入比较，作者：Yu Xing 等人，ICESS 2019年

加速 Tensor 计算的 GPU Kernel 自动调优，作者：Chendi Li, Yufan Xu 等人，ICS 2024年
启用 Tensor 语言模型辅助生成高性能深度学习 Tensor 程序，作者：Yi Zhai 等人，OSDI 2024年
Kernel 调度的 Droplet 搜索算法，作者：Michael Canesche 等人，ACM TACO 2024年
使用概率程序优化 Tensor 程序，作者：Junru Shao 等人，NeurIPS 2022年
深度学习编译器的一次调优，作者：Jaehun Ryu 等人，CC 2022年
稀疏张量代数的自动调度和渐进成本模型，作者：Peter Ahrens 等人，PLDI 2022年
Bolt: 架起自动调优器和硬件原生性能之间的桥梁，作者：Jiarong Xing 等人，MLSys 2022年
深度学习加速器领域优化的全栈搜索技术，作者：Dan Zhang 等人，ASPLOS 2022年
用于 GPU 的成像和视觉流水线高效自动调度，作者：Luke Anderson 等人，OOPSLA 2021年
Lorien: 高效的深度学习工作负载交付，作者：Cody Hao Yu 等人，SoCC 2021年
深度神经网络吞吐量优化的价值学习，作者：Benoit Steiner 等人，MLSys 2021年
多通道机器学习编译器的灵活自动调优方法，作者：Phitchaya Mangpo Phothilimthana 等人，PACT 2021年
Ansor: 生成高性能深度学习 Tensor 程序，作者：Lianmin Zheng 等人，OSDI 2020年
面向 GPU 的 Halide 管道调度合成，作者：Sioutas Savvas 等人，TACO 2020年
FlexTensor: 针对异构系统的 Tensor 计算框架自动调度和优化，作者：Size Zheng 等人，ASPLOS 2020年
ProTuner: 使用蒙特卡罗树搜索调优程序，作者：Ameer Haj-Ali 等人，arXiv 2020年
AdaTune: 自适应 Tensor 程序编译优化，作者：Menghao Li 等人，NeurIPS 2020年
通过组合自动转换来优化内存层次结构，作者：Jie Zhao 等人，MICRO 2020年
Chameleon: 深度神经网络编译的自适应代码优化，作者：Byung Hoon Ahn 等人，ICLR 2020年
稀疏张量代数的稀疏迭代空间变换框架，作者：Ryan Senanayake 等人，OOPSLA 2020年
用树搜索和随机程序优化 Halide ，作者：Andrew Adams 等人，SIGGRAPH 2019年
学习优化 Tensor 程序，作者：Tianqi Chen 等人，NeurIPS 2018年
自动调度 Halide 图像处理流水线，作者：Ravi Teja Mullapudi 等人，SIGGRAPH 2016年

教程

贡献

我们鼓励对这个仓库的所有贡献。请开一个问题或者发送一个拉取请求。

awesome-tensor-compilers

Awesome Tensor 编译器

目录

开源项目

论文

综述

编译器和 IR 设计

自动调优和自动调度

成本模型

CPU和GPU优化

NPU优化

图级优化

动态模型

图神经网络

分布式计算

量化

稀疏

程序重写

验证和测试

教程

贡献

链接格式说明

编辑推荐精选

讯飞智文

讯飞星火

Spark-TTS

Trae

咔片PPT

讯飞绘文

材料星

openai-agents-python

Hunyuan3D-2

3FS

探索AI的无限可能

推荐工具精选

Trae

豆包

讯飞文书

讯飞绘文

讯飞绘镜

阿里绘蛙

咔片PPT

AI云服务特惠

火山引擎

阿里云

腾讯云

华为云

百度智能云

AWS

关注微信公众号