FBGEMM
FBGEMM(Facebook通用矩阵乘法)是一个用于服务器端推理的低精度、高性能矩阵-矩阵乘法和卷积库。
该库为小批量提供高效的低精度通用矩阵乘法,并支持行级量化和离群值感知量化等精度损失最小化技术。FBGEMM还利用融合机会来克服低精度矩阵乘法中带宽受限操作的独特挑战。
FBGEMM被用作x86机器上PyTorch量化算子的后端:
查看完整的文档以获取有关构建、安装和使用FBGEMM进行开发的更多信息,以及该库最新的支持矩阵和API文档。
新特性
- 新功能和近期改进(2020年1月)
引用
有关FBGEMM的高层概述、设计理念和各部分的简要描述,请参阅我们的博客文章。
对于想引用FBGEMM的相关文章,我们建议引用我们的论文:
@article{fbgemm,
title={FBGEMM: Enabling High-Performance Low-Precision Deep Learning Inference},
author={Khudia, Daya and Huang, Jianyu and Basu, Protonu and Deng, Summer and Liu, Haixin and Park, Jongsoo and Smelyanskiy, Mikhail},
journal={arXiv preprint arXiv:2101.05615},
year={2021}
}
加入FBGEMM社区
如有问题、支持、新闻更新或功能请求,请随时:
- 在GitHub Issues中提交问题
- 在GitHub Discussions中发起讨论
- 通过PyTorch Slack中的
#fbgemm
频道联系我们
如需贡献,请查看CONTRIBUTING
文件以了解如何提供帮助。
许可证
FBGEMM采用BSD许可证,详见LICENSE
文件。