警告:由于公司重组,本项目目前未在维护中。
PERSIA(Parallel rEcommendation tRaining System with hybrId Acceleration,并行推荐训练系统与混合加速)是由快手科技AI平台与苏黎世联邦理工学院合作开发的。它是一个基于PyTorch的系统(据我们所知是首个公开的同类系统),用于在普通硬件上训练大规模深度学习推荐模型。它能够训练参数量高达100万亿的推荐模型。据我们所知,这是目前推荐系统中最大的模型规模。在公开数据集上的实证研究表明,PERSIA在推荐领域比其他几个现有训练系统具有显著优势[1]。其效率和稳定性也已在快手的多个拥有1亿级日活用户的应用中得到验证。 免责声明:该程序可用且已服务于多个重要企业。然而,官方英文文档和教程仍在大规模建设中,目前还比较原始。我们鼓励冒险者尝试PERSIA并做出贡献!
新闻
- 在谷歌云上训练具有100万亿参数的深度学习推荐模型
- 突破百万亿参数规模,追求极致的效率和性价比:华人团队开源首个异构并行推荐系统训练框架 PERSIA
- 参数量卷到一百万亿!华人团队开源史上最大的推荐训练系统 PERSIA
- "短视频"时代的AI引擎:消化100万亿参数,Facebook受邀演讲,2021年。
- 单机训练速度提升 640 倍!独家解读快手商业广告模型 GPU 训练平台 PERSIA
- 创新、平衡与大格局:快手商业化的慢与快
链接
参考文献
-
Xiangru Lian, Binhang Yuan, Xuefeng Zhu, Yulong Wang, Yongjun He, Honghuan Wu, Lei Sun, Haodong Lyu, Chengjun Liu, Xing Dong, Yiqiao Liao, Mingnan Luo, Congfei Zhang, Jingru Xie, Haonan Li, Lei Chen, Renjie Huang, Jianying Lin, Chengchun Shu, Xuezhong Qiu, Zhishan Liu, Dongying Kong, Lei Yuan, Hai Yu, Sen Yang, Ce Zhang, & Ji Liu. (2021). Persia:一个可扩展到100万亿参数的基于深度学习的推荐混合系统。
-
Ji Liu & Ce Zhang. (2021). 使用一阶方法的分布式学习系统。
许可证
本源代码根据源代码树根目录中LICENSE文件中的MIT许可证授权。