热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#GPU memory
gpu_poor - LLM运行所需GPU内存及每秒处理Token数计算工具
GPU memory
LLM
该工具计算GPU/CPU运行任意LLM所需的内存和每秒处理的Token数,并提供详细的训练和推理内存分配。支持多种量化及推理框架,适用于评估GPU运行特定LLM的能力、调整量化方式及优化GPU内存使用。
1
1
相关文章
gpu_poor入门指南 - 快速计算LLM所需GPU资源的工具
2 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号