一个以Awesome风格整理的列表,汇集了最佳的机器学习模型压缩和加速研究论文、文章、教程、库、工具等资源。欢迎提交PR!
他们提出了
SparseGPT
,这是第一个能够在100-1000亿参数规模模型上高效工作的准确一次性剪枝方法。SparseGPT
通过将剪枝问题简化为极大规模的稀疏回归实例来实现。它基于一种新的近似稀疏回归求解器,用于解决分层压缩问题,该方法足够高效,可以在几小时内在单个GPU上执行最大的公开可用GPT模型(1750亿参数)。同时,SparseGPT的准确性足以在剪枝后几乎不损失精度,无需任何微调。
近年来,专门用于LLM推理的系统不断涌现,如FasterTransformer(NVIDIA,2022)、PaLM推理(Pope等,2022)、Deepspeed-Inference(Aminabadi等,2022)、Accelerate(HuggingFace,2022)、LightSeq(Wang等,2021)、TurboTransformers(Fang等,2021)。
为了在易获得的硬件上实现LLM推理,卸载是一项必不可少的技术——据我们所知,在当前系统中,只有Deepspeed-Inference和Huggingface Accelerate包含此功能。
用于模型加速的压缩方法(即模型并行)相关论文:
网络上发布的内容。
Transformer引擎结合使用FP8和FP16,以减少内存使用并提高性能,同时仍能保持大型语言模型的准确性。
我在本仓库中向您提供的代码和资源均采用开源许可证。由于这是我的个人仓库,您获得的代码和资源许可来自于我个人,而非我的雇主。
AI Excel全自动制表工具
AEE 在线 AI 全自动 Excel 编辑器,提供智能录入、自动公式、数据整理、图表生成等功能,高效处理 Excel 任务,提升办公效率。支持自动高亮数据、批量计算、不规则数据录入,适用于企业、教育、金融等多场景。
基于 UI-TARS 视觉语言模型的桌面应用,可通过自然语言控制计算机进行多模态操作。
UI-TARS-desktop 是一款功能强大的桌面应用,基于 UI-TARS(视觉语言模型)构建。它具备自然语言控制、截图与视觉识别、精确的鼠标键盘控制等功能,支持跨平台使用(Windows/MacOS),能提供实时反馈和状态显示,且数据完全本地处理,保障隐私安全。该应用集成了多种大语言模型和搜索方式,还可进行文件系统操作。适用于需要智能交互和自动化任务的场景,如信息检索、文件管理等。其提供了详细的文档,包括快速启动、部署、贡献指南和 SDK 使用说明等,方便开发者使用和扩展。
开源且先进的大规模视频生成模型项目
Wan2.1 是一个开源且先进的大规模视频生成模型项目,支持文本到图像、文本到视频、图像到视频等多种生成任务。它具备丰富的配置选项,可调整分辨率、扩散步数等参数,还能对提示词进行增强。使用了多种先进技术和工具,在视频和图像生成领域具有广泛应用前景,适合研究人员和开发者使用。
全流程 AI 驱动的数据可视化工具,助力用户轻松创作高颜值图表