#边缘设备

executorch - 移动和边缘设备上高效运行PyTorch模型的解决方案

ExecuTorchPyTorch推理能力边缘设备模型部署Github开源项目

ExecuTorch 提供端到端解决方案，实现移动和边缘设备上的推理能力，涵盖穿戴设备、嵌入式设备和微控制器。作为 PyTorch Edge 生态系统的一部分，ExecuTorch 通过轻量级运行时，利用硬件能力（如 CPU、NPU 和 DSP），高效地将 PyTorch 模型部署到多种平台。其主要优势包括：广泛的兼容性、开发效率和出色的用户体验。欲了解更多技术细节和教程，请访问文档网站获取最新版本。

litepose - 高效实时多人姿态估计的单分支架构

LitePose人体姿态估计边缘设备效率优化大核卷积Github开源项目

LitePose是一种针对边缘设备的高效单分支架构，专用于实时多人姿态估计。通过融合解卷积头和大卷积核，该模型显著提升了性能。在移动平台上，LitePose将延迟降低5倍，同时保持估计精度。项目开源了预训练模型、训练脚本和评估工具，支持COCO和CrowdPose数据集。

llm-awq - 激活感知权重量化技术实现大语言模型高效压缩与加速

AWQLLM模型量化视觉语言模型边缘设备Github开源项目

AWQ是一种高效的大语言模型低比特权重量化技术，支持INT3/4量化，适用于指令微调和多模态模型。它提供预计算模型库、内存高效的4位线性层和快速推理CUDA内核。AWQ使TinyChat可在边缘设备上实现大模型高效本地推理。该技术已被Google、Amazon等采用，并获MLSys 2024最佳论文奖。

NEXA AI - 高性能本地化多模态AI模型

AI工具Octopus模型AI代理本地运行功能调用边缘设备

NEXA AI开发的本地化AI模型Octopus系列,可在多种设备上离线运行,无需订阅。这些模型具备自然语言理解、工具调用等能力,可执行多样化任务。相比云端AI,Octopus模型在速度、成本和准确度上均有优势,同时保障数据隐私。该技术适用于需要高性能、低延迟和数据安全的AI应用场景。

moondream2 - 小型高效的边缘设备视觉语言模型

图像问答模型开源项目Huggingface性能基准moondream2Github边缘设备视觉语言模型

moondream2是一款为边缘设备设计的小型视觉语言模型。该模型在VQAv2、GQA、TextVQA等多项基准测试中表现优异，支持图像编码和问答功能。开发者可通过pip轻松安装并集成到Python项目中。moondream2定期更新，同时提供版本固定选项，以满足不同的应用需求。

相关文章

Article Cover

ExecuTorch: PyTorch在移动和边缘设备上的高性能推理解决方案

Article Cover

AWQ: 提升大语言模型推理效率的激活感知权重量化技术

Article Cover

LitePose: 高效的2D人体姿态估计架构设计

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号