在人工智能和物联网快速发展的今天,如何将训练好的神经网络模型部署到资源受限的嵌入式设备上,已经成为一个热门话题。onnx2c作为一个轻量级的神经网络模型部署工具,正是为解决这一难题而生的。本文将全面介绍onnx2c的设计理念、核心功能以及使用方法,帮助读者了解这一强大工具如何让神经网络在微控制器上"起飞"。
onnx2c是一个开源的ONNX(Open Neural Network Exchange)到C语言的编译器。它的主要功能是读取ONNX格式的神经网络模型文件,并生成对应的C语言代码。这个工具的目标用户群是那些想要在微控制器等资源受限的嵌入式设备上运行神经网络推理的开发者。
onnx2c的设计理念可以用"小而美"来形容。它专注于生成轻量、高效的C代码,以适应微控制器有限的内存和计算资源。同时,onnx2c的使用也非常简单直接,对用户十分友好。只要你能够将训练好的神经网络导出为ONNX格式(目前主流的深度学习框架如PyTorch和TensorFlow都支持这一功能),并且有一个可工作的微控制器项目,那么使用onnx2c将两者结合就变得轻而易举。
onnx2c生成的C代码具有以下几个重要特性,这些特性都是为了更好地适应微控制器的环境:
无标准输入输出依赖:生成的代码不包含#include <stdio.h>
,也就是说不使用printf()
等标准输入输出函数。这减少了代码体积,并避免了在某些微控制器平台上可能存在的兼容 性问题。
静态内存分配:onnx2c在编译时就分配好所需的缓冲区,不使用动态内存分配,也几乎不使用栈内存。这种做法可以有效避免内存碎片化,并使内存使用更加可预测。
最小库依赖:除了标准C数学库外,生成的代码不依赖其他库。这大大简化了部署过程,提高了代码的可移植性。(不过,推荐使用带有硬件浮点运算单元的设备以获得更好的性能。)
编译器友好:生成的代码结构清晰,便于C编译器进行优化,以获得最佳的运行效率。
单文件输出:所有生成的代码都被包含在一个C文件中,方便项目管理和集成。
这些特性使得onnx2c生成的代码非常适合在资源受限的微控制器上运行。它不仅体积小、效率高,还具有良好的可移植性和易用性。
使用onnx2c的过程可以分为以下几个步骤:
安装依赖: 首先需要安装ProtocolBuffers库。在Ubuntu系统上,可以使用以下命令:
apt install libprotobuf-dev protobuf-compiler
对于MacOS用户,可以使用Homebrew安装:
brew install protobuf
获取源码:
git clone https://github.com/kraiskil/onnx2c.git
cd onnx2c
git submodule update --init
编译onnx2c: 使用CMake进行标准构建:
mkdir build
cd build
cmake -DCMAKE_BUILD_TYPE=Release ..
make onnx2c
使用onnx2c生成C代码:
编译完成后,会得到一个onnx2c
可执行文件。使用以下命令将ONNX模型转换为C代码:
./onnx2c [你的ONNX模型文件] > model.c
集成生成的代码:
在生成的model.c
文件末尾,有一个名为void entry(...)
的函数。在你的主程序中调用这个函数就可以运 行模型推理。函数参数的名称与ONNX模型中的一致。
为了在微控制器上获得最佳性能,onnx2c提供了几个优化选项:
使用-ffast-math
编译选项:当编译onnx2c生成的代码时,使用这个选项可以显著提高计算速度。不过,需要注意的是,这可能会稍微降低浮点运算的精度。
张量联合优化:onnx2c会将中间张量包装在联合体(union)中,帮助编译器重用堆内存,从而减少内存占用。
移除Cast
节点:通过修改前置节点的输出张量,onnx2c可以消除不必要的类型转换操作。
AVR处理器优化:对于AVR系列处理器,onnx2c可以将常量放入指令内存中,以节省宝贵的数据内存。
实验性量化选项:onnx2c提供了一个将浮点计算转换为整数计算的实验性选项,这对于不支持硬件浮点运算的设备特别有用。
根据onnx2c项目提供的基准测试数据,我们可以看到onnx2c在实际应用中表现出色。以一个简单的"Hello World"正弦波生成神经网络为例,将其编译到STM32F411微控制器上运行,结果令人印象深刻:
这意味着onnx2c生成的代码运行速度比STM32CubeAI快了近25倍!
在内存占用方面,onnx2c也表现不俗:
平台 | 代码段(text) | 数据段(data) | BSS段 | 运行时间 |
---|---|---|---|---|
STM HAL + onnx2c @96MHz | 8276 | 1300 | 3060 | 20us |
STM HAL + CubeAI @96MHz | 14372 | 1696 | 2808 | 490us |
OpenCM3 + onnx2c @84MHz | 8236 | 1296 | 388 | 25us |
OpenCM3 + onnx2c (RAM优化) | 8236 | 12 | 388 | 29us |
可以看到,onnx2c生成的代码在各个方面都比STM32CubeAI更加高效。特别是在RAM优化版本中,数据段的占用仅为12字节,这对于内存紧张的微控制器来说是一个巨大的优势。
尽管onnx2c表现出色,但它也有一些局限性需要注意:
ONNX规范覆盖不完整:目前onnx2c仅实现了部分ONNX操作(91个out of 166个ONNX操作至少部分实现)。这意味着某些复杂的神经网络模型可能无法直接转换。
不支持硬件加速器:onnx2c生成的是纯C代码,不支持使用专门的神经网络加速硬件。
不支持反向传播:onnx2c专注于推理,不支持模型训练。
社区活跃度有待提高:与一些大公司支持的工具相比,onnx2c的社区相对较小,更新频率可能不如一些主流工具。
尽管存在一些局限性,但onnx2c作为一个专注于微控制器部署的轻量级工具,其潜力是巨大的。随着物联网和边缘计算的发展,对于在资源受限设备上运行神经网络的需求只会越来越大。onnx2c正好填补了这一市场空白。
未来,我们可以期待看到:
onnx2c为将复杂的神经网络模型部署到资源受限的微控制器上提供了一个简单而高效的解决方案。它的小巧、高效和易用性使其成为嵌入式AI开发中不可或缺的工具。
无论你是想要在智能家居设备中集成语音识别,还是在工业传感器中实现异常检测,onnx2c都能帮你将强大的神经网络能力带到这些小巧的设备中。随着物联网和边缘AI的不断发展,onnx2c的重要性只会与日俱增。
如果你正在考虑在微控制器项目中使用神经网络,不妨给onnx2c一个尝试。它可能会成为你项目成功的关键推手,让你的微控制器在AI的赋能下焕发新的生机。
让我们共同期待onnx2c的未来发展,见证它在微控制器AI部署领域续写新的篇章!
一键生成PPT和Word,让学习生活更轻松
讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。
深度推理能力全新升级,全面对标OpenAI o1
科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。
一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型
Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。
字节跳动发布的AI编程神器IDE
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。
AI助力,做PPT更简单!
咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。
选题、配图、成文,一站式创作,让内容运营更高效
讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。
专业的AI公文写作平台,公文写作神器
AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。
OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。
openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。
高分辨率纹理 3D 资产生成
Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。
一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。
3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号