CMSIS-DSP 项目介绍
关于 CMSIS-DSP
CMSIS-DSP 是一个为嵌入式系统设计的优化计算库。尽管名字中包含 DSP(数字信号处理),它更广泛地提供了针对 Cortex-M 和 Cortex-A 的优化计算内核。根据内核的不同,CMSIS-DSP 提供了不同的变体。特别是在 Helium 或 Neon 扩展可用的情况下,大多数函数都采用了矢量化版本。
项目内容
该项目的仓库包含 CMSIS-DSP 库以及多个其他项目组件:
- 针对裸机 Cortex-M 或 Cortex-A 的测试框架
- 针对裸机 Cortex-M 的示例
- ComputeGraph
- Python 封装
用户在构建和使用 CMSIS-DSP 库时,不需要上述的其他项目。但是,若要构建其他项目,可能需要安装其他库(如 CMSIS)或工具(如 Arm Virtual Hardware) 或者 CMSIS 构建工具。
CMSIS-DSP 内核功能
CMSIS-DSP 提供了多种内核功能(列表并不详尽):
- 基本数学运算(实数、复数、四元数、线性代数、快速数学函数)
- DSP(过滤)
- 给定(FFT、MFCC、DCT)
- 统计
- 经典机器学习(支持向量机、聚类的距离函数等)
这些内核支持多种数据类型,如 f64、f32、f16、q31、q15、q7。
Python 封装
CMSIS-DSP 还提供了一个 Python 封装,可以通过以下命令安装:
pip install cmsisdsp
使用这个封装,用户可以在 Python 中设计算法,并使用与 C 接口尽可能相似的 API。该封装与 NumPy 兼容,并支持定点运算。此外,它也可在 Google Colab 上运行。这一功能旨在简化从设计到用 C 进行最终实现的过程。
构建速度的优化
CMSIS-DSP 旨在提升性能,因此应使用能提供最佳性能的编译选项来编译 CMSIS-DSP:
建议使用的选项
- 使用
-Ofast
获取最佳性能。 - 当使用 Helium 时,建议强烈使用
-Ofast
。 - 针对 Helium,可避免使用 GCC,因为它目前性能不佳,建议使用 Arm 编译器。
- 如果使用浮点数,务必选择 FPU 以确保编译器不会使用软件浮点仿真。
建议避免的选项
- 避免使用
-fno-builtin
。 - 避免使用
-ffreestanding
,因为它会启用默认禁用的选项。
半浮点支持
CMSIS-DSP 增加了对 f16
数据类型(半浮点)的支持。这在您的 Cortex 具备某种半浮点硬件加速(例如 Helium 扩展)时特别有用。如果不需要 f16
,可以在构建时定义 -DDISABLEFLOAT16
来禁止其支持。
如何构建
CMSIS-DSP 可以通过 Open CMSIS-Pack、cmake、Makefile 以及其他构建工具进行构建。不同的构建工具有不同的配置信息,请根据你的需求选择适合的工具进行构建。
代码大小
较早的版本库通过编译指令控制代码大小,现已改为依赖链接器进行优化。对于固定大小的 FFT,建议在初始化时使用特定函数如 arm_cfft_init_64_f32
,而不是通用初始化函数,以避免不必要的代码和表被包含。
项目文件结构
构建和使用 CMSIS-DSP 库只需要以下文件夹:
- Source
- Include
- PrivateInclude
- ComputeLibrary(仅使用 Neon 时需要)
其他文件夹属于不同项目、测试或示例。
支持与联系
如有任何问题,建议在项目 GitHub 上创建新的 issue,来联系 CMSIS-DSP 团队。