#Apple silicon
metal-flash-attention - Apple芯片上的FlashAttention高性能实现
FlashAttentionApple siliconMetal性能优化注意力机制Github开源项目
metal-flash-attention项目将FlashAttention算法移植至Apple silicon,提供精简可维护的实现。支持macOS和iOS,使用32位精度计算和异步拷贝。项目采用单头注意力机制,专注于核心瓶颈优化。通过创新的反向传播设计,减少内存使用并提高计算效率。改进了原始FlashAttention的反向传播设计,提高并行效率。项目正在持续优化,包括寄存器压力、可移植性和文档完善。
HelloSilicon - Apple silicon Mac汇编语言开发教程
Apple siliconARM64 汇编macOSLLVM Clang系统调用Github开源项目
HelloSilicon项目为开发者提供了Apple silicon Mac汇编语言编程的入门指南。该项目基于《Programming with 64-Bit ARM Assembly Language》一书,调整示例代码以适配Apple ARM64架构。内容涵盖基础知识、系统调用、内存管理、与C/Python交互等方面,并详细解释了Apple平台的特殊性。对于希望深入了解Apple silicon底层编程的开发者而言,这是一个全面且实用的学习资源。