Project Icon

algebraic-nnhw

创新FFIP算法驱动的机器学习硬件加速器

项目开发的机器学习硬件加速器架构采用了创新的Free-pipeline Fast Inner Product (FFIP)算法。这种设计只需要传统方法一半的乘法器单元,就能实现相同的性能。该架构适用范围广泛,涵盖全连接、卷积、循环和注意力/transformer等多种机器学习模型层。它可以轻松集成到现有的定点系统阵列ML加速器中,显著提升吞吐量和计算效率。项目不仅提供了完整的RTL实现,还包括配套的编译器和测试环境,为机器学习硬件加速研究领域贡献了有价值的资源。

nngen - 深度神经网络硬件加速器编译器
GithubNNgenVerilog HDL开源项目深度神经网络硬件加速器编译器
NNgen是一个开源编译器,能为深度神经网络生成特定模型的硬件加速器。它从输入模型定义中生成Verilog HDL源代码和IP核心包(IP-XACT),包括处理引擎、片上存储器、片上网络、DMA控制器和控制电路,且无需外部电路或CPU的额外控制。NNgen使用Veriloggen,一个用Python编写的开源高层次综合编译器,可为新的DNN算法和应用进行定制。
finn - 高效量化神经网络加速器框架,助力FPGA上的AI推理
FINNFPGAGithub开源项目数据流架构深度学习推理量化神经网络
FINN是一个开源实验框架,专注于FPGA上的量化神经网络推理。它为每个网络生成定制的数据流式架构,实现高效、高吞吐量和低延迟的FPGA加速器。FINN提供跨软硬件抽象层的灵活性,支持深度神经网络研究,并通过Docker提供编译器环境和丰富的文档资源。
hls4ml - FPGA中实现机器学习推理的高级综合语言工具
FPGAGithubhls4ml开源项目机器学习神经网络高等级综合
hls4ml是一个专为FPGA上实现机器学习推理而设计的开源软件包。它利用高级综合语言(HLS)将传统开源机器学习模型转化为可配置的固件,从而实现高效推理。项目提供详尽的文档和教程,适用于快速入门和深入研究。用户可以通过GitHub平台参与讨论和贡献。该软件包特别适用于对高性能和低延迟推理要求高的应用场景,如粒子物理和自动驾驶领域。支持与Xilinx Vivado HLS工具的集成,并提供多种安装方式。
DI-hpc - 高性能计算组件加速强化学习算法
CUDADI-HPCGithubPyTorch开源项目强化学习算法加速
DI-HPC是一款专为强化学习算法设计的高性能计算组件,主要用于加速GAE、n-step TD和LSTM等常见模块。该组件支持前向和反向传播,适用于训练、数据收集和测试环节。DI-HPC兼容CUDA环境和多个PyTorch版本,提供简便的安装方式和性能测试工具。通过提升计算效率,DI-HPC为强化学习研究和开发提供了有力支持。
nni - 可自动执行特征工程、神经架构搜索、超参数调优和深度学习的模型压缩
GithubNNI开源项目架构搜索模型压缩神经网络智能优化超参数调整
NNI提供一站式解决方案,支持自动化的特征工程、神经架构搜索、超参数调整和模型压缩。它兼容多种框架,并提供详尽的API、丰富的示例及全面的教程。适用于多种训练环境,包括本地、远程SSH服务器和Kubernetes,帮助推动开源社区的技术发展。
ppl.nn - 用于 AI 推理的高性能深度学习推理引擎
GithubONNXOpenMMLabPPLNN卷积神经网络开源项目深度学习推理
PPLNN是一款高效的深度学习推理引擎,兼容各种ONNX模型,并对OpenMMLab进行了优化。其最新的LLM引擎包括闪存注意力、分裂K注意力、动态批处理和张量并行等功能,并支持INT8分组和通道量化。项目发布了多个LLM模型,如LLaMA、ChatGLM和Baichuan,并提供详细的构建和集成指南。
CFU-Playground - 提高机器学习任务性能的FPGA处理器优化平台
CFU PlaygroundFPGAGithub定制指令开源项目性能提升机器学习
CFU-Playground项目为工程师、实习生和学生提供了一个用于设计和评估FPGA“软”处理器增强功能的框架,专注于提升机器学习任务的性能。用户可以快速上手、自定义指令,并进行效率测试和性能测量,实现多次迭代。项目还包含TensorFlow Lite模型优化、硬件要求和软件工具链的详细设置指导,除Vivado外,所有工具均为开源。
Embedded-Neural-Network - 深度神经网络压缩与加速技术综述
Github剪枝开源项目模型量化硬件加速器神经网络压缩稀疏化
Embedded-Neural-Network项目汇集了减小深度神经网络模型大小和加速ASIC/FPGA应用的前沿研究。内容涵盖网络压缩、硬件加速等领域,包括参数共享、知识蒸馏、定点训练、稀疏正则化和剪枝等技术。项目还整理了相关教程和重要会议论文。
XNNPACK - 多平台优化的神经网络推理引擎 支持移动和嵌入式系统
GithubXNNPACK开源项目深度学习框架神经网络推理移动平台优化算子支持
XNNPACK是一个用于加速高级机器学习框架的神经网络推理引擎。它支持ARM、x86、WebAssembly和RISC-V等多种平台,提供低级性能原语,优化TensorFlow Lite、PyTorch等框架的运行效率。XNNPACK实现了丰富的神经网络操作符,在移动设备和嵌入式系统上表现出色,能高效运行各代MobileNet模型。在Pixel 3a上,XNNPACK能在44毫秒内完成FP32 MobileNet v3 Large的单线程推理,展现了其卓越的性能。
nncase - 神经网络编译器 优化AI加速器性能
AI加速器GithubK230nncase开源项目模型量化神经网络编译器
nncase是专为AI加速器设计的神经网络编译器,支持多输入输出和多分支结构。它采用静态内存分配,提供算子融合优化,支持浮点和uint8量化推理,以及基于校准数据集的后量化。nncase支持零拷贝加载平面模型,适用于K230、K510和K210等芯片。它提供丰富的操作符支持、使用指南和示例,以及完整的生态系统资源,有助于高效部署AI模型。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号