Project Icon

libedgetpu

Coral设备边缘AI推理的高性能运行时库

libedgetpu是一个开源项目,为Coral设备提供用户空间运行时驱动。支持多平台构建和ARM架构交叉编译,优化Edge TPU性能实现高效边缘AI推理。提供Docker、Bazel和Makefile构建方式,适用于Linux、macOS和Windows等主流操作系统。使用USB加速器时需注意散热问题,建议在适宜温度下操作以确保安全。

oneDNN - 优化深度学习应用的跨平台性能库,支持多种处理器架构
CPU优化GithubUXL Foundationdeep learningoneAPI specificationoneDNN开源项目
oneAPI Deep Neural Network Library (oneDNN) 是一个开源的跨平台性能库,提供深度学习应用的核心模块。oneDNN 专为Intel架构处理器、Intel图形处理器和Arm 64位架构处理器进行优化,并实验性支持NVIDIA、AMD、OpenPOWER、IBMz 和 RISC-V 等架构的 GPU 和 CPU。深度学习应用及框架开发者可以利用oneDNN提升在多种硬件上的性能表现。
T-MAC - 优化低比特量化LLM推理的CPU加速框架
CPU加速GithubLLM推理T-MAC低比特量化开源项目矩阵乘法
T-MAC是一个创新的内核库,采用查找表技术实现混合精度矩阵乘法,无需反量化即可加速CPU上的低比特LLM推理。该框架支持多种低比特模型,包括GPTQ/gguf的W4A16、BitDistiller/EfficientQAT的W2A16和BitNet的W1(.58)A8。T-MAC在多种设备上展现出显著性能提升,例如在Surface Laptop 7上,单核处理速度可达20 tokens/s,四核可达48 tokens/s,比llama.cpp快4~5倍。
xla - 提升深度学习模型训练与推理效率的开源工具
GithubGoogle CloudPyTorch/XLATPU分布式计算开源项目深度学习
PyTorch/XLA 是一个将 PyTorch 深度学习框架与 XLA 编译器及 Cloud TPUs 连接的 Python 包,提供高效的训练和推理解决方案。用户可以通过 Kaggle 免费试用,并安装支持 TPU 和 GPU 的插件包。项目提供详细的文档和教程,包括使用指南、性能调优方法和 Docker 镜像使用说明。鼓励用户通过 issue 提交反馈和建议,欢迎开源贡献。
ipex-llm - 在Intel CPU和GPU上运行大型语言模型(LLM)的高性能库
AIGithubIPEX-LLMLLM运行库PyTorch开源项目英特尔
IPEX-LLM是专为Intel CPU和GPU设计的PyTorch库,能高效运行多种大型语言模型如LLaMA2和Mistral,确保极低延迟。支持最新技术如Microsoft的GraphRAG和多模态模型,及英特尔新型NPU。提供一体化易用性并针对多GPU优化,包括实时演示和详尽的性能基准。
ZLUDA - 英特尔GPU上的高性能CUDA兼容层
CUDAGithubIntel GPUZLUDA开源项目性能替代方案
ZLUDA项目为英特尔GPU提供CUDA兼容层,使未修改的CUDA应用能在英特尔显卡上运行。它支持英特尔UHD集成显卡和即将推出的Xe系列GPU。作为概念验证,ZLUDA目前主要适用于GeekBench等程序,性能与OpenCL代码相近。该项目无需代码移植即可使现有应用在英特尔GPU上运行,但目前仍处于早期开发阶段。
TensorRT - 提升PyTorch推理效率的工具
CUDAGithubPyTorchTensorRTTorch-TensorRT安装开源项目
Torch-TensorRT将TensorRT的强大功能引入PyTorch,用户仅需一行代码即可显著提升推理性能。该工具支持在多个平台上安装,包括PyPI和NVIDIA NGC PyTorch容器。通过torch.compile或导出式工作流,用户可以高效优化和部署模型。Torch-TensorRT依赖CUDA和TensorRT,与Linux和Windows等多种平台兼容。提供丰富资源,包括教程、工具和技术讲座,供用户学习使用。
ipex-llm-tutorial - 英特尔XPU上的低位大语言模型库教程
GithubIPEX-LLMIntelLLM应用开发开源项目教程
IPEX-LLM教程提供了在英特尔XPU上使用低位大语言模型库的全面指导。内容覆盖从环境配置到高级应用开发,包括中文支持、GPU加速和模型微调等主题。本教程适合希望在英特尔硬件上开发和优化大语言模型应用的开发者,帮助他们深入了解IPEX-LLM的功能和实际应用。
mace - 移动设备优化的深度学习推理框架
GithubMACEONNXTensorFlow开源项目深度学习推理框架移动端异构计算
MACE是一款专为Android、iOS、Linux和Windows设备设计的深度学习推理框架,优化了NEON、OpenCL、Hexagon等技术以提升性能。它支持多种模型格式,如TensorFlow、Caffe和ONNX,并提供高级API进行电源管理和UI响应优化。MACE设计注重内存使用、模型保护和平台覆盖,提供丰富的模型格式支持。
AITemplate - 开源高性能深度学习推理框架
AITemplateGPU加速Github开源项目推理服务模型转换深度神经网络
AITemplate是一个开源Python框架,能将深度学习模型转换为CUDA或HIP C++代码,实现高效推理。它支持NVIDIA和AMD GPU,提供接近理论峰值的fp16性能。该框架特点包括独立运行无需第三方库、独特的算子融合技术、与PyTorch兼容以及易于扩展。AITemplate支持ResNet、BERT和Stable Diffusion等多种主流模型。
baetyl - 将云计算能力延伸至边缘设备的开源框架
BAETYLGithubLinux Foundation Edge云管理开源框架开源项目边缘计算
Baetyl 作为 Linux Foundation Edge 的边缘计算开源项目,旨在将云计算能力延伸至边缘设备。框架支持设备连接、消息传递、远程同步和函数计算等功能,并提供离线和低延迟计算服务。Baetyl v2 版本整合了云端管理和边缘操作方案,由边缘计算框架和云管理套件构成,可灵活部署于 AI 一体机和 5G 路边盒等新型边缘设备。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号