Project Icon

HVM

实现高级语言大规模并行计算的开源工具

HVM2是一个开源的大规模并行评估器,基于交互组合子理论。它可以将Python、Haskell等高级语言编译成能在GPU等并行硬件上高效运行的程序。作为HVM1的改进版,HVM2在简洁性、速度和正确性方面都有提升。项目提供低级IR语言用于描述HVM2网络,并支持编译为C和CUDA代码。对于需要高级语言接口的用户,可以使用配套的Bend项目。

Bend - 结合高级语言特性和大规模并行计算的编程语言
BendGPU编程Github函数式语言并行编程开源项目高性能计算
Bend是一种创新的高级并行编程语言,将高级语言的易用性与大规模并行计算的高效性相结合。它融合了Python和Haskell等语言的优秀特性,如快速对象分配、高阶函数和闭包支持,同时在GPU等并行硬件上实现了接近CUDA的性能,无需开发者手动添加并行化代码。Bend能够在GPU等大规模并行硬件上实现近乎线性的性能提升,且支持无限递归等高级特性。基于HVM2运行时开发,Bend目前仍在持续完善中,未来有望进一步优化性能。
tvm - 适用于 CPU、GPU 和专用加速器的开放式深度学习编译器堆栈
Apache TVMApache-2.0Github开源项目深度学习硬件后端编译器
Apache TVM为深度学习提供高效编译支持,优化执行效率,适合用于学术与工业研究领域,填补了框架与后端之间的技术差距。
TornadoVM - 适用于异构硬件的Java程序自动化插件
GithubJavaOpenCLPTXSPIR-VTornadoVM开源项目
TornadoVM是一个针对OpenJDK和GraalVM的插件,能够在异构硬件上自动运行Java程序。它支持OpenCL、PTX和SPIR-V设备,包括多核CPU、专用GPU(如Intel、NVIDIA、AMD)、集成GPU(如Intel HD Graphics和ARM Mali)和FPGA(如Intel和Xilinx)。TornadoVM具有三个后端,可生成OpenCL C、NVIDIA CUDA PTX汇编和SPIR-V二进制文件,开发人员可以选择安装和运行所需的后端。
vllm - 高性能与易用性的LLM推理与服务平台
GithubLLM服务PagedAttentionvLLM开源项目量化高吞吐量
vLLM是一个高性能且易用的LLM推理与服务平台,具备PagedAttention内存管理、CUDA/HIP图形加速、量化支持、并行解码算法及流式输出等技术优势。vLLM无缝集成Hugging Face模型,兼容多种硬件设备,支持分布式推理和OpenAI API。最新版本支持Llama 3.1和FP8量化。用户可通过pip安装并参考详细文档快速入门。
higgsfield - 高容错且可扩展的GPU调度与机器学习框架
GPU管理GithubHiggsfield分布式计算大模型训练开源项目深度学习
Higgsfield是一款开源、高容错、可扩展的GPU调度与机器学习框架,适用于数十亿到数万亿参数的模型(如大型语言模型)。它的主要功能包括分配计算资源、支持高效分片、启动和监控大规模神经网络训练、管理资源竞争,并通过与GitHub的集成实现持续集成。Higgsfield简化了大规模模型训练的流程,提供了多样且强大的开发工具。
LLMCompiler - 提升大语言模型性能的并行函数调用框架
GithubLLMCompiler优化编排并行函数调用开源项目效率提升模型兼容
LLMCompiler框架通过并行函数调用提升大语言模型的执行效率。它自动识别可并行任务,减少延迟和成本,同时提升准确性。用户只需提供工具和上下文示例,LLMCompiler就能优化函数调用编排。支持开源和闭源模型,包括LLaMA和OpenAI的GPT模型。LLMCompiler在不同任务中展示了显著的延迟加速、成本节省和准确性提升,是处理复杂问题的理想工具。
HPSv2 - 文本到图像生成模型评估的全面基准测试框架
GithubHPS v2人类偏好评分图像生成模型基准测试开源项目文本到图像合成
HPSv2是一个评估文本到图像生成模型的先进基准测试框架。该框架基于大规模人类偏好数据集HPDv2训练,可准确预测人类对生成图像的偏好。HPSv2提供公平、稳定且易用的评估方法,涵盖动画、概念艺术、绘画和照片四种风格。研究人员可利用HPSv2比较不同模型性能或评估自研模型。项目提供PyPI包和在线演示,便于快速上手使用。
hidet - 用Python编写的开源深度学习编译器,主要优化NVIDIA GPU上的推理任务
CUDAGithubHidetONNXPyTorch开源项目深度学习编译器
Hidet是一个用Python编写的开源深度学习编译器,主要优化NVIDIA GPU上的推理任务。它能将PyTorch和ONNX模型编译成高效的CUDA内核,通过图级和算子级优化提升性能。Hidet易于集成,支持通过torch.compile优化PyTorch模型,为开发者提供了便捷的深度学习性能优化方案。
taichi - Python嵌入式高性能并行编程语言
GPU加速GithubPython嵌入Taichi Lang并行编程开源项目高性能计算
Taichi是一款嵌入Python的开源并行编程语言,专注高性能数值计算。它利用LLVM等即时编译器将Python代码转译为GPU或CPU指令,支持CUDA、Vulkan等多种后端。Taichi以其灵活性、高性能和跨平台特性,广泛应用于物理模拟、数值分析、AR和AI等领域。
hls4ml - FPGA中实现机器学习推理的高级综合语言工具
FPGAGithubhls4ml开源项目机器学习神经网络高等级综合
hls4ml是一个专为FPGA上实现机器学习推理而设计的开源软件包。它利用高级综合语言(HLS)将传统开源机器学习模型转化为可配置的固件,从而实现高效推理。项目提供详尽的文档和教程,适用于快速入门和深入研究。用户可以通过GitHub平台参与讨论和贡献。该软件包特别适用于对高性能和低延迟推理要求高的应用场景,如粒子物理和自动驾驶领域。支持与Xilinx Vivado HLS工具的集成,并提供多种安装方式。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号