Project Icon

nerfacc

NeRF训练与推理的PyTorch加速工具箱

NerfAcc是一款基于PyTorch的NeRF加速工具箱,专注于辐射场体积渲染中的高效采样。这款工具无需大幅度修改现有代码,即可显著加速多种NeRF模型的训练过程。NerfAcc提供纯Python接口与灵活API,只需简单定义sigma_fn和rgb_sigma_fn函数即可实现加速。支持CUDA加速,并提供易于安装的预构建轮包。详细信息请参考NerfAcc官方网站。

UltraFastBERT - 指数级加速的BERT语言模型训练与推理方案
BERTGithubUltraFastBERT开源项目机器学习神经网络语言模型
UltraFastBERT是一个开源项目,旨在通过创新的快速前馈(FFF)层设计实现BERT语言模型的指数级加速。项目提供了完整的训练代码,以及在CPU、PyTorch和CUDA平台上的高效实现。包含训练文件夹、各平台基准测试代码,以及UltraFastBERT-1x11-long模型的配置和权重,可通过HuggingFace轻松加载使用。研究人员可以方便地复现结果,并进一步探索该突破性技术在自然语言处理领域的广泛应用潜力。
NeMo - 人工智能训练和部署平台
GithubNVIDIA NeMo多模态模型大语言模型开源项目热门生成式AI语音识别
NeMo框架是NVIDIA开发的一款云原生生成式AI框架,专为研究人员和使用PyTorch的开发者设计,支持大型语言模型、多模态模型、自动语音识别等多个领域。该框架能够利用现有代码和预训练的模型检查点,帮助用户高效创建和定制新的生成式AI模型。通过广泛的教程和文档,用户可以轻松开始使用NeMo框架,无论是在任何云端还是本地环境中。
Automatic-Circuit-Discovery - 推进神经网络可解释性研究的自动化工具
ACDCGithub可解释性开源项目机器学习神经网络自动电路发现
Automatic Circuit DisCovery (ACDC)项目提供了一套自动化工具,用于探索神经网络内部机制,提高模型可解释性。项目包含NeurIPS 2023聚焦论文的配套代码,实现了ACDC算法、计算图编辑功能和可编辑计算图的底层实现。基于TransformerLens库开发,支持Python 3.8+环境,并提供完整的安装和使用文档。该工具为研究人员提供了深入分析神经网络内部结构的新方法。
flashtorch - 基于PyTorch的神经网络可视化工具
FlashTorchGithubPyTorch可视化开源项目特征可视化神经网络
FlashTorch是基于PyTorch的神经网络可视化工具,通过简单的接口实现特征可视化技术,如显著性图和激活最大化。该工具兼容torchvision预训练模型和自定义PyTorch模型,有助于研究人员和开发者理解、解释及优化神经网络的内部工作机制。FlashTorch仅需几行代码即可应用,为深入分析神经网络提供了便捷途径。
NeuroCraft - 简化神经网络开发流程的直观平台
AI工具人工智能模型训练模型设计模型部署神经网络
NeuroCraft是一个创新的神经网络开发平台,提供设计、训练和部署神经网络的综合解决方案。该平台采用简洁的拖放界面,简化模型设计过程,支持实时观察模型学习并灵活配置训练参数。NeuroCraft还提供多样化的部署选项,方便将模型集成到现有系统或用于应用内预测。这个平台适合各级人工智能从业者使用,有助于高效管理神经网络的全生命周期。
lightning-thunder - PyTorch模型优化编译器 显著提升训练速度
GPU加速GithubPyTorch开源项目性能优化深度学习编译器
Lightning Thunder是一款专为PyTorch设计的源到源编译器。它通过整合nvFuser、torch.compile、cuDNN等多种硬件执行器,大幅提升PyTorch程序的执行效率。支持单GPU和多GPU环境,在Llama 2 7B模型训练中实现40%的吞吐量提升。Thunder具有易用性、可理解性和可扩展性,是PyTorch开发者提升模型性能的有力工具。
equiformer-pytorch - SE(3)/E(3)等变注意力网络的高效PyTorch实现
AIEquiformerGATv2GithubSE3 Transformers开源项目深度学习
Equiformer-pytorch是一个基于PyTorch的SE(3)/E(3)等变注意力网络实现。该项目采用MLP注意力机制和非线性消息传递,实现了最先进的性能。它支持可逆网络以提高内存效率,并集成了最新的球谐函数稀疏化技术,大幅提升计算效率。Equiformer-pytorch还提供边缘和邻接矩阵支持,适用于蛋白质折叠等各种3D原子图任务。
warp - 用于高性能模拟和图形计算的Python框架
GPU加速GithubNVIDIA WarpPython框架图形编程开源项目高性能模拟
Warp是NVIDIA开发的Python框架,用于高性能模拟和图形计算。它将Python函数编译为可在CPU或GPU上运行的高效内核代码。Warp为空间计算提供丰富原语,便于开发物理模拟、感知、机器人和几何处理程序。其可微分内核可用于机器学习。Warp支持多种操作系统和CPU架构,适用于科研和工业应用。
unet.cu - UNet扩散模型的高性能CUDA实现
CUDAGithubUNet卷积神经网络图像生成开源项目深度学习
这个开源项目使用纯C++/CUDA实现了UNet扩散模型训练框架,支持无条件扩散。框架包含线性层、组归一化、注意力等核心算子的GPU加速实现,重点优化3x3卷积。通过多次迭代提升CUDA kernel性能,训练速度达PyTorch的40%。项目展示了深度学习框架在GPU上的高效实现过程,为相关开发提供参考。
neural-fortran - Fortran实现的开源并行深度学习框架
FortranGithubneural-fortran并行计算开源项目深度学习神经网络
neural-fortran是一个基于Fortran的开源深度学习框架,支持密集和卷积神经网络的训练与推理。该框架提供多种优化器和激活函数,支持从Keras HDF5文件加载模型,并实现数据并行。其特点包括高性能计算、易用性和可扩展性,适用于多种深度学习应用场景。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号