#PyTorch
Jetson-Nano-Ubuntu-20-image - Jetson Nano Ubuntu 20.04深度学习环境配置指南
Jetson NanoUbuntu 20.04OpenCVTensorFlowPyTorchGithub开源项目
介绍如何在Jetson Nano上安装和配置Ubuntu 20.04操作系统,预装OpenCV、TensorFlow和Pytorch等核心深度学习工具。包括更新日志、安装步骤和下载链接,适合在Jetson Nano上运行AI模型的开发者。
multidim-positional-encoding - 支持PyTorch和TensorFlow的1D、2D和3D正弦位置编码实现
Positional EncodingPyTorchTensorFlow1D Encoding2D EncodingGithub开源项目
这是一款易于下载和实用的1D、2D和3D正弦位置编码工具,适用于PyTorch和TensorFlow。支持处理(batchsize, x, ch)、(batchsize, x, y, ch)和(batchsize, x, y, z, ch)形式的张量,并在ch维度进行编码。该工具扩展了一维位置编码至多维,提供了详细的安装和使用指南,并在6.0.1版本后优化了代码导入方式。
model-vs-human - 用于评估人类与机器视觉差距的Python工具箱
modelvshumanPyTorchTensorFlow对比模型视觉Github开源项目
modelvshuman是一个用于评估人类与机器视觉差距的Python工具箱。支持测试包括PyTorch和TensorFlow在内的多种模型,覆盖17个人类比较数据集。项目提供安装指南、示例代码、模型库和数据集加载方式,帮助快速入门并进行自定义模型评估。详细信息请访问项目主页。
AdaSeq - 完善的序列理解模型开发库,涵盖多种高级任务
AdaSeqModelScope序列理解命名实体识别PyTorchGithub开源项目
AdaSeq是由阿里巴巴达摩院开发的一体化序列理解工具库,构建在ModelScope之上。支持词性标注、分块、命名实体识别、实体类型化、关系抽取等多种任务。提供丰富的前沿模型和训练方法,优于许多现有框架。该库使用简便,只需一行命令即可生成模型,支持自定义模型和数据集。适用于研究人员和开发者,项目处于快速开发阶段,并提供多语言、多领域的数据集和在线演示。
dataloader - 适用于 TensorFlow、PyTorch 和 JAX 的 GPU 优化数据加载器
Merlin Dataloader推荐系统GPU优化TensorFlowPyTorchGithub开源项目
Merlin Dataloader 提供适用于 TensorFlow、PyTorch 和 JAX 的 GPU 优化数据加载器,大幅提升推荐模型的训练速度。优势包括速度提升超10倍、支持大于内存的数据集、每个周期的数据随机化及分布式训练。这些特点使其成为高效训练推荐模型的理想工具。
relora - 使用ReLoRA实现高效深度学习模型训练
ReLoRAPyTorchPEFTflash attention训练Github开源项目
ReLoRA项目通过低秩更新实现高效深度学习训练,兼容Python 3.10+和PyTorch 2.0+,支持更大的微批次大小。用户可通过执行预处理和不同配置的训练脚本,达到高效分布式训练,并支持cosine重启调度和多GPU配置。项目涵盖了预热训练和ReLoRA重启,适用于各种规模的模型训练。
mmsegmentation - 高效的PyTorch语义分割工具箱与新特性介绍
MMSegmentationPyTorchOpenMMLab语义分割v1.0.0Github开源项目
MMSegmentation是基于PyTorch的开源语义分割框架,提供模块化设计和统一基准,支持多种算法。最新v1.2.0版本新增开放词汇语义分割和单目深度估计功能,提升训练效率和快速部署体验。
torchscale - 高效扩展Transformer模型的PyTorch开源库
TorchScaleTransformersPyTorchDeepNetLongNetGithub开源项目
TorchScale是一个PyTorch开源库,旨在帮助研究人员和开发者有效扩展Transformer模型。该库专注于开发基础模型和AGI架构,提升建模的通用性、能力以及训练的稳定性和效率。其关键功能包括DeepNet的稳定性、Foundation Transformers的通用性、可延展性的Transformer和X-MoE的效率。最新更新涉及LongNet和LongViT等创新架构,支持多种应用,如语言、视觉和多模态任务,用户仅需几行代码即可快速创建和调整模型。
mmdetection - MMDetection:基于PyTorch的高效目标检测工具箱
OpenMMLabMMDetectionPyTorchRTMDetMM-Grounding-DINOGithub开源项目
MMDetection是一款专为目标检测、实例分割和全景分割任务设计的工具箱,采用模块化设计,支持多种检测任务,具备高效GPU运算能力。其性能与其他顶级代码库相媲美,且不断保持前沿。结合COCO挑战赛冠军经验,MMDetection提供先进的检测结果,并与MMEngine和MMCV无缝整合,进一步提升研究和应用效果。最新的RTMDet模型在参数-准确率优化及实时实例分割和旋转目标检测上表现出色。
pytorch-seq2seq - 使用PyTorch实现序列到序列模型的教程
PyTorchseq2seq神经网络翻译机器翻译Github开源项目
该项目提供一系列使用PyTorch实现seq2seq模型的教程,特别是对德语到英语的翻译。教程涵盖了seq2seq网络的基础、编码器-解码器模型、注意机制以及使用spaCy进行数据分词,并提供了详细的代码和示例,帮助学习者深入理解和应用相关技术。
yoloair - YOLOAir2024版:综合模型改进教程与源码库
YOLOv8UltralyticsProYOLOAirYOLOv5PyTorchGithub开源项目
YOLOAir2024版发布,提供多模型支持及改进教程,包括YOLOv5、YOLOv7、YOLOv8等。通过统一框架和模块化实现模型多样化应用,如目标检测、实例分割、图像分类等,适用于科研与实际应用。免费提供源代码。
allRank - 深入的PyTorch排序学习框架,支持多种神经网络模型
allRankPyTorch学习排序损失函数评估指标Github开源项目
allRank是一个基于PyTorch的框架,旨在简化神经排序学习模型的实验。它提供多种损失函数和评分函数,并支持常用评估指标如NDCG和MRR。该框架支持添加自定义损失和配置模型与训练流程,适用于研究和工业应用。同时支持GPU和CPU架构,并集成了Google云存储功能。
malaya - 马来西亚语自然语言处理库
MalayaPyTorch自然语言处理Python预训练模型Github开源项目
Malaya是一个由PyTorch驱动的功能强大的马来西亚语自然语言处理库,提供预训练模型和详细文档。支持Python 3.6及以上版本,并建议通过virtualenv进行开发。用户可以方便地通过PyPI安装,并选择合适的PyTorch版本。项目得到了KeyReply、Nvidia和Tensorflow Research Cloud的支持,提供充足的计算资源。欢迎各类形式的贡献,不仅限于代码。
brocolli - 基于Torch FX的PyTorch模型转换和量化工具,支持转换为Caffe和ONNX格式
brocolliPyTorch转换器量化器安装Github开源项目
此开源项目提供了基于Torch FX的PyTorch模型转换和量化功能,支持转换为Caffe和ONNX格式。用户可以通过简单的安装和使用步骤实现模型的转换与保存。尽管该项目已停止维护,它仍然提供了详细的使用示例和说明,适合需要进行PyTorch模型转换的用户。
pytorch-auto-drive - 基于 PyTorch 的分割模型和车道检测模型
PytorchAutoDrive语义分割车道检测PyTorch模型部署Github开源项目
框架基于纯Python和PyTorch,提供从模型训练、测试到可视化和部署的全方位支持。特色包括多种主干网络、简洁易懂的代码、混合精度训练及ONNX和TensorRT的部署支持。该框架中模型训练速度快,性能优于其他实现,支持多种数据集和模型方法,为自动驾驶研究提供可靠的基准测试和高效工具。
Awesome-Backbones - 图像分类的主干网络库及其使用教程
Awesome-Backbones图像分类PyTorch模型训练预训练权重Github开源项目
提供丰富的图像分类主干网络,包括TinyViT、DeiT3、EdgeNeXt、RevVisionTransformer等,兼容Pytorch 1.7.1+及Python 3.6+。项目包含环境搭建、数据集准备、训练和评估的详细教程,适合科研和实际应用,提升图像分类模型性能。提供快速开始指南和预训练权重,帮助开发者高效部署与测试。
conformer - 结合卷积神经网络和Transformers的语音识别模型
ConformerPyTorch卷积神经网络Transformer语音识别Github开源项目
Conformer模型结合卷积神经网络和Transformers,能同时捕捉音频的局部和全局依赖关系,提高语音识别精度并节省参数。本项目提供该模型的PyTorch实现,包含详细的安装和使用指南,适用于Python 3.7及更高版本。
AlphaFold3 - 预测蛋白质相互作用结构的开源工具
AlphaFold3深度学习蛋白质结构预测遗传扩散PyTorchGithub开源项目
AlphaFold3通过基因扩散模型实现了生物分子相互作用结构的精确预测。该模型处理包括聚合物序列、残基修饰和配体smiles符号等多种输入数据,适用于预测多达1000个残基的蛋白质结构。独特的交叉蒸馏方法和信心评估机制减少了模型幻觉问题,增强了预测的可信度。用户可通过PyTorch和Docker容器便捷安装和运行该模型。
determined - 深度学习平台,支持分布式训练与超参数调优
Determined深度学习平台PyTorchTensorFlow分布式训练Github开源项目
Determined平台兼容PyTorch和TensorFlow,提供分布式训练、超参数调优和资源管理,降低云端GPU成本并支持实验追踪分析和可复现性。通过Python库、命令行界面和Web用户界面,用户能够轻松构建和管理模型,支持本地和云端部署,包括AWS和GCP。丰富的文档和示例帮助快速上手,通过用户指南、社区支持和贡献者指南,确保完整平台功能的利用。
semantic-segmentation - 提供丰富数据集和易于定制的语义分割模型
Semantic SegmentationPyTorchSOTA模型库数据集Github开源项目
该项目提供易于使用和定制的SOTA语义分割模型,支持多种任务和数据集。适合高精度和定制应用场景,涵盖场景解析、人类解析、人脸解析等任务。特点包括多种主干网络和分割模型,支持PyTorch、ONNX、TFLite等框架的推理和导出。即将迎来重大更新,包括新的训练流程、预训练模型、教程和分布式训练支持。用户可通过详细文档和示例轻松使用并配置定制数据集,实现高效的语义分割。
raster-vision - 开源Python工具构建卫星和航空影像的计算机视觉模型
Raster Vision计算机视觉卫星图像深度学习PyTorchGithub开源项目
Raster Vision是一个开源的Python库和框架,用于构建卫星、航空和其他大型影像集的计算机视觉模型。它支持芯片分类、目标检测和语义分割,后端采用PyTorch。作为低代码框架,它允许用户无需深度学习专业知识即可配置和运行机器学习管道,并支持通过AWS Batch和AWS Sagemaker在云端进行部署。用户可以通过pip或Docker镜像进行安装和使用。更多详情参阅官方文档。
YOLOv8-TensorRT - 通过TensorRT加速YOLOv8模型,提供在CUDA环境下的快速部署和推理解决方案
YOLOv8TensorRTCUDAONNXPyTorchGithub开源项目
本项目通过TensorRT加速YOLOv8模型,提供在CUDA环境下的快速部署和高效推理解决方案。包括环境准备、模型导出、引擎构建和多种推理方法,支持Python和C++语言。特性涵盖ONNX模型导出、端到端引擎构建和模型推理,适用于图像和视频的不同输入源。支持Jetson设备,并附有详细的文档和脚本,便于操作,提升深度学习应用性能。
former - 使用PyTorch实现简单Transformer模型的指南
transformerPyTorch自注意力机制分类实验IMDb数据集Github开源项目
详细介绍了如何使用PyTorch从零开始实现简单的Transformer模型,包含安装和使用指南,以及通过命令行控制超参数和数据自动下载的说明。
onnx2tflite - 优化ONNX模型到TensorFlow Lite的转换工具,具备高一致性和自动通道对齐功能
ONNXTFLiteKerasPyTorch转换Github开源项目
onnx2tflite工具实现从ONNX到TensorFlow Lite和Keras的快速高效模型转换。它具备高一致性,平均误差低于1e-5,速度比其他工具提高30%。支持自动转换PyTorch和TensorFlow格式,并能输出FP16和UINT8定量模型。用户还可以自定义操作符,提升模型转换和部署的灵活性。
nnmnkwii - 用于快速构建语音合成系统的简易库
Python库PyTorchMerlinGithub开源项目nnmnkwii语音合成
nnmnkwii是一款专为快速构建语音合成系统而设计的库,支持原型设计。该库可通过PyPI安装,并提供稳定版和开发版文档。依赖于PyTorch实现自动求导功能,设计灵感源于Merlin和Librosa,功能强大且灵活。
OpenSTL - OpenSTL:时空预测学习的全面基准和模块化框架
OpenSTL时空预测数据集PyTorchNeurIPS 2023Github开源项目
OpenSTL是一个全面的时空预测学习基准,涵盖了从合成运动物体轨迹到人体运动、驾驶场景、交通流量和天气预报的多样任务。该框架模块化设计并具有良好的扩展性,支持PyTorch Lightning和原始PyTorch实现。其主要功能包括灵活的代码设计和标准基准,组织严密并易于使用。
joeynmt - 简洁而清晰的NMT模型实现,促进教育和学习
Joey NMT机器翻译PyTorchTransformerGRUGithub开源项目
Joey NMT框架专为教育而设计,提供简明和清晰的代码库,帮助初学者理解RNN和Transformer等经典NMT架构。其主要特点包括模块化设计,便于修改组件及训练流程,保持代码可读性。支持多个注意力机制、不同的分词类型和多语种翻译,包含详细的文档和教程,适用于模型训练、测试和翻译的各个阶段。最新版本引入分布式数据并行和多项优化,兼容最新的Python和PyTorch版本。
exporters - 将Transformer模型高效转换为Core ML格式
Core MLTransformersHuggingFacePyTorchTensorFlowGithub开源项目
🤗 Exporters工具包旨在简化将Transformer模型转换为Core ML格式的过程,避免手动编写转换脚本。它与Hugging Face Transformers库紧密集成,并提供无代码转换体验,支持BERT和GPT-2等多种模型架构。工具包可在Linux和macOS平台上运行,利用coremltools实现从PyTorch或TensorFlow到Core ML的转换,并通过Hugging Face Hub进行模型管理,提升模型转换和部署的便捷性及灵活性。
hardware-aware-transformers - 瞄准多硬件平台优化的自然语言处理Transformer模型
HATTransformerNLPPyTorch硬件感知Github开源项目
HAT项目提供基于PyTorch的硬件感知Transformer,模型大小减小至原来的3.7倍,且性能无损。通过SuperTransformer搜索优化的SubTransformer,大幅降低搜索成本,并在不同硬件平台例如Raspberry Pi和Intel Xeon上实现显著加速。支持多种机器翻译任务,并提供预处理数据和预训练模型的直接下载。
open_flamingo - 开源多任务视觉语言模型,支持图像文本生成和多模态训练
OpenFlamingoVision-Language ModelPyTorchDeepMindMultimodalGithub开源项目
该项目提供了DeepMind Flamingo的PyTorch开源实现,用于训练和评估多任务视觉语言模型。OpenFlamingo处理多模态数据集,通过跨模态注意力层结合预训练视觉编码器和语言模型,实现图像和文本条件下的文本生成。用户可通过详细的安装和使用指南快速上手,并访问多个预训练模型和权重。项目欢迎社区贡献和反馈,支持多种语言和视觉编码器,适用于多种应用场景。
cramming - 探索单GPU一天内训练BERT语言模型的极限
Cramming Language ModelBERTPyTorchGLUETransformer-based language modelGithub开源项目
本项目探索在单GPU上用一天时间预训练BERT语言模型的性能表现,旨在挑战当前以高算力为核心的趋势。通过调整预训练流程,展示了在严格计算限制下依然接近BERT性能,并分析不同改进对性能的影响。最新版本框架需要PyTorch 2.0,改善了数据预处理并提升了1-2% GLUE性能,提供了详细的代码运行和数据处理指南供研究和应用参考。
TransMorph_Transformer_for_Medical_Image_Registration - 基于Transformer的无监督医学图像配准方法
TransMorphTransformer医学影像配准深度学习PyTorchGithub开源项目
TransMorph是一个利用Transformer架构进行无监督医学图像配准的开源项目,结合了Vision Transformer和Swin Transformer技术。提供多个模型变体和多种损失函数,支持单模态和多模态配准,公开了训练脚本和预训练模型,并在MICCAI 2021 L2R挑战中表现出色。
TextPruner - 使用低成本且无需训练的方法优化预训练语言模型
TextPruner模型剪枝预训练语言模型PyTorchNLP任务Github开源项目
TextPruner提供低成本且无需训练的方法来优化预训练语言模型,通过减少模型尺寸加快推理速度。兼容多种NLU模型,提供用户友好的接口,支持词汇、Transformer和流水线剪枝。用户可以方便地根据需求自定义配置。详细文档和实验结果支持,帮助用户快速上手并验证性能提升。适用于Python 3.7及以上版本,依赖torch和transformers库。
fairseq - 序列建模工具包,支持机器翻译与文本生成
Fairseq序列建模文本生成PyTorch机器翻译Github开源项目
Fairseq 是一个序列建模工具包,适用于机器翻译和文本生成。支持多GPU训练,提供灵活配置和扩展能力,以及多种预训练模型和参考实现。内置束搜索和抽样等算法,支持混合精度训练和参数CPU卸载,为研究人员和开发人员提供高效解决方案。
open-cd - 开源变更检测工具箱,支持多种视觉任务模型
Open-CD开源变化检测工具箱技术报告PyTorchGithub开源项目
Open-CD是一个基于开源通用视觉工具的变更检测工具箱,支持多种变更检测模型和数据集。项目提供详细文档和示例,支持PyTorch 2.0等工具,并在GitHub和Hugging Face上发布。最新技术报告已在arXiv上线,用户可从Colab教程快速上手,并有详细的安装、训练和测试指南。
pytorch-CycleGAN-and-pix2pix - PyTorch中的高效CycleGAN和pix2pix图像翻译
CycleGANpix2pixPyTorch图像翻译神经网络Github开源项目
该项目提供了PyTorch框架下的CycleGAN和pix2pix图像翻译实现,支持配对和无配对的图像翻译。最新版本引入img2img-turbo和StableDiffusion-Turbo模型,提高了训练和推理效率。项目页面包含详细的安装指南、训练和测试步骤,以及常见问题解答。适用于Linux和macOS系统,兼容最新的PyTorch版本,并提供Docker和Colab支持,便于快速上手。
相关文章
RelBench:斯坦福大学最新发布,将关系型数据库转为图形表示,提高预测准确性
2024年08月03日
CycleGAN: 无配对图像到图像转换的革命性技术
2024年08月29日
MockingBird: 5秒内克隆声音并生成任意语音内容的AI技术
2024年08月29日
PyTorch-Grad-CAM:计算机视觉的高级AI可解释性工具
2024年08月29日
RobustVideoMatting: 突破性的实时高分辨率视频抠图技术
2024年08月29日
DeepPavlov: 开源对话系统和聊天机器人的深度学习框架
2024年08月30日
Thinc:一个创新的深度学习库,为您的机器学习项目带来全新体验
2024年08月30日
DeepPavlov: 开源对话系统和聊天机器人的深度学习框架
2024年08月30日
Pyannote:揭秘声音的DNA,精准分辨出各个发言者的声音
2024年08月03日