#PyTorch

curated-transformers - 一个为PyTorch设计的转换器库，提供最新的模型和可复用组件

Curated TransformersPyTorchtransformer模型量化spaCy集成Github开源项目

Curated Transformers是一个为PyTorch设计的转换器库，提供最新的模型和可复用组件。支持最新的转换器模型，如Falcon、Llama和Dolly v2，具备类型注释和极少的依赖性，适合教育和生产环境。支持集成至spaCy 3.7，快速安装及支持高效的CUDA优化。

ipex-llm - 在Intel CPU和GPU上运行大型语言模型(LLM)的高性能库

IPEX-LLM英特尔LLM运行库AIPyTorchGithub开源项目

IPEX-LLM是专为Intel CPU和GPU设计的PyTorch库，能高效运行多种大型语言模型如LLaMA2和Mistral，确保极低延迟。支持最新技术如Microsoft的GraphRAG和多模态模型，及英特尔新型NPU。提供一体化易用性并针对多GPU优化，包括实时演示和详尽的性能基准。

how-to-optim-algorithm-in-cuda - 记录如何基于 cuda 优化一些常见的算法

CUDAPyTorchOneFlow算法优化深度学习Github开源项目

本项目详尽介绍了基于CUDA的算法优化方法，涉及从基本元素操作到高级并行处理，包括多个CUDA示例和性能评测。此外，配合专业课程及学习笔记，适用于各层次对CUDA感兴趣的人士。项目还整合了多种教程和代码示例，助力快速学习和应用CUDA优化技术。

kan-gpt - 语言建模的生成式预训练转换的 PyTorch 实现

KAN-GPTPyTorch语言模型生成预训练变换器Kolmogorov-Arnold网络Github开源项目

KAN-GPT在PyTorch平台上实现了结合Kolmogorov-Arnold网络的生成式预训练变换器，用于高效的语言模型建设。该项目支持灵活的训练选项和多种数据集，体现了其在自然语言处理领域的广泛应用和成熟技术。KAN-GPT帮助开发者在文本生成和语言建模方面取得突破，进一步提升AI语言技术。

torchchat - 使用Python和C/C++运行大型语言模型的轻量化实现

torchchatPython大语言模型PyTorch模型部署Github开源项目

torchchat可以通过Python和C/C++应用程序无缝运行大型语言模型(LLMs)，支持桌面、服务器以及iOS和Android设备。该项目特点包括PyTorch原生执行、高效运行、支持多种硬件和操作系统、多种数据类型和量化方案。其安装步骤简便，并提供多种运行模式，如命令行、浏览器界面和REST API，适用于各类开发环境。

openrl - 综合性强化学习平台，支持多任务训练

OpenRL强化学习PyTorch多智能体自然语言处理Github开源项目

OpenRL 是一款基于 PyTorch 的开源强化学习研究框架，支持单代理、多代理、离线强化学习、自我对弈及自然语言处理任务。框架提供统一接口、训练加速方法和多种深度学习模型支持，兼容 Gymnasium、MuJoCo、StarCraft II 等多种环境。同时，OpenRL 还支持用户自定义训练模型、奖励模型和环境配置，并提供中英文文档。

Vicuna-LoRA-RLHF-PyTorch - Vicuna模型LoRA与RLHF的完整优化流程

Vicuna-LoRA-RLHF-PyTorchVicunaLoRARLHFPyTorchGithub开源项目

本文详述如何在普通硬件上优化Vicuna语言模型，包括环境配置、监督微调、合并PEFT适配器、训练奖励模型和PPO微调等步骤，适合中文技术人员使用。

MotionGPT - 文本转动作生成的通用平台

MotionGPTPyTorchLLaMAfinetuning模型评估Github开源项目

MotionGPT是通过微调大型语言模型（LLMs）来实现通用运动生成的开源项目。项目提供详细的安装指南、预训练模型及数据集应用实例，支持高效的文本到动作转换及生成。用户可以轻松实现姿态可视化和SMPL网格渲染。项目页面详细介绍了多种使用场景，适用于各种运动生成需求。

image-gpt - 支持多数据集的生成预训练模型

Image GPTPyTorch生成式预训练CIFAR10Fashion-MNISTGithub开源项目

Image GPT是一个基于生成像素预训练模型（Generative Pretraining from Pixels）的PyTorch实现，支持多种预训练模型和数据集。该项目允许下载预训练模型、量化图像、进行生成预训练和分类微调。它还具有BERT风格的预训练、支持加载OpenAI预训练模型等功能。目前，使用单个NVIDIA 2070 GPU可在Fashion-MNIST上实现高效训练，简化了多种图像数据集上的生成模型训练和应用流程。

mint - 从零构建Transformer模型的详细教程和实现

MinTTransformerBERTPyTorchHuggingFaceGithub开源项目

该项目提供了一系列循序渐进的教程，指导从零开始构建常见的Transformer模型，如BERT、GPT、GPT2、BART和T5。教程不仅讲解基本架构的实现，还包括预训练和微调示例，并提供小型PyTorch库以便额外使用。项目依赖HuggingFace的tokenizers库进行子词标记，适用于不同规模数据集的训练需求，还涵盖了多工作节点的分布式训练示例，非常适合希望深入了解Transformer模型原理和应用的学习者。

pytorch-openai-transformer-lm - 基于PyTorch的OpenAI Transformer语言模型实现

PyTorchOpenAITransformer Language Model预训练模型Github开源项目

该项目实现了OpenAI Transformer语言模型在PyTorch中的复现，提供了预训练权重加载脚本及模型类。采用固定权重衰减和调度学习率优化模型，支持对ROCStories Cloze任务进行微调，效果接近原始TensorFlow实现。适用于深度学习研究和语言模型的生成与分类任务。

stable-baselines3 - 增强型PyTorch强化学习算法，实现可靠性与自定义支持

Stable Baselines3强化学习PyTorchRL算法稳定基线Github开源项目

实现可靠的PyTorch强化学习算法，方便研究和工业用户复制和优化新思路。支持自定义环境与策略，提供统一接口，适合项目开发和性能对比。涵盖A2C、PPO、DQN等算法，包含迁移指南和在线文档，适用于有强化学习基础的用户。

commented-transformers - 精细注释的Transformer在PyTorch中的实现

TransformerPyTorchAttention机制GPT-2BERTGithub开源项目

详细注释的Transformer实现，涵盖从头创建Transformer系列，包括注意力机制和整体Transformer的实现。提供双向注意力、因果注意力及因果交叉注意力的实现，以及GPT-2和BERT模型的单文件实现，兼容torch.compile(..., fullgraph=True)以提高性能。

Jamba - 支持多层次深度学习的PyTorch语言模型

JambaPyTorch神经网络语言模型TransformerGithub开源项目

Jamba是一个基于PyTorch的混合语言模型，结合了Transformer和Mamba架构。通过简单的pip命令（`pip install jamba`），用户可以迅速安装并使用该模型。Jamba支持多种深度学习配置，包括输入数据维度、模型层数、唯一标记数、隐藏状态维度、卷积层维度、注意力头数量和专家网络配置，适用于各种自然语言处理任务。

attorch - 易于修改的Python神经网络模块

attorchPyTorchTriton深度学习神经网络模块Github开源项目

attorch是一个基于OpenAI Triton的PyTorch模块子集，提供易于修改的高效神经网络模块。支持自动混合精度、计算机视觉和自然语言处理相关层。

text - TorchText自然语言处理工具包即将终止开发并发布最终版本

torchtextPyTorchNLP数据集模型Github开源项目

TorchText将于2024年4月发布其最终稳定版0.18。这一NLP工具包包括原始文本迭代器、基本NLP构建模块、文本处理转换、预训练模型和词汇类等功能。推荐使用Anaconda安装，支持多种Python版本。指南和文档包括SpaCy、Moses等可选依赖项。提供详细教程和示例帮助用户入门。

keras-nlp - 兼容多框架的自然语言处理工具和预训练模型

KerasNLPTensorFlowJAXPyTorch自然语言处理Github开源项目

KerasNLP 是一个兼容 TensorFlow、JAX 和 PyTorch 的自然语言处理库，提供预训练模型和低级模块。基于 Keras 3，支持 GPU 和 TPU 的微调，并可跨框架训练和序列化。设置 KERAS_BACKEND 环境变量即可切换框架，安装方便，立即体验强大 NLP 功能。

nncf - Neural Network Compression Framework：高效神经网络推理压缩算法

Neural Network Compression FrameworkOpenVINOPyTorchTensorFlowONNXGithub开源项目

Neural Network Compression Framework (NNCF) 提供一套后训练和训练时的优化算法，用于在 OpenVINO 中优化神经网络推理，保证最小的精度损失。NNCF 支持 PyTorch、TensorFlow 和 ONNX 等模型，并提供示例展示不同压缩算法的使用案例。NNCF 还支持自动化模型图转换、分布式训练和多种算法的无缝组合，支持将压缩后的 PyTorch 模型导出为 ONNX 检查点及将 TensorFlow 模型导出为 SavedModel 格式。

Deep-Learning-Experiments - 深度学习实验和课程指南，涵盖理论与实践

Deep LearningLLMSupervised LearningPyTorchTransformerGithub开源项目

本页面介绍2023版深度学习实验课程，包括理论与实践内容。涵盖监督学习、多层感知器、优化、正则化、卷积神经网络、变压器、自编码器、生成对抗网络和大型语言模型等主题，并提供开发环境、Python、Numpy、PyTorch及Gradio的实践指南。所有文档和代码示例在GitHub上提供，帮助学习者掌握深度学习技术。

OpenDelta - 高效参数调整的开源工具包

OpenDelta参数高效微调delta tuningPyTorchtransformersGithub开源项目

OpenDelta是一个高效的开源调优工具包，通过添加少量参数进行调整，可实现如前缀调优、适配器调优、Lora调优等多种方法。最新版本支持Python 3.8.13、PyTorch 1.12.1和transformers 4.22.2。

transformers-tutorials - Transformers模型在自然语言处理中的应用教程

PyTorchTransformersNLPBERTHugging FaceGithub开源项目

本项目提供了关于如何使用Transformers模型在自然语言处理任务中进行精细调优的详细教程，包括文本分类、情感分析、命名实体识别和摘要生成等案例。教程旨在帮助用户掌握应用最新NLP技术的技巧，并提供配套的Python代码示例和工具指南。

Transformers4Rec - 灵活高效的PyTorch兼容序列与会话推荐库

Transformers4RecNLPRecSysPyTorchHugging Face TransformersGithub开源项目

Transformers4Rec是一个结合Hugging Face Transformers框架的高效库，专注于自然语言处理和推荐系统的结合。通过支持多种输入特征和模块化设计，它提供了与PyTorch兼容的高灵活性架构。集成NVTabular和Triton Inference Server，实现了全GPU加速的管道，优化了序列和会话推荐效果。其在业内竞赛中的优异表现展示了其在会话推荐任务中的高准确性。

BertWithPretrained - 基于PyTorch实现的BERT模型及相关下游任务

BERTPyTorchTransformer中文文本分类英文文本分类Github开源项目

该项目基于PyTorch实现了BERT模型及其相关下游任务，详细解释了BERT模型和每个任务的原理。项目支持分类、翻译、成对句子分类、多项选择、问答和命名实体识别等任务，涵盖中文和英语的自然语言处理。此外，项目还含有丰富的数据集和预训练模型配置文件。

genrl - 强化学习算法库，提供快速基准测试和示例教程

GenRLPyTorch强化学习算法实现基准测试Github开源项目

GenRL是一个基于PyTorch的强化学习库，提供可重现的算法实现和通用接口。它包含20多个从基础到高级的强化学习教程，并支持模块化和可扩展的Python编程。统一的训练和日志记录功能提高了代码复用性，同时自动超参数调整功能加速了基准测试。GenRL旨在支持新算法的实现，代码少于100行。适用于Python 3.6及以上版本，依赖于PyTorch和OpenAI Gym。

reptile-pytorch - PyTorch实现的用于监督学习的OpenAI Reptile算法

ReptilePyTorchOmniglotMiniImagenetOpenAIGithub开源项目

PyTorch实现的OpenAI Reptile算法，专注于监督学习，目前支持在Omniglot数据集上运行，具备K-shot N-way采样、训练监控和中断恢复功能。欢迎对项目的贡献和反馈，未来计划支持Mini-Imagenet数据集、提升Meta-batch大小、添加训练曲线和Shell脚本下载功能。

ml-road - 全面的机器学习与深度学习资源集合

Machine LearningDeep LearningNLPTensorFlowPyTorchGithub开源项目

此资源库涵盖机器学习和深度学习的全面资源，包括优质课程、电子书和学术论文。通过Coursera、Stanford和Google等知名平台的课程，可深入学习基础和高级的机器学习、深度学习、自然语言处理和强化学习。同时，还提供《机器学习》和《深度学习》等电子书，便于自学和参考。适合想要提高机器学习技术水平的学生、研究人员和行业从业者。

adapters - 参数高效与模块化迁移学习的统一库

AdaptersHuggingFaceTransfer LearningPyTorchTransformerGithub开源项目

提供一个兼容HuggingFace Transformers的附加库，整合超过10种Adapter方法和超过20种先进Transformer模型，简化训练和推理的编程工作量。支持高精度与量化训练、任务算术合并适配器以及多适配器组合等功能，适用于NLP任务的参数高效传输学习。

mt-dnn - 多任务深度神经网络在自然语言理解中的最新应用

MT-DNN自然语言理解多任务深度神经网络PyTorch预训练模型Github开源项目

该项目实现了基于PyTorch的多任务深度神经网络（MT-DNN），主要用于自然语言理解。最新版本添加了语言模型预训练和微调的对抗性训练功能。用户可以使用pip安装或通过Docker快速启动，项目提供详细的训练和微调步骤，支持序列标注和问答任务。此外，项目包含模型嵌入提取和训练加速功能。目前由于政策变化，公共存储解决方案暂不提供。

pytorch-sentiment-analysis - 使用PyTorch进行电影评论情感分析的教程

PyTorch情感分析神经网络教程Python 3.9Github开源项目

该开源项目提供了一系列教程，使用PyTorch实现序列分类模型，主要用于从电影评论中预测情感。课程内容包括神经词包模型、递归神经网络（RNN）、卷积神经网络（CNN）和Transformer模型的理论与实践。此外，还讲解了如何使用torchtext库简化数据加载和预处理。如果有任何疑问或反馈，可以随时通过提交问题进行交流。

HanLP - 面向多语种的生产环境自然语言处理工具，支持PyTorch与TensorFlow

HanLP自然语言处理多语种PyTorchTensorFlowGithub开源项目

HanLP是一款面向生产环境的多语种自然语言处理工具，基于PyTorch和TensorFlow双引擎。支持130种语言和多种NLP任务，包括分词、词性标注、命名实体识别和依存句法分析等。HanLP的预训练模型持续更新，并提供RESTful API和native API，适用于敏捷开发和移动应用。

flair - 一个易用的最先进自然语言处理和文本嵌入框架，支持多语言模型应用

Flair自然语言处理文本嵌入PyTorch情感分析Github开源项目

Flair 是一个强大的自然语言处理库，支持命名实体识别、情感分析、词性标注等多种功能，并且支持多种语言。通过简易接口，用户可以轻松使用和整合多种词和文档嵌入，基于 PyTorch 框架进行模型训练和实验。Flair 还对生物医学文本有特殊支持，并提供最新的命名实体识别模型，性能媲美甚至超过当前最优结果。用户可以在 Hugging Face 平台上访问并试用这些模型。

X2Paddle - 飞桨生态下的模型转换工具，致力于帮助其它深度学习框架用户快速迁移至飞桨框架

深度学习PyTorchGithub开源项目X2Paddle飞桨模型转换

X2Paddle是一个将Caffe、TensorFlow、ONNX和PyTorch模型转换为飞桨框架的开源工具。它支持推理模型和PyTorch训练项目的快速迁移，并提供详细的API对比文档。通过简单的一键命令或API，模型转换变得轻松，显著节省迁移成本。适用于Python 3.5+及多种硬件设备，同时支持PaddleLite格式及VisualDL在线转换服务，充分发挥飞桨生态系统的优势。

TinyLLaVA_Factory - 模块化的开源小规模多模态模型库

TinyLLaVA Factory多模态模型开源代码库HuggingFacePyTorchGithub开源项目

TinyLLaVA Factory是一个开源的模块化代码库，专注于简化小规模多模态模型的开发和定制，使用PyTorch和HuggingFace实现。其设计旨在简化代码实现、提高扩展性和确保训练结果的可重复性。支持如OpenELM、TinyLlama、StableLM等语言模型和CLIP、SigLIP等视觉模型。通过TinyLLaVA Factory，可减少编码错误，快速定制多模态模型，提高性能，为研究和应用提供强大工具。

TonY - 在 Apache Hadoop 上原生运行深度学习框架的框架

TonY深度学习HadoopTensorFlowPyTorchGithub开源项目

TonY框架支持在Apache Hadoop上运行深度学习任务，兼容TensorFlow、PyTorch、MXNet和Horovod。支持分布式或单节点训练，提供灵活可靠的机器学习任务执行方式，适用于Hadoop 2.6.0及以上版本，并支持GPU隔离。项目通过Gradle构建，可通过虚拟环境或Docker容器启动深度学习作业。详细配置和使用案例请参阅官方文档和示例。

pytorch-CycleGAN-and-pix2pix - PyTorch中的高效CycleGAN和pix2pix图像翻译

CycleGANpix2pixPyTorch图像翻译神经网络Github开源项目

该项目提供了PyTorch框架下的CycleGAN和pix2pix图像翻译实现，支持配对和无配对的图像翻译。最新版本引入img2img-turbo和StableDiffusion-Turbo模型，提高了训练和推理效率。项目页面包含详细的安装指南、训练和测试步骤，以及常见问题解答。适用于Linux和macOS系统，兼容最新的PyTorch版本，并提供Docker和Colab支持，便于快速上手。

RelBench：斯坦福大学最新发布，将关系型数据库转为图形表示，提高预测准确性

2024年08月03日

CycleGAN: 无配对图像到图像转换的革命性技术

2024年08月29日

MockingBird: 5秒内克隆声音并生成任意语音内容的AI技术

2024年08月29日

PyTorch-Grad-CAM:计算机视觉的高级AI可解释性工具

2024年08月29日

RobustVideoMatting: 突破性的实时高分辨率视频抠图技术

2024年08月29日

DeepPavlov: 开源对话系统和聊天机器人的深度学习框架

2024年08月30日

Thinc：一个创新的深度学习库，为您的机器学习项目带来全新体验

2024年08月30日

DeepPavlov: 开源对话系统和聊天机器人的深度学习框架

2024年08月30日

Pyannote：揭秘声音的DNA，精准分辨出各个发言者的声音

2024年08月03日

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com