#pytorch

einops - 灵活高效的张量操作,兼容多个框架
einopstensor操作深度学习numpypytorchGithub开源项目
Einops 提供简洁高效的张量操作,适用于 numpy、pytorch、tensorflow、jax 等多个框架。通过易于理解的 Einstein 风格操作符,提高代码的可读性和可靠性。主要功能包括张量的重新排列、简化、复制、打包与解包。Einops 适用于深度学习和复杂数据处理任务,是开发者优化代码的理想工具。
Deep-reinforcement-learning-with-pytorch - 深度强化学习PyTorch实现与代码示例
Deep Reinforcement LearningpytorchDQNTD3GymGithub开源项目
本项目提供经典和前沿的深度强化学习算法PyTorch实现,包括DQN、DDPG、PPO等。项目持续更新并维护,适用于Anaconda虚拟环境管理。详细的安装步骤和测试方法确保用户能顺利运行代码,文档中还提供了相关论文和代码链接,便于深入学习研究。
Tacotron-pytorch - 端到端文本至语音合成技术的高效实现
Tacotron-pytorch文本转语音pytorchLJSpeech训练Github开源项目
Tacotron-pytorch是基于Pytorch框架开发的端到端文本至语音合成模型。该项目支持通过清晰的指南轻松部署和训练,使用LJSpeech数据集,并附带完整的预处理代码和网络训练文件。用户可以根据需要自定义超参数,非常适合进行科研和技术开发。项目提供了将成熟度逐渐提升的语音示例,欢迎进行下载和反馈。
zero_nlp - 中文NLP训练与应用框架
zero_nlp模型训练中文NLP大模型pytorchGithub开源项目
zero_nlp是基于pytorch和transformers的中文NLP框架,支持从数据处理到模型部署的整个工作流程。它特别适用于处理大数据集、训练和部署多卡串联大模型,支持包括gpt2、clip在内的丰富模型类型,适用于文本分类、生成及多模态处理等多种任务。
makeMoE - 从零构建的稀疏混合专家语言模型的makemore项目
makeMoEDatabrickspytorch稀疏专家混合语言模型Github开源项目
makeMoE是一个基于Andrej Karpathy的makemore项目, 从零构建的稀疏混合专家语言模型。它借鉴了makemore的部分组件,例如数据预处理和生成莎士比亚风格文本。在架构上,makeMoE引入了稀疏专家混合、Top-k门控和噪声Top-k门控等改进。项目在Databricks上使用单一A100 GPU开发,支持大规模GPU集群扩展,并通过MLFlow进行指标跟踪。项目强调代码的可读性和修改性,适合深入学习和改进。
BitNet-Transformers - 缩放1-bit大语言模型,提高GPU内存利用率
BitNet-TransformersHuggingfaceLLama(2)pytorchWikitext-103Github开源项目
BitNet-Transformers项目使用Llama (2)架构,并通过1-bit权重缩放技术,实现对大型语言模型的高效训练和推理。该项目基于Huggingface Transformers,显著降低了GPU内存占用,从原始LLAMA的250MB减少到BitNet模型的最低要求。用户可通过wandb实时追踪训练进度,并在Wikitext-103上进行训练。项目提供了详细的开发环境配置和训练步骤指南,为研究者和开发者提供有力支持。
pytorch-sentiment-neuron - Pytorch版本的情感神经元实现情感分析与文本生成
pytorchcudapython 3.5mlstm_ns.ptsentimentGithub开源项目
项目pytorch-sentiment-neuron基于Pytorch,实现了利用情感神经元进行情感分析和文本生成。用户可以通过预设模型文件和简单的命令行操作生成文本并进行情感分析,lm.py文件还允许在新数据上重新训练模型。该项目依赖Pytorch、Cuda和Python 3.5,适用于自然语言处理和情感分析领域的研究人员和开发者。
flops-counter.pytorch - 神经网络运算量与参数计算工具
ptflops神经网络pytorch计算复杂度参数计数Github开源项目
该工具用于计算神经网络中的理论乘法加法运算量,以及参数数量和逐层计算成本。工具支持两个后端:pytorch和aten。aten后端覆盖更多模型架构,而pytorch后端更适合CNN分析。通过设置verbose参数,可以获取未纳入复杂度计算的操作信息,通过ignore_modules选项则可以忽略特定模块,适用于研究用途。适用于Pytorch版本2.0及以上。
carefree-creator - 开源AI创作工具,集成多种生成模型
carefree-creatorAI绘图PythonpytorchGPUGithub开源项目
`carefree-creator`是一个开源的AI创作工具,集成了多种生成模型,基于`carefree-learn`构建,支持Python>=3.8和pytorch>=1.12.0。项目提供多种节省GPU RAM的加载方式,并支持CLI和Docker安装。详细的硬件要求与使用指南请见Wiki页面。
sc_depth_pl - 通过自我监督学习实现视频中的单目深度估计
SC-Depthpytorchmonocular depthself-supervised learningARNGithub开源项目
SC-Depth项目提供了SC-DepthV1, V2和V3版本的PyTorch Lightning实现,专注于从视频中进行自我监督的单目深度估计。SC-DepthV1引入了几何一致性损失和自发现蒙板,提高了深度预测的准确性。SC-DepthV2通过引入自动矫正网络(ARN)解决了手持相机视频中大相对旋转的问题。SC-DepthV3利用外部预训练的深度估计网络,在动态场景中显著提升了单目深度估计的准确性。该项目提供了详细的安装指南、数据集组织和训练流程,支持多种数据集和自定义数据的训练。了解更多关于SC-Depth的详细信息以及其在多个挑战性数据集上的评估结果。
Ensemble-Pytorch - PyTorch集成学习框架助力模型优化
Ensemble-PyTorch深度学习模型集成pytorch机器学习Github开源项目
Ensemble-Pytorch是一个为PyTorch设计的集成学习框架,旨在提高深度学习模型的性能和鲁棒性。该框架支持多种集成策略,如Fusion、Voting、Bagging和Gradient Boosting,适用于分类和回归任务。作为PyTorch生态系统的一部分,Ensemble-Pytorch提供简洁的API和详细文档,便于研究人员和开发者实现和优化集成模型。
pytorch-inpainting-with-partial-conv - PyTorch实现基于部分卷积的不规则孔洞图像修复
pytorch图像修复部分卷积深度学习计算机视觉Github开源项目
这是Liu等人论文《Image Inpainting for Irregular Holes Using Partial Convolutions》的非官方PyTorch实现。项目提供了基于部分卷积的不规则孔洞图像修复方法,包含数据预处理、模型训练、微调和测试的完整流程。尽管尚未完全复现原论文结果,但已展示了部分测试集的修复效果。此实现为研究人员和开发者提供了探索这一图像修复技术的基础。
xflux_text_encoders - Google T5模型文本编码器权重用于大规模NLP任务
模型Github文本编码器pytorchT5模型transformers开源项目Huggingface自然语言处理
xflux_text_encoders项目提供来自Google T5-v1_1-xxl模型的文本编码器权重。这些权重适用于大规模自然语言处理任务,支持英语。项目基于Apache 2.0许可,使用PyTorch和Transformers库实现。开发者可将其集成到现有NLP管道中,用于文本到文本的生成任务。
Llama-3-KoEn-8B-Instruct-preview - 基于Chat Vector技术的Llama-3-8B语言模型在多语言生成中的应用
语言模型pytorchLlama-3TRC计划生成模型Github模型开源项目Huggingface
Llama-3-KoEn-8B-Instruct-preview项目是基于TPUv4-256的继续预训练语言模型,结合Chat Vector技术。尽管尚未对韩语指令集进行微调,但为新型聊天和指令模型的开发提供了重要基础。项目中包括详细的示例代码,展示了该模型在文本封装和生成方面的能力,适合需要深入语义生成和自然语言处理的开发者。
toutiao - 中文新闻分类模型,便捷文本分析工具
数据集Github模型文本分类开源项目pytorchHuggingface中文新闻分类今日头条
此中文新闻分类模型基于pytorch和今日头条数据集,支持文本分类,适用文化、娱乐、体育等多个领域。通过transformers库中text-classification方法,可实现高效中文文本处理,提升分类精度。
parakeet-ctc-1.1b - 高效自动语音识别模型,快速完成语音转录
Github模型FastConformer开源项目词错误率NeMopytorch自动语音识别Huggingface
parakeet-ctc-1.1b是由NVIDIA NeMo和Suno.ai团队开发的ASR模型,采用FastConformer架构,参数量约11亿。该模型适用于16kHz单声道音频,可以转录语音为小写英文。经过多数据集测试,字错率表现优异,如LibriSpeech clean数据集WER为1.83。利用NVIDIA NeMo工具包,该模型可用于推理或微调,适合多领域音频转录。