Logo

#预训练模型

awesome-recommend-system-pretraining-papers学习资料汇总 - 推荐系统预训练模型论文列表

18 天前
Cover of awesome-recommend-system-pretraining-papers学习资料汇总 - 推荐系统预训练模型论文列表

FCH-TTS学习资料汇总 - 快速高质量并行语音合成模型

18 天前
Cover of FCH-TTS学习资料汇总 - 快速高质量并行语音合成模型

WaveGrad入门学习资料 - 基于梯度估计的高质量神经网络声码器

18 天前
Cover of WaveGrad入门学习资料 - 基于梯度估计的高质量神经网络声码器

MelGAN入门学习资料 - 基于GAN的声码器模型

18 天前
Cover of MelGAN入门学习资料 - 基于GAN的声码器模型

VoiceFixer 入门学习资料 - 通用语音修复工具

18 天前
Cover of VoiceFixer 入门学习资料 - 通用语音修复工具

MindNLP入门学习资料汇总 - 基于MindSpore的易用高性能NLP框架

18 天前
Cover of MindNLP入门学习资料汇总 - 基于MindSpore的易用高性能NLP框架

StyleSpeech学习资料汇总 - 多说话人自适应文本转语音生成系统

18 天前
Cover of StyleSpeech学习资料汇总 - 多说话人自适应文本转语音生成系统

Matcha-TTS学习资料汇总 - 快速非自回归神经网络TTS架构

18 天前
Cover of Matcha-TTS学习资料汇总 - 快速非自回归神经网络TTS架构

DiffWave学习资源汇总 - 快速高质量的神经声码器与波形合成器

18 天前
Cover of DiffWave学习资源汇总 - 快速高质量的神经声码器与波形合成器

deepvoice3_pytorch学习资料汇总 - 基于PyTorch的卷积神经网络文本转语音合成模型实现

18 天前
Cover of deepvoice3_pytorch学习资料汇总 - 基于PyTorch的卷积神经网络文本转语音合成模型实现

相关项目

Project Cover
CycleGAN
CycleGAN 利用循环一致性对抗网络,实现了无需成对输入输出数据的图像到图像的转换。这一技术广泛应用于风格转换、季节变换及更多复杂场景,支持PyTorch实现,并提供丰富的预训练模型。无论是艺术画作到现实照片的转换,还是不同季节间的景观变化,CycleGAN 都能提供令人印象深刻的视觉效果。
Project Cover
IMS-Toucan
IMS Toucan是由斯图加特大学自然语言处理研究所开发的一套工具集,专注于教学、培训和使用最先进的语音合成模型。该项目基于Python和PyTorch开发,旨在为初学者提供简单、强大的学习工具。此外,IMS Toucan支持多语言和多讲者音频生成,可用于文学研究、语音克隆等多种场景。
Project Cover
3D-ResNets-PyTorch
该项目提供基于PyTorch的3D ResNet代码,适用于动作识别,支持Kinetics和Moments in Time等数据集。项目包含训练、微调和测试脚本,并提供预训练模型,支持最新的PyTorch版本和分布式训练。用户可使用详细脚本进行数据准备和模型评估,适合研究与应用。
Project Cover
spark-nlp
Spark NLP 是一个基于 Apache Spark 的开源库,提供高效且准确的自然语言处理注释,支持机器学习管道的分布式扩展。该库包含超过 36000 个预训练管道和模型,支持 200 多种语言,涵盖分词、词性标注、嵌入、命名实体识别、文本分类、情感分析、机器翻译等任务。兼容 BERT、RoBERTa 等主流变压器模型,支持 Python、R、Java、Scala 和 Kotlin。
Project Cover
mindnlp
MindNLP是一个基于MindSpore的开源自然语言处理库,支持语言模型、机器翻译、问答系统、情感分析、序列标注和摘要生成等多种任务。该项目集成了BERT、Roberta、GPT2和T5等多种预训练模型,通过类似Huggingface的API简化了使用流程。用户可通过pypi或源代码安装该库,并支持包括Llama、GLM和RWKV在内的大型语言模型的预训练、微调和推理,非常适合研究者和开发人员构建和训练模型。
Project Cover
ru-dalle
ru-dalle是一个开源的图像生成工具,能够将文本描述转换成详细的图像。采用预训练模型,支持多种风格,包括Malevich、Emojich等,适用于多种应用场景,如艺术设计、内容创作等。该项目提供易于使用的API,允许用户快速生成高分辨率图像,并支持图片微调和超分辨率处理,使图像更加精细和真实。
Project Cover
gpt-neo
GPT-Neo项目在mesh-tensorflow库的支持下,开发出了类似于GPT-3的高级模型与数据并行技术。项目支持在TPU及GPU上进行高效训练与推理,并集成了局部注意力、线性注意力和多专家系统等先进技术,能有效处理大规模参数模型。GPT-Neo还提供了多项模型评估功能,专注于语言和科学推理,拓宽了其在自然语言处理应用中的领域。
Project Cover
deepvoice3_pytorch
DeepVoice3_pytorch是基于PyTorch的文本到语音深度学习平台,支持多语种和多数据集,包括英语、日语和韩语,适合多个说话者或单个说话者。项目提供预训练模型、音频样本、在线演示及详尽的训练指南,旨在简化用户的使用过程,并能灵活定制个性化的语音合成应用。
Project Cover
TTS
TTS库基于最新研究成果,提供高效的文本到语音生成技术,实现了训练便捷、速度快、质量高的最佳平衡。该库包括预训练模型和数据集质量评估工具,已被广泛应用于20多种语言的产品和研究项目。支持多说话人TTS、快速模型训练、多GPU训练,并兼容PyTorch、TensorFlow和TFLite等多种平台。
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号