#数据集准备

megatts2 - Megatts2 的非官方实现，多语种语音合成训练

Megatts2文本到语音Pytorch-lightning数据集准备VQ-GANGithub开源项目

megatts2为Megatts2的非官方实现，支持中英文混合的深度学习语音合成训练。该项目涵盖数据处理、模型训练及语音推理，使用Pytorch-lightning框架优化训练流程，目标训练1000小时语音数据。

NeMo-Curator - 提供GPU加速的大型语言模型数据集优化与管理解决方案

NeMo CuratorGPU加速大语言模型数据集准备Python库Github开源项目

NeMo Curator 是一款专为大型语言模型（LLM）设计的开源Python库，通过结合Dask和RAPIDS等技术，实现GPU加速的数据集准备与管理。其功能包括数据下载、语言识别、文本清理、质量过滤、文档去重和个人信息保护等模块，为多种LLM任务提供快速、灵活和可扩展的解决方案，显著提升数据处理效率与模型质量。

MT-UNet - 融合Transformer和UNet的医学图像分割新模型

MT-UNet医学图像分割数据集准备模型训练权重文件Github开源项目

MT-UNet是一种结合Transformer和UNet优势的医学图像分割模型。该模型在Synapse和ACDC数据集上分别达到79.20%和91.61%的DSC评分。MT-UNet通过混合transformer结构实现多尺度特征融合，为医学图像分析提供新思路。项目开源代码和预训练权重，便于研究者复现结果和深入研究。

相关文章

Article Cover

Mega-TTS 2: 突破性的零样本文本转语音技术

Article Cover

NeMo-Curator: NVIDIA打造的大规模数据预处理与策划工具包

Article Cover

MT-UNet: 混合式Transformer UNet用于医学图像分割

Article Cover

MegaTTS 2 学习资料汇总 - 零样本语音合成的革命性进展

Article Cover

NeMo-Curator学习资料汇总 - GPU加速的大语言模型数据处理工具包

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号