热门
导航
快讯
推荐文章
热门
导航
快讯
推荐文章
#数据集准备
megatts2
megatts2为Megatts2的非官方实现,支持中英文混合的深度学习语音合成训练。该项目涵盖数据处理、模型训练及语音推理,使用Pytorch-lightning框架优化训练流程,目标训练1000小时语音数据。
NeMo-Curator
NeMo Curator 是一款专为大型语言模型(LLM)设计的开源Python库,通过结合Dask和RAPIDS等技术,实现GPU加速的数据集准备与管理。其功能包括数据下载、语言识别、文本清理、质量过滤、文档去重和个人信息保护等模块,为多种LLM任务提供快速、灵活和可扩展的解决方案,显著提升数据处理效率与模型质量。
MT-UNet
MT-UNet是一种结合Transformer和UNet优势的医学图像分割模型。该模型在Synapse和ACDC数据集上分别达到79.20%和91.61%的DSC评分。MT-UNet通过混合transformer结构实现多尺度特征融合,为医学图像分析提供新思路。项目开源代码和预训练权重,便于研究者复现结果和深入研究。
相关文章
Mega-TTS 2: 突破性的零样本文本转语音技术
2 个月前
NeMo-Curator: NVIDIA打造的大规模数据预处理与策划工具包
2 个月前
MT-UNet: 混合式Transformer UNet用于医学图像分割
2 个月前
MegaTTS 2 学习资料汇总 - 零样本语音合成的革命性进展
1 个月前
NeMo-Curator学习资料汇总 - GPU加速的大语言模型数据处理工具包
1 个月前
使用协议
隐私政策
广告服务
投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI
·
鲁ICP备2024100362号-6
·
鲁公网安备37021002001498号