相关项目
Paint-by-Example
该项目通过自监督训练,重新组合源图像及示范图像,避免了直接复制粘贴带来的伪影。采用任意形状掩码和无分类器指导,提升编辑过程的可控性,并通过一次性前向扩散模型实现高保真图像编辑。项目展示了对自然图像的高效可控编辑效果,提供了预训练模型、测试基准和量化结果,适用于图像编辑和生成的研究与应用。
mms-300m
MMS-300m是Facebook AI开发的大规模多语言预训练语音模型,具有3亿参数。该模型在超过1400种语言的约50万小时语音数据上进行预训练,采用Wav2Vec2的自监督训练方法。MMS-300m为自动语音识别、翻译和分类等下游任务提供了基础,可通过微调适应不同应用场景,推动了跨语言语音技术的发展。