genmusic_demo_list

音乐生成技术在线演示网站汇总

音乐生成 AI音频技术深度学习文本到音频音乐合成 Github 开源项目

项目整理了音乐生成研究的多个在线演示网站,包括文本生成音乐、音频合成、伴奏制作等领域。演示涵盖扩散模型、Transformer和GAN等前沿技术,展示了AI音乐生成的最新进展。这些演示可帮助研究人员和音乐爱好者直观了解不同模型的音乐生成能力。

访问官网

Github

Huggingface

介绍相关项目

A list of demo websites for automatic music generation research

text-to-music/audio

control-transfer-diffusion (diffusion; demerlé24ismir): https://nilsdem.github.io/control-transfer-diffusion/
AP-adapter (diffusion; tsai24arxiv): https://rebrand.ly/AP-adapter
MusiConGen (transformer; lan24arxiv): https://musicongen.github.io/musicongen_demo/
Stable audio Open (diffusion; evans24arxiv): https://stability-ai.github.io/stable-audio-open-demo/
MEDIC (diffusion; liu24arxiv): https://medic-zero.github.io/
MusicGenStyle (transformer; rouard24ismir): https://musicgenstyle.github.io/
MelodyFlow (transformer+diffusion; lelan24arxiv): https://melodyflow.github.io/
MelodyLM (transformer+diffusion; li24arxiv): https://melodylm666.github.io/
JASCO (flow; tal24arxiv): https://pages.cs.huji.ac.il/adiyoss-lab/JASCO/
MusicFlow (diffusion; prajwal24icml): N/A
Diff-A-Riff (diffusion; nistal24arxiv): https://sonycslparis.github.io/diffariff-companion/
DITTO-2 (diffusion; novack24arxiv): https://ditto-music.github.io/ditto2/
SoundCTM (diffusion; saito24arxiv): N/A
Instruct-MusicGen (transformer; zhang24arxiv): https://foul-ice-5ea.notion.site/Instruct-MusicGen-Demo-Page-Under-construction-a1e7d8d474f74df18bda9539d96687ab
Stable audio 2 (diffusion; evans24arxiv): https://stability-ai.github.io/stable-audio-2-demo/
Melodist (transformer; hong24arxiv): https://text2songmelodist.github.io/Sample/
SMITIN (transformer; koo24arxiv): https://wide-wood-512.notion.site/SMITIN-Self-Monitored-Inference-Time-INtervention-for-Generative-Music-Transformers-Demo-Page-983723e6e9ac4f008298f3c427a23241
Stable audio (diffusion; evans24arxiv): https://stability-ai.github.io/stable-audio-demo/
MusicMagus (diffusion; zhang24ijcai): https://wry-neighbor-173.notion.site/MusicMagus-Zero-Shot-Text-to-Music-Editing-via-Diffusion-Models-8f55a82f34944eb9a4028ca56c546d9d
DITTO (diffusion; novack24arxiv): https://ditto-music.github.io/web/
MAGNeT (transformer; ziv24arxiv): https://pages.cs.huji.ac.il/adiyoss-lab/MAGNeT/
Mustango (diffusion; melechovsky24naacl): https://github.com/AMAAI-Lab/mustango
Music ControlNet (diffusion; wu24taslp): https://musiccontrolnet.github.io/web/
InstrumentGen (transformer; nercessian23ml4audio): https://instrumentgen.netlify.app/
Coco-Mulla (transformer; lin23arxiv): https://kikyo-16.github.io/coco-mulla/
JEN-1 Composer (diffusion; yao23arxiv): https://www.jenmusic.ai/audio-demos
UniAudio (transformer; yang23arxiv): http://dongchaoyang.top/UniAudio_demo/
MusicLDM (diffusion; chen23arxiv): https://musicldm.github.io/
InstructME (diffusion; han23arxiv): https://musicedit.github.io/
JEN-1 (diffusion; li23arxiv): https://www.futureverse.com/research/jen/demos/jen1
MusicGen (Transformer; copet23arxiv): https://ai.honu.io/papers/musicgen/
MuseCoco (Transformer; lu23arxiv): https://ai-muzic.github.io/musecoco/ (for symbolic music)
MeLoDy (Transformer+diffusion; lam23arxiv): https://efficient-melody.github.io/
MusicLM (Transformer; agostinelli23arxiv): https://google-research.github.io/seanet/musiclm/examples/
Noise2Music (diffusion; huang23arxiv): https://noise2music.github.io/
ERNIE-Music (diffusion; zhu23arxiv): N/A
Riffusion (diffusion;): https://www.riffusion.com/

text-to-audio

PicoAudio (diffusion; xie24arxiv): https://zeyuxie29.github.io/PicoAudio.github.io/
AudioLCM (diffusion; liu24arxiv): https://audiolcm.github.io/
UniAudio 1.5 (transformer; yang24arxiv): https://github.com/yangdongchao/LLM-Codec
Tango 2 (diffusion; majumder24mm): https://tango2-web.github.io/
Baton (diffusion; liao24arxiv): https://baton2024.github.io/
T-FOLEY (diffusion; chung24icassp): https://yoonjinxd.github.io/Event-guided_FSS_Demo.github.io/
Audiobox (diffusion; vyas23arxiv): https://audiobox.metademolab.com/
Amphion (zhang23arxiv): https://github.com/open-mmlab/Amphion
VoiceLDM (diffusion; lee23arxiv): https://voiceldm.github.io/
AudioLDM 2 (diffusion; liu23arxiv): https://audioldm.github.io/audioldm2/
WavJourney (; liu23arxiv): https://audio-agi.github.io/WavJourney_demopage/
CLIPSynth (diffusion; dong23cvprw): https://salu133445.github.io/clipsynth/
CLIPSonic (diffusion; dong23waspaa): https://salu133445.github.io/clipsonic/
SoundStorm (Transformer; borsos23arxiv): https://google-research.github.io/seanet/soundstorm/examples/
AUDIT (diffusion; wang23arxiv): https://audit-demo.github.io/
VALL-E (Transformer; wang23arxiv): https://www.microsoft.com/en-us/research/project/vall-e/ (for speech)
multi-source-diffusion-models (diffusion; 23arxiv): https://gladia-research-group.github.io/multi-source-diffusion-models/
Make-An-Audio (diffusion; huang23arxiv): https://text-to-audio.github.io/ (for general sounds)
AudioLDM (diffusion; liu23arxiv): https://audioldm.github.io/ (for general sounds)
AudioGen (Transformer; kreuk23iclr): https://felixkreuk.github.io/audiogen/ (for general sounds)
AudioLM (Transformer; borsos23taslp): https://google-research.github.io/seanet/audiolm/examples/ (for general sounds)

audio-domain music generation

VampNet (transformer; garcia23ismir): https://hugo-does-things.notion.site/VampNet-Music-Generation-via-Masked-Acoustic-Token-Modeling-e37aabd0d5f1493aa42c5711d0764b33
fast JukeBox (jukebox+knowledge distilling; pezzat-morales23mdpi): https://soundcloud.com/michel-pezzat-615988723
DAG (diffusion; pascual23icassp): https://diffusionaudiosynthesis.github.io/
musika! (GAN; pasini22ismir): https://huggingface.co/spaces/marcop/musika
JukeNox (VQVAE+Transformer; dhariwal20arxiv): https://openai.com/blog/jukebox/
UNAGAN (GAN; liu20arxiv): https://github.com/ciaua/unagan
dadabots (sampleRNN; carr18mume): http://dadabots.com/music.php

given singing, generate accompaniments

FastSAG (diffusion; chen24arxiv): https://fastsag.github.io/
SingSong (VQVAE+Transofmrer; donahue23arxiv): https://storage.googleapis.com/sing-song/index.html

given drumless audio, generate drum accompaniments

JukeDrummer (VQVAE+Transofmrer; wu22ismir): https://legoodmanner.github.io/jukedrummer-demo/

audio-domain singing synthesis

Prompt-Singer (transformer; wang24naacl): https://prompt-singer.github.io/
StyleSinger (diffusion; zhang24aaai): https://stylesinger.github.io/
BiSinger (transformer; zhou23asru): https://bisinger-svs.github.io/
HiddenSinger (diffusion; hwang23arxiv): https://jisang93.github.io/hiddensinger-demo/
Make-A-Voice (transformer; huang23arxiv): https://make-a-voice.github.io/
RMSSinger (diffusion; he23aclf): https://rmssinger.github.io/
NaturalSpeech 2 (diffusion; shen23arxiv): https://speechresearch.github.io/naturalspeech2/
NANSY++ (Transformer; choi23iclr): https://bald-lifeboat-9af.notion.site/Demo-Page-For-NANSY-67d92406f62b4630906282117c7f0c39
UniSyn (; lei23aaai): https://leiyi420.github.io/UniSyn/
VISinger 2 (zhang22arxiv): https://zhangyongmao.github.io/VISinger2/
xiaoicesing 2 (Transformer+GAN; wang22arxiv): https://wavelandspeech.github.io/xiaoice2/
WeSinger 2 (Transformer+GAN; zhang22arxiv): https://zzw922cn.github.io/wesinger2/
U-Singer (Transformer; kim22arxiv): https://u-singer.github.io/
Singing-Tacotron (Transformer; wang22arxiv): https://hairuo55.github.io/SingingTacotron/
KaraSinger (GRU/Transformer; liao22icassp): https://jerrygood0703.github.io/KaraSinger/
VISinger (flow; zhang2): https://zhangyongmao.github.io/VISinger/
MLP singer (mixer blocks; tae21arxiv): https://github.com/neosapience/mlp-singer
LiteSing (wavenet; zhuang21icassp): https://auzxb.github.io/LiteSing/
DiffSinger (diffusion; liu22aaai)[no duration modeling]: https://diffsinger.github.io/
HiFiSinger (Transformer; chen20arxiv): https://speechresearch.github.io/hifisinger/
DeepSinger (Transformer; ren20kdd):

相关项目

项目侧边栏1

项目侧边栏2

推荐项目

Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手，通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能，支持100+编程语言，与主流编辑器无缝集成，显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台，能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐，Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案，通过智能技术简化视频制作流程。无论是企业宣传还是个人分享，有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持，能够阅读和理解用户上传的文件内容，解析网页信息，并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题，Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术，为商家提供一键生成商品图和营销文案的服务，显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台，让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型，免费访问各种图像生成与AI训练工具，从Stable Diffusion等基础模型开始，轻松实现创新图像生成。体验前沿的AI技术，推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器，它将改变您观看视频的方式！SubCat结合了先进的人工智能技术，为您提供即时视频字幕翻译，无论是本地视频还是网络流媒体，让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台，利用前沿AI技术，为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图，再到文案生成，美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具，简化了选题、文献检索至论文撰写的整个过程。通过简单设定，平台可快速生成高质量论文大纲和全文，配合图表、参考文献等一应俱全，同时提供开题报告和答辩PPT等增值服务，保障数据安全，有效提升写作效率和论文质量。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号