Jak vytvořit AI hudbu pomocí Meta’s MusicGen

Meta vydala kód pro MusicGen, další hudební generátor AI, který dokáže přeměnit textové popisy na hudební melodie. Demo lze nalézt online a k vyzkoušení potřebujete pouze prohlížeč. Výsledky nejsou špatné, ale více než to ukazuje, jak daleko pokročily hudební modely AI.

Zde je to, co potřebujete vědět o MusicGen a jak generovat hudbu.

Co je MusicGen?

V červnu 2023 vydala společnost Meta svůj model hudební generace AI s názvem MusicGen. Není to první společnost, která se vypořádala se složitým problémem syntézy syrové hudby z jednoduchého textového popisu; zatím můžete vytvářet hudbu pomocí OpenAI Jukebox nebo generovat úryvky skladeb pomocí MusicLM.

Je to však první společnost, která kód vytvořila jako open source, což vám umožňuje spouštět software lokálně na vašem počítači, pokud máte GPU s minimálně 16 GB paměti – i když jsme byli schopni zajistit, aby fungoval s pouhými 11 GB.

Pokud nemáte hardware, nezoufejte, protože webovou aplikaci MusicGen můžete zdarma vyzkoušet pomocí prohlížeče. Z online dema můžete očekávat, že vygenerování zvukového úryvku o délce přibližně 12 sekund bude trvat něco málo přes minutu.

Jak zní MusicGen?

Podle Meta může MusicGen produkovat vysoce kvalitní hudební vzorky, i když jsme zjistili, že zapojení výzkumníci definovali vysokou kvalitu jako 32 kHz. To je někde mezi požadavky na syntézu řeči (16 kHz) a standardem pro digitální hudbu (44,1 kHz).

Ve skutečnosti zvuk nesplňuje minimální standardy kvality, na které jste zvyklí slyšet v rádiu nebo na streamovacích platformách. Ve srovnání s jinými hudebními generátory AI as ohledem na to, kde se technologie nachází v době psaní, je však kvalita zvuku poměrně dobrá s nízkou úrovní šumu v souboru.

Jak blízko je hudba v souladu s výzvami? Můžete to rychle pochopit poslechem příkladů, které jsme vytvořili níže. V širokém měřítku se mu daří držet se populárních hudebních žánrů při zachování koherentnější hudební struktury ve srovnání s jeho předchůdci.

Jak generovat hudbu pomocí MusicGen

MusicGen se snadno používá a nevyžaduje registraci. Rozhraní je také přímočaré, takže je snadné jej vyzkoušet pro zábavu.

Zde je návod, jak generovat hudbu pomocí MusicGen:

  • Otevři Webová aplikace MusicGen.
  • Do textového pole s názvem Popište svou hudbu zadejte výzvu. Můžete zkusit něco tak jednoduchého, jako je „irská lidová melodie“, nebo to udělat podrobnějšími tím, že zahrnete nástroj, tempo, žánr nebo emoce.
  • Stisknutím tlačítka Generovat spustíte proces. Po minutě nebo dvou se v modulu Generovaná hudba vpravo objeví audio přehrávač.
  • Umístěním ukazatele myši na modul zobrazíte ovládací prvky přehrávače a poslechnete si soubor, nebo stisknutím ikony stahování v pravém horním rohu uložte soubor do počítače. Upozorňujeme, že je k dispozici ke stažení pouze jako soubor .mp4.
  • Pokud si chcete vyzkoušet úpravu výsledků pomocí existující melodie, můžete nahrát nahrávku do modulu vedle textového pole. Případně můžete vybrat Mic a nahrát melodii pomocí mikrofonu.
  • Úprava melodie použije jako referenci textový popis i melodii, kterou zadáte. Toto je užitečný nástroj pro formování výsledků, které získáte z MusicGen.

    Jaká jsou omezení používání MusicGen Audio?

    Kód pro MusicGen je volně šířen pod licencí MIT s několika omezeními. Pokud jde o zvuk, který generujete pomocí modelu, není jasné, zda existují nějaké právní pokyny. Místo toho možná budete chtít věnovat pozornost Varování Meta o používání MusicGen:

    „Model by neměl být používán k záměrnému vytváření nebo šíření hudebních skladeb, které vytvářejí nepřátelské nebo odcizující prostředí pro lidi. To zahrnuje vytváření hudby, kterou by lidé předvídatelně považovali za znepokojující, znepokojující nebo urážlivou; nebo obsah, který šíří historické nebo současné stereotypy.“

    Meta dále vysvětluje, že MusicGen je určen pro výzkumníky, kteří chtějí prozkoumat generování hudby AI, a nikoli pro „následné použití“, což předpokládáme, že znamená činnosti, jako je nahrávání a distribuce AI hudby na streamovacích platformách.

    Etické klady a zápory odrážejí generaci umění AI. Získání souhlasu s používáním dat k trénování modelů umělé inteligence plus problém kompenzace/udělování kreditů umělcům, je-li to vhodné, jsou pro Meta všechny důvody, proč hrát na jistotu.

    Stručně řečeno, zkoumání modelu pro zábavu pravděpodobně nepoškodí, ale může to být ožehavější problém, pokud jde o použití zvuku pro komerční hudbu. Mnoho lidí si klade otázku, jak vypadá budoucnost populární hudby s umělou inteligencí.

    Meta přidává další model generování hudby k tomu, co je venku, a vydala MusicGen, model umělé inteligence s otevřeným zdrojovým kódem schopný generovat nezpracovanou hudbu z jednoduchého textového popisu. Pokud jste zvědaví na vyzkoušení technologie, můžete si vyzkoušet ukázku pouze pomocí webového prohlížeče.