Jak vytvořit AI hudbu pomocí Meta’s MusicGen

Společnost Meta představila kód pro MusicGen, nový nástroj umělé inteligence pro tvorbu hudby. Tento systém dokáže transformovat textové zadání na hudební skladby. Online demo umožňuje vyzkoušení této technologie přímo ve webovém prohlížeči. Ačkoliv výsledky nejsou bezchybné, demonstrují, jak výrazný pokrok modely umělé inteligence v oblasti hudby zaznamenaly.

V následujícím textu se dozvíte více o MusicGen a o tom, jak s jeho pomocí generovat hudbu.

Co je MusicGen?

V červnu 2023 společnost Meta představila svůj model umělé inteligence pro generování hudby s názvem MusicGen. Není však prvním subjektem, který se zabývá komplikovaným úkolem syntetizování hudby z jednoduchého textového popisu. Například platforma OpenAI nabízí Jukebox pro tvorbu hudby a Google disponuje nástrojem MusicLM pro generování hudebních úryvků.

Meta se ale odlišuje tím, že zveřejnila kód jako open source. To umožňuje uživatelům spouštět software lokálně na svých počítačích, pokud mají grafickou kartu s alespoň 16 GB paměti. Nicméně, jak jsme zjistili, systém je funkční i s kartou o velikosti 11 GB.

Pokud nedisponujete potřebným hardwarem, nemusíte zoufat. Webová aplikace MusicGen je dostupná zdarma a můžete ji vyzkoušet ve svém webovém prohlížeči. Generování krátkého zvukového záznamu o délce 12 sekund trvá v online demu zhruba jednu minutu.

Jak zní MusicGen?

Podle společnosti Meta MusicGen dokáže generovat hudební vzorky vysoké kvality. Nicméně, interní definice „vysoké kvality“ u vývojářů odpovídá vzorkování 32 kHz. Tato hodnota leží někde mezi požadavky pro syntézu řeči (16 kHz) a standardem pro digitální hudbu (44,1 kHz).

Zvukové výstupy ve skutečnosti nedosahují minimální kvalitativní úrovně, na kterou jsme zvyklí při poslechu v rádiu nebo na streamovacích platformách. Nicméně, s ohledem na aktuální vývoj technologie a ve srovnání s jinými generátory hudby s umělou inteligencí, je kvalita zvuku poměrně dobrá a vyznačuje se nízkou úrovní šumu.

Jak přesně vygenerovaná hudba odpovídá textovým zadáním? To si můžete snadno ověřit poslechem níže uvedených ukázek. Celkově lze konstatovat, že systém zvládá dodržovat specifika populárních hudebních žánrů a vytvářet soudržnější hudební struktury než jeho předchůdci.

Jak generovat hudbu pomocí MusicGen

Používání MusicGen je jednoduché a nevyžaduje registraci. Rozhraní je intuitivní a umožňuje snadné experimentování.

Zde je návod, jak generovat hudbu pomocí MusicGen:

  • Otevřete si webovou aplikaci MusicGen.
  • Do textového pole s popiskem „Popište svou hudbu“ zadejte požadované textové zadání. Můžete zkusit jednoduchý příkaz, například „irská lidová melodie“, nebo být konkrétnější a zahrnout nástroj, tempo, žánr nebo emoce.
  • Kliknutím na tlačítko „Generovat“ spustíte proces. Po přibližně minutě nebo dvou se v pravé části modulu „Generovaná hudba“ objeví přehrávač.
  • Přejetím kurzorem myši přes modul zobrazíte ovládací prvky přehrávače. Můžete si přehrát vygenerovanou skladbu nebo si ji uložit do počítače kliknutím na ikonu stahování v pravém horním rohu modulu. Upozorňujeme, že soubor je k dispozici ke stažení pouze ve formátu .mp4.
  • Chcete-li experimentovat s úpravou vygenerované melodie pomocí existujícího nahrávky, můžete ji nahrát do modulu vedle textového pole. Alternativně můžete vybrat možnost „Mic“ a nahrát melodii pomocí mikrofonu.
  • Modifikace melodie využije jak textové zadání, tak i vámi poskytnutou melodii. To je užitečný nástroj pro ovlivnění výsledků, které získáte z MusicGen.

    Jaká jsou omezení používání MusicGen Audio?

    Kód pro MusicGen je volně šířen pod licencí MIT s několika omezeními. Pokud jde o zvuk generovaný pomocí tohoto modelu, nejsou však jednoznačné právní pokyny. Je proto vhodné prostudovat si upozornění od Mety ohledně používání MusicGen:

    „Model by neměl být zneužíván k záměrnému vytváření nebo šíření hudebních kompozic, které by vytvářely nepřátelské nebo odcizující prostředí pro lidi. To se týká zejména tvorby hudby, která by byla obecně vnímána jako znepokojující, urážlivá, nebo takové, která šíří historické a současné stereotypy.“

    Společnost Meta dále vysvětluje, že MusicGen je určen pro výzkumníky, kteří se chtějí zabývat zkoumáním možností generování hudby pomocí umělé inteligence. Není určen pro „následné použití“, čímž se pravděpodobně myslí aktivity jako nahrávání a distribuce hudby generované umělou inteligencí na streamovacích platformách.

    Etické aspekty a kontraverze odrážejí širší debatu ohledně generování umění pomocí umělé inteligence. Získání souhlasu s používáním dat pro trénink modelů AI a otázka odměňování/uznávání autorských práv umělců jsou pro společnost Meta důvody pro opatrný přístup.

    Stručně řečeno, zkoumání modelu pro zábavu pravděpodobně nepředstavuje žádné riziko. Nicméně použití vygenerované hudby pro komerční účely by mohlo být problematické. Mnoho lidí se ptá, jaká bude budoucnost populární hudby v kontextu rozvoje umělé inteligence.

    Meta přidává další model pro generování hudby. MusicGen je model s otevřeným zdrojovým kódem, který dokáže vytvářet hudbu z jednoduchých textových popisů. Pokud máte zájem o tuto technologii, můžete si ji vyzkoušet v online demu dostupném ve webovém prohlížeči.