Hudební AI nezní tak dobře, jak si myslíte: Zde je důvod.

Zásadní Postřehy

  • Navzdory pokroku v technologiích, umělá inteligence (AI) v hudební tvorbě stále nedosahuje úrovně lidských umělců.
  • Hudba generovaná AI trpí nedostatkem vysokého rozlišení a hřejivosti zvuku, který je charakteristický pro lidskou produkci, a to kvůli přítomnosti šumu.
  • AI zatím nevytvořila žádný hudební hit a čelí právním sporům kvůli neoprávněnému užívání vzorků chráněných skladeb.

V posledních letech sice AI v hudební oblasti zaznamenala posun, avšak stále zaostává za díly, které vytváří lidský talent. Při bližším poslechu je zřejmé, že kvalita zvuku nedosahuje úrovně skutečných hudebníků a producentů.

Jak Funguje Generování Hudby Pomocí AI?

Před nástupem AI se hudba tvořila manuálně, hraním na nástroje jako kytara nebo syntezátor, nebo zpěvem. Vytvoření hudby vyžadovalo fyzický pohyb a dlouhé hodiny práce k sestavení jednotlivých částí do kompletní skladby.

Proces vytváření hudby pomocí AI se diametrálně liší.

AI využívá algoritmy strojového učení k analýze rozsáhlých hudebních dat, učí se o melodiích, akordech, použitých nástrojích a hudebních žánrech. Aby mohla AI napodobit hudbu, kterou vytvářejí zkušení umělci, musí se naučit rozkládat hudbu na její základní elementy.

Poté, co se AI naučí adekvátně reprodukovat hudbu, generativní nástroje jako Suno, nebo dřívější projekty jako MusicGen od Mety, umožňují interakci s AI generátorem pomocí jednoduchých instrukcí. Můžete tak vytvářet hudbu pouhým popisem toho, co chcete, pomocí několika slov nebo vět.

V porovnání s tradičním způsobem tvorby hudby, který se vyvíjel po tisíce let, je tento nový přístup poněkud zvláštní, zvlášť když jde o tvorbu něčeho, co by mělo být nabité významem a emocemi. Pokud chcete vidět, jak to funguje, můžete si vyzkoušet nějaký generátor hudby pomocí AI.

AI Hudba Má Nízkou Kvalitu, Ale Nepůsobí Vzrušivě

V počátcích byla velkou výzvou schopnost AI přesně pochopit strukturu populární písně. Podívejme se například na Meta’s MusicGen. Dnes už máme platformy jako Suno, které dokážou na technické úrovni vytvářet působivé celistvé skladby.

Nicméně, nenechte se mýlit, výsledky se nevyrovnají kvalitě hudby, na kterou jste zvyklí. Je to podobné jako s videem – rozlišení 1080p je dnes standard, ale v minulosti kvůli limitům obrazovek nebo internetového připojení nebylo dostupné pro každého.

Jedním z hlavních znaků nízké kvality zvuku je slyšitelný šum v nahrávce. Představte si starý gramofon, vinyl nebo kazetu. Pamatujete si ty praskavé a syčivé zvuky? Něco podobného můžete slyšet i v nahrávkách hudby generované AI, jako byste poslouchali hudbu z nějakého starého rádia.

I když to není tak výrazné jako dříve, tento šum v pozadí se objevuje téměř ve všech AI hudebních stopách, které jsem poslouchal na Suno.

Zde je příklad ze Suno. Skladba se jmenuje ‚Strongest Duo‘ a šum je přítomný ve všech vokálech.

Pokud bych tuto skladbu sám produkoval, rozhodně bych se nesnažil přidávat zkreslení do hlasu. Vokály zní mnohem energičtěji a silněji, když jsou jasné a čisté.

Další ukázka ze Suno, tentokrát s klasickými houslemi. Zkuste tuto skladbu pustit zkušenému houslistovi nebo zvukaři a snadno vám potvrdí, že struny nezní tak, jak by měly.

Existuje hudební žánr zvaný low-fi, který se vyznačuje specifickým hřejivým zvukem, ale v moderní produkci se tento efekt vytváří záměrně. V případě AI hudby se šum do nahrávek přidávat nemá, ale AI společnosti zatím nenašly způsob, jak se ho zbavit.

AI Stále Není Autorem Žádného Hitu

Hudba, kterou generuje AI, ještě nedosáhla vrcholu a nezískala si místo v hudebních žebříčcích, což je jasný důkaz toho, že AI hudba není tak dobrá, jak se může zdát.

Naopak, případy jako rapová skladba “BBL Drizzy”, která použila úryvek z AI vygenerované písně, vedly k obrovským právním sporům ohledně autorských práv. Největší hudební vydavatelství na světě (Universal Music Group, Sony a Warner Records), jak informuje Verge, vedou soudní spory proti společnosti Suno a dalším AI hudebním firmám, například Udio.

Nepříjemná pravda o AI generátorech hudby je, že by nemohly existovat, kdyby bez povolení nečerpaly z obrovského množství chráněného hudebního materiálu. Vytváření užitečných AI pluginů pro hudební produkci by bylo mnohem pozitivnějším a užitečnějším využitím umělé inteligence než masová produkce hudebních skladeb a obcházení lidské tvorby.

Kromě toho, v hudbě je více než jen samotný zvuk. Lidé obdivují Taylor Swift nebo Billie Eilish, protože za jejich úspěchem se skrývá silný příběh. Nechceme pouze poslouchat jejich hudbu, ale i poznávat jejich osobní příběhy, napodobovat jejich styl a nahlédnout do jejich fascinujícího života.

Dokáže AI hudba vyvolat stejnou úroveň fascinace? Rozhodně ne.

Hudba Je Příliš Komplexní Na To, Aby Ji AI Dokázala Napodobit

Vytvoření nápadu na píseň, její nahrání a vydání může trvat týdny, měsíce nebo i roky. Na rozdíl od AI hudby, která k produkci potřebuje jen několik minut a zadání krátkých pokynů, skutečná hudba vyžaduje obrovské množství dovedností, fantazie a emocí.

Bez ohledu na to, jak pokročilé jsou algoritmy AI, lidská hudební tvorba je mnohem komplexnější. I kdyby AI společnosti dokázaly vyřešit problém s kvalitou zvuku, nemůže AI produkovat hudbu, která by skutečně zněla skvěle, protože nás zajímá mnohem víc než jen základní struktura skladby. Zajímá nás člověk, který za tou hudbou stojí.