Co je to Deepfake a měl bych být znepokojen?

Často máme tendenci spoléhat se na autenticitu video a audio nahrávek. Nicméně, díky rozvoji umělé inteligence je nyní možné s neuvěřitelnou přesností zrekonstruovat obličej nebo hlas kohokoli. Výsledkem je takzvaný deepfake, tedy imitace, která může být použita pro vtipy, šíření dezinformací, nebo dokonce pro pornografické účely.

Jediný pohled na deepfakes s Nicholasem Cagem, nebo na veřejnou osvětu deepfake v podání Jordana Peeleho, nám jasně ukazuje, že čelíme neobvyklé a nové technologii. I když jsou tyto ukázky poměrně neškodné, vyvolávají zásadní otázky do budoucna. Budeme ještě moci věřit tomu, co vidíme a slyšíme v nahrávkách? Budeme schopni požadovat odpovědnost od lidí za jejich činy zachycené na obrazovce? Jsme vůbec připraveni na nástup deepfakes?

Deepfakes: Nová technologie s rychlým rozvojem

Technologie deepfake je relativně mladá, existuje jen pár let, ale její rozvoj je fascinující a zároveň znepokojivý. Termín "deepfake", který vznikl na diskuzním fóru Reddit v roce 2017, označuje techniku, která s pomocí umělé inteligence napodobuje lidský vzhled nebo hlas. Je překvapivé, že téměř kdokoliv s průměrným počítačem, potřebným softwarem a trochou času, si může deepfake vytvořit sám.

Věřte tomu, nebo ne, obrázek, který vidíte nalevo, je ve skutečnosti deepfake.

Jako u každé nové technologie, i kolem deepfakes panuje určitá nejasnost. Příkladem je video "opilá Pelosi". Deepfakes jsou generovány umělou inteligencí a mají za cíl vydávat se za skutečné osoby. Video s "drunken Pelosi", které bylo označováno jako deepfake, je ve skutečnosti pouze zpomalený a upravený záběr Nancy Pelosi, který vytváří dojem nejasné řeči.

Tím se deepfakes liší například od CGI Carrie Fisherové ve Star Wars: Rogue One. Zatímco společnost Disney investovala velké finanční prostředky do studia obličeje Carrie Fisherové a jejího ručního znovuvytvoření, kdokoliv s deepfake softwarem může stejnou práci udělat zdarma během jediného dne. Díky umělé inteligenci je taková činnost neuvěřitelně jednoduchá, levná a přesvědčivá.

Proces výroby Deepfake

Stejně jako student ve škole, i umělá inteligence se musí "učit", jak plnit svůj úkol. Děje se tak metodou pokusů a omylů, pomocí takzvaného strojového učení nebo hlubokého učení. Umělá inteligence navržená například pro dohrání první úrovně hry Super Mario Bros, bude hru hrát znovu a znovu, dokud nenajde nejlepší cestu k vítězství. Osoba, která AI navrhuje, jí musí poskytnout vstupní data a nastavit základní "pravidla" pro případ, že se něco pokazí. Zbytek práce již udělá umělá inteligence sama.

Stejný princip se uplatňuje i při vytváření deepfake. Samozřejmě, rekonstrukce obličeje není totéž co dohrání videohry. Chceme-li vytvořit deepfake Nicholase Cage moderujícího show Wendy Williamsové, budeme potřebovat:

Cílové video: Pro co nejlepší výsledky fungují deepfakes nejlépe s čistým a kvalitním videem. Proto jsou tak přesvědčivé deepfakes s politiky, kteří obvykle stojí v klidu na pódiu při rovnoměrném osvětlení. Budeme tedy potřebovat video, kde Wendy Williamsová sedí a mluví, aniž by se příliš hýbala.
Dvě sady dat: Aby byly pohyby úst a hlavy co nejvěrnější, budeme potřebovat datovou sadu tváře Wendy Williamsové a datovou sadu tváře Nicholase Cage. Když se Wendy dívá doprava, potřebujeme fotografii Nicholase Cage, který se také dívá doprava. Když Wendy otevírá ústa, potřebujeme snímek Cage s otevřenými ústy.

Poté již necháme umělou inteligenci konat. Ta se bude snažit deepfake vytvářet opakovaně a při tom se bude učit ze svých chyb. Zdá se to jednoduché, že? Vytvoření deepfake videa s obličejem Cage na těle Wendy Williamsové je sice složitější, ale s touto technologií dosažitelné.