Jak funguje rozpoznávání obličeje?

Většině lidí vyhovuje rozpoznávání obličeje pro jeho použití ve filtrech Instagramu a Face ID. Ale tato relativně nová technologie může působit trochu strašidelně. Váš obličej je jako otisk prstu a technologie rozpoznávání obličeje je složitá.

Stejně jako každá nová technologie má rozpoznávání obličeje své nevýhody. Tyto nevýhody jsou stále zjevnější, když armáda, policie, inzerenti, a deepfake tvůrci, najdou nevyzpytatelné nové způsoby, jak využít výhody softwaru pro rozpoznávání obličejů.

Nyní, více než kdy jindy, je nezbytné, aby lidé pochopili, jak rozpoznávání obličejů funguje. Je také důležité znát omezení rozpoznávání obličeje a jak se bude vyvíjet v budoucnu.

Table of Contents

Rozpoznávání obličeje je překvapivě jednoduché

Než se pustíte do mnoha různých médií pro rozpoznávání obličeje, je důležité pochopit, jak proces rozpoznávání obličeje funguje. Zde jsou tři aplikace pro software pro rozpoznávání obličejů a jednoduché vysvětlení toho, jak rozpoznávají nebo identifikují obličeje:

Základní rozpoznávání obličeje: U filtrů Animoji a Instagram fotoaparát vašeho telefonu „hledá“ definující rysy obličeje, konkrétně pár očí, nos a ústa. Poté pomocí algoritmů zamkne obličej a určí, kterým směrem se dívá, zda má otevřená ústa atd. Za zmínku stojí, že se nejedná o identifikaci obličeje, ale pouze o software, který hledá obličeje.
Face ID a podobné programy: Po nastavení Face ID (nebo podobných programů) na vašem telefonu pořídí fotografii vašeho obličeje a změří vzdálenost mezi rysy vašeho obličeje. Potom pokaždé, když odemknete svůj telefon, „prohlédne“ fotoaparát, aby změřil a potvrdil vaši identitu.
Identifikace cizince: Když chce organizace identifikovat obličej pro bezpečnostní, reklamní nebo policejní účely, používá algoritmy k porovnání tohoto obličeje s rozsáhlou databází tváří. Tento proces je téměř totožný s Face ID společnosti Apple, ale ve větším měřítku. Teoreticky by se dala použít jakákoliv databáze (občanské průkazy, facebookové profily), ideální je však databáze přehledných předem identifikovaných fotografií.

Dobře, pojďme do toho hloupého. Protože „základní rozpoznávání obličeje“ používané pro filtry Instagramu je tak jednoduchý a neškodný proces, zaměříme se výhradně na identifikaci obličeje a mnoho různých technologií, které lze k identifikaci obličeje použít.

Většina rozpoznávání obličeje závisí na 2D obrazech

Jak byste očekávali, většina softwaru pro rozpoznávání obličeje se plně spoléhá na 2D obrázky. Ale to se nedělá, protože 2D zobrazování obličeje je super přesné, dělá se to z důvodu pohodlí. Naprostá většina fotoaparátů fotí bez jakékoli hloubky a veřejné fotografie, které lze použít pro databáze rozpoznávání obličejů (například profilové obrázky na Facebooku), jsou všechny ve 2D.

Proč není 2D zobrazení obličeje super přesné? No, protože plochý obraz vašeho obličeje postrádá identifikační rysy, jako je hloubka. S plochým obrazem může počítač kromě jiných proměnných změřit vzdálenost zornic a šířku úst. Ale nedokáže určit délku vašeho nosu nebo výrazné čelo.

2D zobrazování obličeje navíc spoléhá na spektrum viditelného světla. To znamená, že 2D zobrazení obličeje nefunguje ve tmě a může být nespolehlivé v rušných nebo zastíněných světelných podmínkách.

Je jasné, že řešením některých z těchto nedostatků je použití 3D zobrazování obličeje. Ale jak je to možné? Potřebujete speciální vybavení, abyste viděli obličej ve 3D?

IR kamery dodají vaší identitě hloubku

Zatímco některé aplikace pro rozpoznávání obličeje se spoléhají pouze na 2D obrázky, není neobvyklé, že se rozpoznávání obličeje spoléhá také na 3D zobrazení. Ve skutečnosti vaše zkušenost s rozpoznáváním obličeje pravděpodobně zahrnuje špetku 3D.

Toho je dosaženo pomocí techniky zvané lidar, která je podobná sonaru. Zařízení pro skenování obličeje, jako je váš iPhone, v podstatě vystřelí do vašeho obličeje neškodnou IR matrici. Tato matrice (stěna laserů) se pak odráží od vašeho obličeje a je zachycena IR kamerou (nebo ToF kamerou) na vašem telefonu.

Kde se děje 3D kouzlo? IR kamera vašeho telefonu měří, jak dlouho trvá, než se každý kousek IR světla odrazí od vašeho obličeje a vrátí se do telefonu. Světlo, které se odráží od vašeho nosu, bude mít přirozeně kratší cestu než světlo, které se odráží od vašich uší, a infračervená kamera tyto informace využívá k vytvoření jedinečné hloubkové mapy vašeho obličeje. Při použití spolu se základním 2D zobrazováním může 3D zobrazování výrazně zvýšit přesnost softwaru pro rozpoznávání obličeje.

Lidar imaging je zvláštní koncept, který může být obtížné zabalit do hlavy. Pokud to pomůže, zkuste si představit, že infračervená síť z vašeho telefonu (nebo jakéhokoli zařízení pro rozpoznávání obličeje) je a nástěnná hračka. Jako hračka na nástěnku zanechává váš obličej prohlubeň v infračervené síťce, kde je váš nos znatelně hlubší než například oči.

Termální zobrazování umožňuje rozpoznávání obličeje pracovat v noci

Jedním z nedostatků 2D rozpoznávání obličeje je to, že se spoléhá na viditelné spektrum světla. Laicky řečeno, základní rozpoznávání obličeje ve tmě nefunguje. Ale to se dá obejít pomocí termovizní kamery (jo, jako v Tom Clancy).

„Počkejte chvilku,“ můžete říci, „nespoléhá se termovizní zobrazení na IR světlo?“ Ano. Ale termovizní kamery nevysílají záblesky IR světla; jednoduše detekují IR světlo, které vyzařuje z objektů. Teplé předměty vyzařují tunu IR světla, zatímco studené předměty vyzařují zanedbatelné množství IR světla. Drahé termovizní kamery dokážou detekovat i jemné teplotní rozdíly na povrchu, takže tato technologie je ideální pro rozpoznávání obličeje.

Snímek spektra viditelného světla, termosnímek a složený termosnímek.

Existují a hrstka různých způsobů k identifikaci obličeje pomocí termovize. Všechny tyto techniky jsou neuvěřitelně komplikované, ale sdílejí některé základní podobnosti, takže se pokusíme věci zjednodušit pomocí seznamu:

Je potřeba více fotografií: Termokamera pořídí více snímků obličeje subjektu. Každá fotografie se zaměřuje na jiné spektrum IR světla (dlouhé, krátké a střední vlny). Spektrum dlouhých vln obvykle poskytuje nejvíce detailů obličeje.
Mapy krevních cév jsou užitečné: Tyto IR snímky lze také použít k extrakci tvorby krevních cév v obličeji osoby. Je to strašidelné, ale mapy krevních cév lze použít jako jedinečné otisky obličeje. Mohou být také použity k nalezení vzdálenosti mezi obličejovými orgány (pokud typické tepelné zobrazování poskytuje nekvalitní snímky) nebo k identifikaci modřin a jizev.
Předmět lze identifikovat: Složený snímek (nebo datová sada) je vytvořen pomocí více IR snímků. Tento složený obraz lze poté porovnat s databází obličeje pro identifikaci subjektu.

Samozřejmě, že termální rozpoznávání obličeje obvykle používá armáda, není to něco, co najdete v Khols, a není to něco, co přijde s vaším dalším mobilním telefonem. Navíc termální zobrazování nefunguje dobře ve dne (nebo v obecně dobře osvětlených prostředích), takže nemá mnoho potenciálních aplikací mimo armádu.

Omezení rozpoznávání obličeje

Strávili jsme spoustu času povídáním o nedostatcích rozpoznávání obličejů. Jak jsme viděli z infračerveného a tepelného zobrazování, je možné některá z těchto omezení překonat. Stále však existuje několik problémů, které dosud nebyly vyřešeny:

Překážka: Jak byste očekávali, sluneční brýle a další příslušenství mohou spustit software pro rozpoznávání obličeje.
Pózy: Rozpoznávání obličeje funguje nejlépe s neutrálním obrázkem směřujícím dopředu. Naklonění nebo otočení hlavy může ztížit rozpoznávání obličeje, a to i v případě softwaru pro rozpoznávání založeném na infračerveném záření. Navíc úsměv, nafouklé tváře nebo jakákoli jiná póza může změnit způsob, jakým počítač měří vaši tvář.
Světlo: Všechny formy rozpoznávání obličeje spoléhají na světlo, ať už jde o viditelné spektrum nebo IR světlo. V důsledku toho mohou podivné světelné podmínky snížit přesnost identifikace obličeje. To se může změnit, protože vědci se v současné době vyvíjejí technologie rozpoznávání obličeje založená na sonaru.
Databáze: Bez dobré databáze nemůže rozpoznávání obličeje fungovat. Stejně tak je nemožné identifikovat obličej, který nebyl v minulosti správně identifikován.
Zpracování dat: V závislosti na velikosti a formátu databáze může počítačům chvíli trvat, než správně identifikují tváře. V některých situacích, jako je policejní práce, omezení ve zpracování dat omezují použití identifikace obličeje pro každodenní aplikace (což je pravděpodobně dobrá věc).

V současnosti je nejlepším způsobem, jak tato omezení obejít, použití jiných forem identifikace ve spojení s rozpoznáváním obličeje. Pokud telefon nedokáže identifikovat vaši tvář, požádá vás o heslo nebo otisk prstu čínská vláda používá ID karty a sledovací technologii k uzavření hranice chyb, která existuje v její síti rozpoznávání obličejů.

V budoucnu vědci jistě najdou způsob, jak tyto problémy obejít. Mohou používat sonarovou technologii spolu s lidarem k vytváření 3D map obličeje v jakémkoli prostředí a mohou najít způsoby, jak zpracovat data obličejů (a identifikovat cizí lidi) v neuvěřitelně krátkém čase. Ať tak či onak, tato technologie má velký potenciál ke zneužití, takže se vyplatí držet krok.

Zdroje: Univerzita v Rijece, Nadace Electronic Frontier Foundation