Vše o rozpoznávání obličeje pro firmy

Photo of author

By etechblogcz

Technologie rozpoznávání tváří již dávno překročila hranice informatiky a stala se významným nástrojem v obchodní sféře.

Rozpoznávání obličeje je jedním z nejdiskutovanějších pojmů současnosti.

Jedná se o odvětví aplikovaného strojového učení, které umožňuje detekci a identifikaci lidských tváří, což představovalo pro počítače v minulosti značnou výzvu. Tato inovace otevírá nové obzory a přináší zajímavé možnosti a výzvy pro podniky, státní správu i jednotlivce.

Pokud jste manažerem a zajímá vás, proč je o tuto technologii takový zájem a jak by mohla být pro vás přínosná, jste na správném místě. V tomto článku prozkoumáme historii rozpoznávání tváří, jeho vývoj, současné využití, kontroverze, možnosti implementace a další důležité aspekty.

Po přečtení tohoto článku budete mít jasnou představu o technologii rozpoznávání obličeje a jejím potenciálním dopadu na vaše podnikání.

Začněme!

Vývoj rozpoznávání obličeje

Technologie rozpoznávání obličeje není žádnou novinkou, přestože v poslední době získala velkou pozornost médií. První významný krok v oblasti algoritmů pro detekci obličeje představoval rámec Viola-Jones pro detekci objektů, publikovaný v roce 2001. Ačkoli byl původně koncipován jako obecný nástroj pro identifikaci objektů v obrazech, rychle se osvědčil i v detekci obličejů. Klíčovým faktorem popularity tohoto algoritmu byla jeho rychlost; trénink byl sice pomalý, ale proces detekce probíhal neuvěřitelně rychle.

Již v letech 2001-2004 dokázal průměrný stolní počítač s tímto algoritmem zpracovat obraz o rozměrech 300 x 300 pixelů za pouhých 0,07 sekundy (více informací zde). Přestože přesnost tohoto algoritmu nedosahovala úrovně lidských schopností, dosahovala pozoruhodných 90 %.

Skutečný pokrok však nastal až v období 2010-2020, kdy se konvoluční neuronové sítě ukázaly jako nejefektivnější metoda pro detekci obličejů. Tento posun byl umožněn dostupností výpočetního výkonu a rozsáhlé operační paměti, poskytované cloudovými službami Infrastructure-as-a-Service (IaaS). Poprvé v historii dokázaly počítače trvale překonávat lidské schopnosti v rozpoznávání tváří, zejména při zpracování velkého množství náhodných tváří.

Zdroj: medium.com

Jak funguje rozpoznávání obličeje?

Rozpoznávání obličeje je komplexní proces, který zahrnuje několik specializovaných podsystémů.

Různé fáze procesu:

Detekce/Sledování: Tato fáze předzpracování se zaměřuje na identifikaci a sledování obličejů v daném souboru obrázků nebo videu. Po dokončení tohoto procesu víme s jistotou, že se v daném vstupu nachází obličej a můžeme jej dále zpracovávat. Fáze sledování také sleduje určité části, specifické rysy nebo výrazy obličeje, pokud je to nutné.

Zarovnání: Rozpoznávání obličeje je komplikované tím, že obličeje na obrázcích nebo videu nejsou nikdy ideálně umístěny. Osoba může být blízko nebo daleko, vykukovat zpoza překážky, nebo být zobrazena z profilu. Právě zde vstupuje do hry zarovnání obličeje: určuje, kde se na obrázku nebo videu nacházejí linie obličeje a jaké jsou obrysy jeho rysů.

Zdroj: csc.kth.se

Extrakce rysů: V této fázi procesu (v části rozpoznávání) jsou jednotlivé rysy obličeje, jako jsou oči, nos, brada, rty atd., extrahovány do podoby, kterou mohou algoritmy použít v následující fázi. V této fázi počítač shromáždí dostatek komplexních dat, aby bylo možné obličej jednoznačně rozlišit.

Porovnání/Klasifikace rysů: V této fázi se data získaná z extrakce rysů porovnávají s databází, aby se určila totožnost osoby. Tato fáze je také známa jako klasifikace, protože algoritmus může tváře kategorizovat, místo aby je jednotlivě identifikoval.

Po dokončení tohoto procesu víme, zda daný obličej patří do databáze, se kterou ho porovnáváme. Výsledkem může být také označení obličeje, jak je známe například z Facebooku.

Zdroj: directiondatascience.com

Možnosti nasazení: na straně serveru vs. na straně klienta

Rozpoznávání obličeje může probíhat jak na serveru, tak přímo na zařízení, se kterým uživatel interaguje. Například, když nahrajete fotografii na Facebook, algoritmy běží na straně serveru. Na druhou stranu, systém pro odemykání zařízení pomocí tváře musí běžet na straně klienta. Která varianta je tedy lepší?

Není to o tom, která varianta je lepší, ale o tom, co vyhovuje dané situaci. Jak serverové, tak klientské nasazení mají své silné stránky a v praxi podniky často používají hybridní systém. Doporučuje se trénovat modely na serveru, kde jsou k dispozici rozsáhlá data a výpočetní zdroje. Po trénování se modely mohou zabalit a nasadit na straně klienta, což zrychluje systém a zároveň chrání soukromí uživatele.

Odesílání všech dat na server může způsobit zpoždění, které je v některých případech nepřijatelné. Ponechání všeho na straně klienta naopak může vést k slabším modelům.

Jak přesné je rozpoznávání obličeje?

Přesnost v rozpoznávání obličeje není snadné přesně definovat. Je to proto, že se jedná o problém s mnoha proměnnými (špatné osvětlení, obličej částečně zakrytý vlasy, nízká kvalita fotoaparátu atd.) a dokonce i matoucími vstupy (více o tom později!). Neuronové sítě používané pro rozpoznávání obličeje se musí přizpůsobit danému problému, což omezuje jejich univerzálnost. I když se průmyslový systém rozpoznávání obličeje může chlubit 100% přesností, nemusí dosáhnout ani 20 % přesnosti při identifikaci obličejů na přeplněné fotografii.

V jednom výzkumu dokázal algoritmus rozpoznávání obličeje dosáhnout přesnosti 98,52 %, což překonalo lidskou přesnost 97,53 % v témže testu. V jiné studii ve forenzní vědě se ukázalo, že kombinace lidského úsudku a algoritmů přináší v některých případech nejlepší výsledky.

Závěrem lze říci, že pro cílené, dobře definované aplikace je rozpoznávání obličeje velmi efektivní nástroj.

Kde se používá rozpoznávání obličeje?

V krátké době od vývoje funkčních algoritmů našlo rozpoznávání obličeje neuvěřitelně užitečné a zajímavé uplatnění. Některé z aplikací jsou zřejmé, ale jiné jsou tak nenápadně a zásadně včleněny do každodenního života, že si ani neuvědomujeme jejich existenci.

Facebook je nejběžnějším příkladem využití moderních systémů rozpoznávání obličeje. Po nahrání fotografie dokáže sociální síť detekovat obličeje. Zatímco dříve jste museli označovat své přátele, dnes to Facebook zvládne sám.

Zdroj: labnol.org

Jednou ze zajímavých novinek Facebooku je funkce, která informuje uživatele, pokud někdo nahraje fotografii s jejich tváří, i když na ní nejsou označeni.

Snapchat intenzivně využívá detekci a rozpoznávání obličeje pro mnoho svých funkcí, zejména pro oblíbené vtipné filtry.

Zdroj: gistreel.com

Aby filtry fungovaly správně, musí být obrysy a rysy obličeje objektu perfektně detekovány, jinak překryvy nebudou vypadat realisticky. Totéž platí pro funkci Face Swap. Pokud se chcete o možnostech rozpoznávání obličeje v Snapchatu dozvědět více, podívejte se zde.

Uber se již nějakou dobu potýká s obavami o soukromí a bezpečnost a nejnovější zbraní v jeho arzenálu je rozpoznávání obličeje. Společnost zavedla novou funkci, která ověřuje identitu řidičů a partnerů pomocí jejich tváří. Společnost na svém blogu uvádí, že po testování několika dodavatelů technologií pro rozpoznávání obličeje se rozhodla pro Microsoft Face API, a to díky jeho vysoké kvalitě. Zajímavé je, že tato kontrola ID v reálném čase funguje dobře i za špatných světelných podmínek a dokáže detekovat brýle.

Vzhledem k tomu, že se rozpoznávání obličeje ukazuje jako úspěšné v praxi, lze očekávat, že brzy nahradí jiné metody identifikace ve vzdělávacích institucích, nemocnicích, knihovnách atd.

Prevence maloobchodní kriminality je přirozeným rozšířením využití rozpoznávání obličeje. Maloobchod každý rok ztrácí odhadem 45 miliard dolarů kvůli krádežím a jiným trestným činům. Nyní společnosti jako FaceFirst pomáhají maloobchodníkům pomocí rozpoznávání obličeje identifikovat pachatele a upozornit ochranku.

Policejní složky také začínají využívat rozpoznávání obličeje. Například policie v jižním Walesu používá kamery namontované na dodávkách k monitorování davů.

Zdroj: theconversation.com

Ačkoli tato nově nabytá schopnost policie vyvolává debaty o ochraně soukromí jednotlivců, policie věří, že jim pomůže lépe odhalovat pachatele. Jak řekl Richard Lewis, zástupce vrchního konstábla policie v jižním Walesu pro Financial Times:

Pokud identifikujete někoho, kdo se dopustil trestného činu, říkáte: „Víme, že jste tady, prosím, chovejte se slušně.“

Zdravotnictví objevilo novou aplikaci rozpoznávání obličeje pro detekci vzácné genetické poruchy, DiGeorgeova syndromu.

DiGeorgeův syndrom se vyskytuje přibližně u 1 z 6 000 dětí a způsobuje deformace několika částí těla. Problém je závažnější v chudších zemích, které nemají prostředky na drahé diagnostické metody. Rozpoznávání obličeje s přesností 96,6 % nabízí novou naději pro oběti DiGeorgeova syndromu.

V letecké dopravě se používání rozpoznávání obličeje rychle rozvíjí a brzy nahradí konvenční palubní vstupenky. V současnosti jsou jeho možnosti omezené, ale ukazují se slibné výsledky při identifikaci cestujících při odjezdu. Úřad pro bezpečnost dopravy (TSA) v USA dokonce stanovil plán pro široké využití biometrie založené na rozpoznávání obličeje.

Kontroverzní využití rozpoznávání obličeje

Technologie nám dávají moc, ale záleží na nás, jak ji využijeme. Je tedy pochopitelné, že tak mocná technologie, jako je rozpoznávání obličeje, může být využívána způsoby, které vyvolávají obavy ohledně lidských práv a etiky.

Nejmarkantnějším příkladem kontroverzního využití rozpoznávání obličeje je rozsáhlý čínský sledovací systém, který využívá přibližně 200 milionů kamer ke sledování 1,4 miliardy občanů.

Zdroj: sbs.com

Systém sleduje lidi a vyhodnocuje jejich činy a průběžně aktualizuje tzv. občanské skóre. Ačkoli je sledovací systém řízený státem užitečný například pro sledování dlužníků, většina lidí to vnímá jako nástup dystopické budoucnosti, kterou si představoval George Orwell, tedy budoucnosti, kde má vláda neomezenou moc nad jednotlivcem a soukromí neexistuje.

Druhý příklad diskutabilního využití rozpoznávání obličeje pochází také z Číny. Tentokrát se školský systém rozhodl využít rozpoznávání obličeje ke kontrole „pozornosti“ studentů během vyučování. Nový systém, který není dosud široce rozšířen, nahrazuje občanské průkazy, průkazy do knihovny, docházkové systémy atd. a identifikuje studenty na základě obličeje.

Zdroj: businessinsider.com

Systém však také sleduje úroveň pozornosti studentů, používání mobilních telefonů atd. a upozorní učitele, pokud je překročena určitá hranice.

Ačkoli video dohled založený na rozpoznávání obličeje není výsadou pouze Číny a USA se snaží ho využívat k omezení násilí ve školách, Čína v tomto ohledu předběhla všechny ostatní země.

Srovnání populárních API pro rozpoznávání obličeje

Jaké možnosti máte, pokud chcete využívat funkce rozpoznávání obličeje? V této části se podíváme na nejčastěji používané řešení a jak se navzájem doplňují.

Je však důležité mít na paměti, že tato rozhraní API se rychle vyvíjejí a je možné, že narazíte na blogové příspěvky, které tvrdí, že dané API postrádá určitou funkci. Nedělejte rozhodnutí pouze na základě těchto informací. Nejprve zanalyzujte své obchodní potřeby, pečlivě zkontrolujte nabízené funkce, otestujte si je a teprve potom se rozhodněte.

OpenCV

Výzkum v oblasti umělé inteligence je nikdy nekončící proces. Trénink a zdokonalování systémů rozpoznávání obličeje je náročné a je lepší ho nechat na velké korporace s dostatečným finančním zázemím a týmem výzkumníků. Pokud však máte jednoduché požadavky a chcete mít plnou kontrolu nad procesem – a samozřejmě jste připraveni na to, že se o systém bude starat malý tým inženýrů – může být OpenCV pro vás správná volba.

Jedná se o open-source knihovnu pro počítačové vidění, která je pozoruhodně přesná a dostupná pro všechny programovací platformy. Zde je zjednodušený příklad, jak vytvořit systém pro detekci obličejů pomocí Pythonu a OpenCV ve 25 řádcích kódu!

Možná narazíte na blogy, které tvrdí, že OpenCV nenabízí rozpoznávání obličeje. Není to však pravda, zde je důkaz. Celkově může být OpenCV skvělou volbou pro vaše podnikání, pokud máte jednoduché a specifické požadavky.

Amazon Rekognition

Rekognition je robustní nabídka od jednoho z největších poskytovatelů cloudových služeb – AWS. Jedná se o plně spravovanou a výkonnou službu pro platformu AWS. Pokud již AWS využíváte pro své nasazení, Rekognition je pravděpodobně tou nejlepší volbou.

Některé z funkcí, které Rekognition nabízí:

  • Analýza v reálném čase (při nahrávání obrázku nebo videa do S3)
  • Rozsáhlá analýza obličeje (pohlaví, barva vlasů, výraz obličeje, otevřené oči atd.)
  • Sledování trasy (záznam trasy identifikovaných objektů ve videích)
  • Detekce scény a aktivity (uvnitř/venku, „hraní fotbalu“ atd.)
  • Moderování nebezpečného obsahu (například nahota)

Největší výhodou Rekognition je zároveň jeho největší nevýhodou – budete mít problémy s jeho používáním v kombinaci se službami, které nejsou součástí AWS.

Kairos

Na rozdíl od Rekognition vám Kairos poskytuje AI prostřednictvím API, což vám umožňuje mít plnou kontrolu nad svými daty a servery. Kairos se prezentuje jako služba, která klade na první místo ochranu soukromí a kritizuje Amazon a další společnosti, které spolupracují s vládou (stejně jako ACLU).

Kairos funguje s obrázky i videi a má všechny funkce, které byste od moderního API pro rozpoznávání obličeje očekávali. Nabízí některé funkce, které jsou k dispozici i v Rekognition, ale pokud je nepotřebujete a již sami spravujete svá data, proč se jimi zabývat?!

Kairos nabízí on-premise nasazení pro ty, kteří dbají na soukromí a nechtějí odesílat data k externímu zpracování. Cena závisí na vašem konkrétním případu použití a může být poměrně vysoká.

Google Cloud Vision

Google se rozhodl rozlišovat mezi svými službami rozpoznávání obličeje pro obrázky a videa. API pro obrázky se nazývá Cloud Vision, zatímco služba zaměřená na video se jmenuje Video Intelligence.

Služba zaměřená na obrázky se velmi podobá tomu, co nabízí AWS, ale služba pro videa má užitečnou funkci katalogizace a vyhledávání. To ocení společnosti, které mají rozsáhlé videoarchivy a chtějí je analyzovat nebo v nich vyhledávat.

Službě Video Intelligence chybí funkce rozpoznávání obličeje a zdá se, že jsou dostupné pouze v Cloud Vision. Sledování objektů a detekce textu jsou navíc ve fázi beta testování, což je výrazně pozadu za nabídkami Amazonu.

Azure Face API

Vzhledem k tomu, že se Microsoft více zaměřuje na cloudové nabídky, než na desktopové aplikace, je Azure Face API velmi zajímavá nabídka. Má všechny funkce, které byste očekávali (detekce, identifikace, seskupování tváří, vyhledávání podobných tváří, emoce atd.) a funguje dobře i s videi.

I když to nesouvisí s rozpoznáváním obličeje, je dobré zmínit, že Azure nabízí i <a rel=“nofollow noopener“ target=“_blank“ href=“https://azure.microsoft.com/en-in/services/cognitive-services