Alexa, Siri a Google nerozumí ani slovu, které říkáte

Hlasoví asistenti jako Alexa, Google Assistant a Siri ušli za posledních několik let dlouhou cestu. Ale přes všechna jejich vylepšení je brzdí jedna věc: Nerozumějí vám. Příliš se spoléhají na konkrétní hlasové příkazy.

Rozpoznávání řeči je jen kouzelný trik

Hlasoví asistenti vám nerozumí. Vlastně ani ne. Když mluvíte na Google Home nebo Amazon Echo, v podstatě převede vaše slova na textový řetězec a poté jej porovná s očekávanými příkazy. Pokud najde přesnou shodu, postupuje podle souboru pokynů. Pokud ne, hledá alternativu toho, co dělat na základě informací, které má, a pokud to nefunguje, zobrazí se chybová zpráva jako „Omlouvám se, ale nevím, .“ Je to o něco víc než trik ruční magie, jak vás přimět, abyste si mysleli, že tomu rozumí.

Nemůže používat kontextová vodítka k tomu, aby co nejlépe odhadl, nebo dokonce používat porozumění podobným tématům k informování svých rozhodnutí. Není těžké vypnout ani hlasové asistenty. Zatímco se můžete zeptat Alexy: „Pracujete pro NSA? a získejte odpověď, pokud se zeptáte: „Jste tajně součástí NSA? dostanete odpověď „tohle neznám“ (alespoň v době psaní tohoto článku).

Lidé, kteří skutečně rozumí řeči, takto nefungují. Předpokládejme, že se zeptáte člověka: „Co je ten klarvain na obloze? Ten, který je klenutý a plný pruhovaných barev, jako je červená, oranžová, žlutá a modrá.“ Přestože je klarvain vymyšlené slovo, osoba, které jste se zeptali, pravděpodobně z kontextu vyvodí, že popisujete duhu.

  Jak používat SUID, SGID a Sticky Bits v Linuxu

I když byste mohli tvrdit, že člověk převádí řeč na myšlenky, člověk pak může použít znalosti a porozumění k uzavření odpovědi. Pokud se člověka zeptáte, zda tajně pracuje pro NSA, odpoví vám ano nebo ne, i když je to lež. Člověk by na takovou otázku neřekl „toho neznám“. To, že lidé mohou lhát, je něco, co přichází se skutečným pochopením.

Hlasoví asistenti nemohou překročit své programování

Hlasoví asistenti jsou nakonec omezeni na naprogramované očekávané parametry a putování mimo ně proces přeruší. Tato skutečnost ukazuje, kdy do hry přicházejí zařízení třetích stran. Obvykle je příkaz k interakci s nimi velmi nepraktický a rovná se „řekni výrobci zařízení, aby zadal volitelný argument“. Přesný příklad by byl: „Řekněte společnosti Whirlpool, aby pozastavila sušičku.“ Pro ještě hůře zapamatovatelný příklad, Geneva Alexa dovednost ovládá některé trouby GE. Uživatel dovednosti si musí pamatovat, že „řekni Ženevě“, ne „řekni GE“ a pak zbytek příkazu. A zatímco můžete požádat o předehřátí trouby na 350 stupňů, nemůžete navázat požadavkem na zvýšení teploty o dalších 50 stupňů. Člověk by však mohl tyto požadavky splnit.

Amazon a Google velmi tvrdě pracovaly na překonání těchto překážek a je to vidět. Zatímco dříve jste museli při ovládání chytrého zámku postupovat podle výše uvedené sekvence, nyní můžete místo toho říci „uzamkněte přední dveře“. Alexa býval zmatený „řekni mi vtip o psu“, ale požádej o něj dnes a bude to fungovat. Přidali variace k příkazům, které používáte, ale nakonec stále musíte znát správný příkaz, který chcete říct. Musíte použít správnou syntaxi ve správném pořadí.

  Jak vytvořit screencast pomocí aplikace Microsoft PowerPoint

A pokud si myslíte, že to zní hodně jako příkazový řádek, nemýlíte se.

Hlasoví asistenti jsou luxusní příkazový řádek

Příkazový řádek je úzce definován k provádění jednoduchých úkolů, ale pouze pokud znáte správnou syntaxi. Pokud vypadnete ze správné syntaxe a napíšete dyr místo dir, příkazový řádek vám zobrazí chybovou zprávu. Můžete použít aliasy pro snadnější zapamatování příkazů, ale musíte mít představu o tom, jaké byly původní příkazy, jak fungují a jak efektivně používat aliasy. Pokud si nenajdete čas na to, abyste se naučili spletité prvky příkazového řádku, nikdy z toho mnoho nezískáte.

Hlasoví asistenti se neliší. Musíte znát správný způsob, jak říct příkaz nebo položit otázku. A musíte vědět, jak nastavit skupiny pro Google a Alexa, proč je seskupování zařízení zásadní a jak svá chytrá zařízení pojmenovat. Pokud nebudete postupovat podle těchto nezbytných kroků, budete pociťovat frustraci z toho, že požádáte svého hlasového asistenta, aby studii vypnul, jen abyste byli dotázáni, „která studie“ by měla být vypnuta.

I když použijete správnou syntaxi ve správném pořadí, proces může selhat. Buď s chybnou odezvou, nebo překvapivým výsledkem. Dva domovy Google ve stejném domě mohou poskytovat počasí pro mírně odlišná místa, i když mají přístup ke stejným informacím o uživatelském účtu a připojení k internetu.

Ve výše uvedeném příkladu je uveden příkaz „Nastavit časovač na půl hodiny“. Centrum Google Home vytvořilo časovač s názvem „Hour“ a poté se zeptalo, jak dlouhý by měl být časovač. A přesto opakování stejného příkazu třikrát fungovalo správně a vytvořilo 30minutový časovač. Použití příkazu „Nastavit časovač na 30 minut“ funguje správně na konzistentnějším základě.

  Je bezpečné kopírovat/vkládat hesla ze schránky?

Zatímco mluvení s Google Home nebo Echo může být plynulejší, hlasoví asistenti a příkazové řádky pod kapotou fungují stejným způsobem. Možná se nebudete muset učit nový jazyk, ale musíte se naučit nový dialekt.

Úzké porozumění hlasovým asistentům omezí růst

Nic z toho nebrání hlasovým asistentům, jako je Google Assistant a Alexa, dostatečně dobře fungovat (ačkoli Cortana je jiný příběh). Google Assistant a Alexa a slušně hledejte online otázky, i když není divu, že Google je ve vyhledávání lepší a dokáže odpovědět na základní otázky, jako jsou převody měření a jednoduchá matematika. Se správně nastaveným chytrým domem a dobře vyškoleným uživatelem bude většina příkazů chytrého domu fungovat tak, jak má. Ale to přišlo díky práci a úsilí, ne intelektuálnímu porozumění.

Časovače a budíky bývaly zjednodušující. Postupem času bylo přidáno pojmenování a poté možnost přidat čas do časovače. Přešli od jednodušších ke složitějším. Hlasoví asistenti mohou odpovídat na více otázek a každý den přináší nové dovednosti a funkce. Ale to není produkt vlastního růstu, který pochází z učení a porozumění.

A nic z toho nepřináší vlastní schopnost používat to, co je známo, k dosažení neznámého. Na každý příkaz a otázku, které fungují, budou vždy tři, které nefungují. Bez průlomu v AI, který poskytuje lidskou schopnost porozumění, hlasoví asistenti nejsou vůbec asistenty. Jsou to jen hlasové příkazové řádky – užitečné ve správném scénáři, ale omezené na scénáře, kterým byly naprogramovány, aby porozuměly.

Jinými slovy: stroje se věci učí, ale nemohou jim porozumět.