Je Turingův test zastaralý? 5 alternativ Turingova testu

Před více než 70 lety, kdy byla umělá inteligence konceptualizována, Alan Turing publikoval článek, který popsal, jak ji identifikovat. Později byl známý jako Turingův test a po desetiletí se používá k rozlišení mezi člověkem a AI.

Se zavedením pokročilých chatbotů s umělou inteligencí, jako jsou ChatGPT a Google Bard, je však stále obtížnější zjistit, zda mluvíte s umělou inteligencí. To vyvolává otázku; je Turingův test zastaralý? A pokud ano, jaké jsou alternativy?

Je Turingův test zastaralý?

Obrazový kredit: Jesus Sanz/Shutterstock

Chcete-li zjistit, zda je Turingův test zastaralý, musíte nejprve pochopit, jak funguje. Aby umělá inteligence prošla Turingovým testem, musí přesvědčit lidského vyšetřovatele, že je to člověk. Má to ale háček – AI je hodnocena společně s člověkem a musí reagovat pomocí textu.

Přemýšlejte o tom takto; pokud jste tazatel a pokládáte otázky dvěma účastníkům online pomocí textu, ale jeden z nich je model AI – rozeznali byste je po pěti minutách? Mějte na paměti, že cílem Turingova testu není identifikovat model umělé inteligence na základě správných odpovědí, ale vyhodnotit, zda umělá inteligence může myslet nebo se chovat jako člověk.

Problém s Turingovým testovacím přístupem, který pouze identifikuje lidské reakce, je v tom, že nebere v úvahu jiné faktory. Například inteligence modelu AI nebo znalosti vyšetřovatele. Kromě toho je Turingův test omezen pouze na text a je stále obtížnější identifikovat AI, která generuje lidský hlas nebo hluboce falešná videa, která napodobují lidské chování.

  Jak používat režim trackpadu na iPhone a iPad k výběru textu

Současné modely umělé inteligence jako ChatGPT-4 a Google Bard však ještě nepokročily do bodu, kdy by mohly trvale projít Turingovým testem. Ve skutečnosti, pokud jste obeznámeni s umělou inteligencí, můžete si všimnout textu generovaného umělou inteligencí.

5 nejlepších alternativ Turingova testu

Je možné, že budoucí modely AI jako ChatGPT-5 by mohly projít Turingovým testem. Pokud k tomu dojde, budeme potřebovat různé testy kombinované s Turingovým testem, abychom zjistili, zda mluvíme s AI nebo s člověkem. Zde jsou nejlepší alternativy Turingova testu:

1. Marcusův test

Gary Marcus, renomovaný kognitivní vědec a výzkumník AI, navrhl alternativu k Turingovu testu, který byl zveřejněn v Newyorčan identifikovat kognitivní schopnosti AI. Test je jednoduchý – posuzujete model umělé inteligence na základě jeho schopnosti sledovat a porozumět videím a televizním pořadům YouTube bez titulků nebo textu. Aby umělá inteligence prošla Marcusovým testem, měla by při sledování videí rozumět sarkasmu, humoru, ironii a příběhu a vysvětlit to jako člověk.

V tuto chvíli umí GPT-4 popisovat obrázky, ale zatím neexistuje žádný model umělé inteligence, který by dokázal pojmout videa jako člověk. Samořídící vozidla se přibližují, ale nejsou zcela autonomní a vyžadují senzory, protože nemohou porozumět všemu v okolním prostředí.

2. Vizuální Turingův test

Podle výzkumného článku zveřejněného dne PNASVizuální Turingův test lze použít k identifikaci, zda mluvíte s člověkem nebo AI pomocí obrázkových dotazníků. Funguje to jako Turingův test, ale místo odpovídání na otázky pomocí textů se účastníkům zobrazují obrázky a očekává se, že budou odpovídat na jednoduché otázky a přitom přemýšlet jako člověk. Vizuální Turingův test se však od CAPTCHA liší, protože všechny odpovědi jsou správné – ale aby test prošel, musí AI zpracovat obrázky podobně jako člověk.

  Jaký nástroj pro spolupráci by měla vaše firma v roce 2023 používat?

Kromě toho, pokud je AI a člověku zobrazeno několik obrázků vedle sebe a požádáni o identifikaci realistických obrázků, člověk by měl kognitivní schopnost projít testem. Je to proto, že pro modely umělé inteligence je obtížné rozlišit snímky, které nevypadají, jako by byly pořízeny ve skutečném světě. Ve skutečnosti to je důvod, proč můžete identifikovat obrázky generované AI pomocí anomálií, které nedávají smysl.

3. Test Lovelace 2.0

Teorii, že počítač nemůže vytvářet originální nápady nad rámec toho, k čemu byl naprogramován, poprvé konceptualizovala Ada Lovelace před Turingovým testem. Alan Turing se však proti této teorii ohradil a tvrdil, že umělá inteligence může člověka stále překvapovat. Až v roce 2001 byly vyvinuty pokyny pro test Lovelace, aby bylo možné odlišit AI od člověka – a podle thekurzweillibrary pravidla byla později revidována v roce 2014.

Aby umělá inteligence prošla testem Lovelace, musí prokázat, že dokáže generovat originální nápady, které přesahují její výcvik. Současné modely umělé inteligence, jako je GPT-4, nemají schopnost přicházet s novými vynálezy nad rámec našich stávajících znalostí. Umělá obecná inteligence však může této schopnosti dosáhnout a projít testem Lovelace.

4. Reverzní Turingův test

A co Turingův test, ale provedený obráceně? Místo toho, abyste se snažili zjistit, jestli mluvíte s člověkem, cílem je reverzní Turingův test je přimět AI, aby uvěřila, že jste AI. K zodpovězení stejných otázek pomocí textu však potřebujete také jiný model umělé inteligence.

  Proč byste měli upgradovat svůj starý počítačový monitor

Pokud je například dotazovatelem ChatGPT-4, můžete jako účastníky zaregistrovat Google Barda a dalšího člověka. Pokud model AI dokáže na základě odpovědí správně identifikovat lidského účastníka, prošel testem.

Nevýhodou reverzního Turingova testu je, že je nespolehlivý, zvláště když vezmeme v úvahu, že někdy umělá inteligence nedokáže odlišit obsah vytvořený umělou inteligencí a obsah napsaný lidmi.

5. Klasifikační rámec umělé inteligence

Podle klasifikačního rámce AI vyvinutého společností Chris SaadTuringův test je pouze jednou z metod hodnocení, jak zjistit, zda mluvíte s umělou inteligencí. Stručně řečeno, klasifikační rámec AI je založen na teorii vícenásobné inteligence, která vyžaduje, aby lidská inteligence splňovala alespoň osm různých kritérií, mezi něž patří: hudební rytmus, logicko-matematická inteligence, vizuální identifikace, emoční inteligence, sebereflektivní inteligence. , schopnost existenciálního myšlení a pohyb těla.

Vzhledem k tomu, že AI je hodnocena na základě osmi různých parametrů, je nepravděpodobné, že by pro člověka prošla, i když v určitých benchmarcích funguje lépe než průměr. ChatGPT může například řešit matematické problémy, popisovat obrázky a konverzovat v přirozeném jazyce jako člověk, ale selhal by u jiných kategorií definovaných v rámci klasifikace AI.

Turingův test není přesvědčivý

Turingův test měl být spíše myšlenkovým experimentem než průkazným testem k rozlišení mezi lidmi a AI. Když byl původně navržen, byl stěžejním měřítkem pro měření inteligence strojů.

S nedávným vývojem modelů umělé inteligence s řečovými, vizuálními a sluchovými interaktivními schopnostmi však Turingův test zaostává, protože je omezen na textovou konverzaci. Nejúčinnějším řešením by bylo zavedení Turingových testovacích alternativ, které dále odlišují modely umělé inteligence od lidí.