ChatGPT-4 vs ChatGPT-3.5 Výchozí vs. ChatGPT-3.5 Legacy: Testované rozdíly

Očekávané novinky v oblasti chatbotů: ChatGPT 4.0 versus jeho předchůdci

Očekává se, že ChatGPT 4.0 způsobí revoluci ve světě chatbotů. Ale je skutečně lepší než jeho předchůdce? Pojďme to prověřit.

ChatGPT byl pouze začátek v rozvíjející se oblasti automatizace. Společnosti jako Google, Microsoft a mnoho dalších se snaží zaujmout přední pozice v umělé inteligenci.

Na trhu se objevilo několik chatbotů podobných ChatGPT, mnoho z nichž nepochází od velkých technologických firem.

Nicméně, díky síle marketingu, je ChatGPT stále dominantním hráčem mezi AI boty. Dokáže zvládat mnoho úkolů, včetně matematických výpočtů, psaní poezie, blogových příspěvků, a dokonce se používá i pro právní podání.

DoNotPay pracuje na využití GPT-4 k automatickému generování „žaloby na jedno kliknutí“ pro podávání žalob na robotické volající o částku 1500 dolarů. Představte si, že přijmete hovor, kliknete na tlačítko, hovor se přepíše a vygeneruje se žaloba o 1000 slovech. GPT-3.5 nebyl pro tuto úlohu dostatečný, ale GPT-4 ji zvládá mimořádně dobře: pic.twitter.com/gplf79kaqG

— Joshua Browder (@jbrowder1) 14. března 2023

Mnoho profesionálů má obavy, že jejich dovednosti by mohly v budoucnu ztratit na významu.

Nicméně, nedávno jsem narazil na příspěvek na LinkedIn, který uvádí:

„Umělá inteligence vás nenahradí, ale člověk, který ji používá, ano.“

S tímto na paměti, pojďme se seznámit s nejnovější aktualizací ChatGPT a podívat se, jak se liší od svých předchozích verzí.

ChatGPT: Starší verze, výchozí nastavení a aktualizace

Uživatelé s placeným přístupem mají k dispozici tři varianty: Starší verzi (3.5), výchozí nastavení (3.5) a nejnovější aktualizaci ChatGPT (4).

Než se ponoříme hlouběji do jejich schopností, zde je, co o rozdílech uvádí OpenAI:

Zdroj: OpenAI

Zatímco uživatelé s bezplatným přístupem mají k dispozici pouze Starší verzi 3.5, prémiové předplatné nabízí všechny tři verze. Uživatelé si tak mohou vyzkoušet, která jim nejvíce vyhovuje.

Stručně řečeno, placené plány se zaměřují na poskytování přesnějších výsledků při zachování rychlosti. Nicméně, rozdíly jsou nejvíce patrné, pokud se jedná o složité dotazy vyžadující kreativitu.

Parametr	ChatGPT 4	ChatGPT 3.5
Skóre v testu	Horních 10 %	Dolních 10 %
AI2 Reasoning Challenge (ARC)	96,3 %	85,2 %
Skóre v Python Coding	67 %	48,1 %
Vizuální interpretace	Ano	Ne
Kontext	Více než 25 000 slov	Méně

Zdroj: OpenAI

Navíc, ChatGPT 4 umí zpracovávat vizuální vstupy.

Dost ale teorie. Pojďme se podívat, jak si tyto verze povedou v reálných situacích.

Následující sekce obsahují obrázky, které se mohou zdát nejasné. V takovém případě klikněte pravým tlačítkem myši na obrázek a vyberte možnost „Otevřít obrázek na nové kartě“, aby se zobrazil správně.

Matematika

Jako absolvent technické univerzity jsem se nemohl ubránit a dal jsem chatbotům několik základních matematických úloh. Začněme s jednoduchými algebraickými rovnicemi.

Fáze I

Mnoho z nás se setkalo s rovnicemi ax²+bx+c=0, kde je potřeba vypočítat X. Zde jsem zadal jednoduchý úkol: „Vypočtěte x: x² + x – 6 = 0“.

Všechny tři verze našly stejné kořeny (X= -3,2). Starší verze a Aktualizace použily pro výpočet vzorec (jako každý student).

Výchozí verze 3.5 však vysvětlila dvě metody, včetně faktorizace, kterou běžně používají zkušení studenti při řešení takových jednoduchých rovnic.

Fáze II

Nyní chatboty vyzkoušíme s mírně složitější kubickou rovnicí: x³ -12x² + 48x – 64 = 0.

Tato úloha skutečně ukázala, proč je ChatGPT 4 "aktualizací".

Zde jsou odpovědi:

Starší verze a výchozí nastavení nedokázaly vyřešit obecnou kubickou rovnici. Starší verze si vedla o něco lépe a správně našla dva kořeny, zatímco výchozí verze zcela selhala.

Aktualizace byla jasným vítězem druhé fáze. Rychle vyřešila rovnici a našla všechny tři kořeny s podrobným vysvětlením.

Logické uvažování

Lze předpokládat, že většina základních matematických problémů má předem daná řešení. Pokud znáte postup nebo vzorec, stačí dosadit hodnoty a získáte výsledky.

ChatGPT, jakožto umělá inteligence, umí takové dotazy zpracovat rychle. Logické uvažování je ovšem jiná oblast, kde může AI selhat.

Fáze I

Zadal jsem chatbotům klasickou úlohu:

A je starší než B.
C je starší než A.
B je starší než C.
Je třetí tvrzení pravdivé nebo nepravdivé, pokud jsou první dvě pravdivá?

Všechny verze ChatGPT správně označily třetí tvrzení jako nepravdivé.

Dále jsem místo písmen použil jména a výsledky vás mohou překvapit:

Výchozí verze 3.5 pokračovala ve svém podprůměrném výkonu a byla zmatena touto malou obměnou. Starší verze a Aktualizace však fungovaly bez problémů.

Fáze II

Možná jste si všimli, že cílem této fáze I a fáze II je najít bod zlomu, kde složitost daného úkolu odliší Aktualizaci od ostatních dvou.

Zde jsem zadal jednoduchou logickou hádanku:

Jednoho rána po východu slunce stál Rohit čelem k tyči. Stín tyče padl přesně po jeho pravici. Kterým směrem byl obrácen?
A. Severní
B. Západní
C. Jižní
D. Východní

Starší verze poskytla nepřesnou odpověď, zatímco Výchozí verze odpověděla vágním vysvětlením vedoucím k nesprávnému závěru.

Pouze Aktualizace našla správnou odpověď s jasným vysvětlením.

Psaní dopisů

Podávání žalob může být složité, ale někdy k němu nedojde, pokud dokážete napsat působivý úvodní dopis.

Zadal jsem následující úkol: "Napište dopis Timu Cookovi, ve kterém ho požádáte o nový iPhone za to, že neodpověděl na jeden z mých tweetů."

Zábavné, že? Podívejme se, co na to řekne AI.

Starší verze 3.5 okamžitě přijala úkol jako robot a vytvořila dopis, který by ze mě mohl udělat terč posměchu, kdyby se někdy dostal k zamýšlenému adresátovi.

Výchozí verze také nebyla dobrá. Její odpověď působila, jako by ji napsal nabručený děda pětiletému dítěti.

I když přednesené argumenty byly přesné, zábava s malou lekcí tím skončila.

Ačkoli se jednalo o jednoduchý úkol, vyžadovalo to trochu přemýšlení a kreativity. A to je místo, kde se Aktualizace ukázala jako mnohem schopnější:

Za prvé, dopis byl napsán téměř perfektně. Za druhé, ušetřil mi hledání adresy sídla společnosti Apple na Googlu (i když by si člověk měl takové údaje ověřit).

Za třetí, byl napsán s oficiálním tónem a s humorným nádechem. Kromě toho byl záměr jasný již z předmětu dopisu.

Dopis zároveň vyjadřoval pocity zklamaného fanouška Applu.

Díky tomu je ChatGPT 4 (alias Aktualizace) o míle napřed před svými staršími verzemi. Je překvapivě inteligentní a vykazuje známky zdravého rozumu, což z něj činí více než jen obyčejného chatbota.

Poezie

S příchodem ChatGPT jsem si myslel, že poezie by mohla být jeho slabinou.

Koneckonců, tvorba poezie vyžaduje emoce, kreativitu a úsilí, aby člověk vytvořil něco, co skutečně osloví jeho čtenáře.

Jednoduše řečeno, poezie je umění v celé své kráse a já jsem si tajně přál, aby umělá inteligence selhala. To bylo ovšem předtím, než můj kolega ve slack kanálu etechblog.cz sdílel tvorbu ChatGPT, která byla ještě před touto Aktualizací 4.0.

Fáze I

Zde je zadání, které jsem dal chatbotům: "Poeticky vyjádřete, proč by přidání hamburgerů k aktuální nabídce mohlo být nebo nemohlo být přínosem pro řetězec pizzerií Domino's. Méně než 100 slov."

Poznáte rozdíl?

Výchozí verze byla ultrakrátká, měla pouze 32 slov a nemohla využít dostupnou šířku pásma k předvedení své kreativity.

Starší verze, i když použila nejvíce slov ze všech tří, dochází k závěru, že nabízení pizz a hamburgerů vedle sebe není riskantní a povede k úspěchu v obou směrech, což není úplně pravda.

Poezie Aktualizace měla pouze 53 slov, čímž nevyužila téměř polovinu z přiděleného počtu slov. Přesto byla jasná ohledně odměn a potenciálních úskalí a nepřišla s jednoznačným závěrem, což se mi zdá lidštější než ostatní.

Fáze II

Dále jsem všechny požádal, aby "vysvětlili poezii pětiletému dítěti."

Je zajímavé, že Starší verze nedokázala z konverzace vyvodit kontext a vysvětlila „poezii“ doslovně. Výchozí verze vzala v úvahu kontext a shrnula jej do odstavce, který je stále slušný.

ChatGPT 4 pokračoval v trendu a zjednodušil svou kreativitu a zároveň zachoval poetický nádech.

ChatGPT Premium vs. ChatGPT zdarma

Bezplatná verze postrádá rychlost a přesnost a nemůže se srovnávat s ChatGPT 4, ale není ani úplně k ničemu.

Abychom ji porovnali s ostatními, zadal jsem do ní stejné úkoly, kterými jsme testovali Starší verzi, Výchozí verzi a Aktualizaci.

🔵 Matematika: Vyřešila kvadratické rovnice, ale u kubické rovnice dala špatné odpovědi (stejně jako Starší a Výchozí verze).

🔵 Logické uvažování: Úspěšně prošla první fází s abecedami a jmény, ale selhala ve druhé (stejně jako Starší verze).

🔵 Dopisy: Dopis nenapsala a úkol označila za neetický a nevhodný (stejně jako Výchozí verze).

🔵 Poezie: Vytvořila poezii o více než 30 slovech a slušně ji vysvětlila (podobně jako Výchozí verze).

Můžeme tedy konstatovat, že ani bezplatná verze není špatná. Ve skutečnosti je na stejné úrovni jako Výchozí verze 3.5 a v některých ohledech je dokonce lepší.

Přečtěte si také: Účinné triky pro zlepšení vašeho zážitku s ChatGPT

Budoucnost umělé inteligence

Fámy o tom, že umělá inteligence v budoucnu nahradí pracovní místa, nejsou zcela nepravdivé.

Za prvé, automatizace to udělala ve zpracovatelském průmyslu a nyní se rozšiřuje i do dalších oblastí.

Osobně je mnohem rychlejší než já při řešení kubických rovnic, tvorbě poezie nebo psaní dopisů. Nicméně skutečnost, že málokdy řekne NE na úkol a jen zřídka se poučí ze svých chyb, otevírá dveře lidem.

Zopakuji to, umělá inteligence nás nenahradí, ale někdo, kdo ji používá, ano.

Zde na etechblog.cz náš marketingový tým využívá ChatGPT zajímavým způsobem. Například nedávno jsme dosáhli milníku 100 milionů zhlédnutí a náš generální ředitel si myslel, že to vrátí publiku prostřednictvím dárku.

A myslím, že marketingoví kluci potřebovali název, který by upoutal pozornost čtenáře. Dali tedy jeden úkol a požádali ChatGPT o navržení několika variant, jako je tato:

Kromě toho jej používáme pro shrnutí obsahu, kontrolu gramatiky, navrhování názvů nových článků a podobně.

Závěrem lze říci, že existuje mnoho způsobů, jak využít výhody a překonat stereotypy, které AI považují za zbytečnou technologii.

Jediné, co je potřeba si zapamatovat, je, že musí existovat někdo (člověk), kdo posoudí práci AI, protože může být (hrubě) nepřesná a zavádějící.

Aktualizace je opravdu úžasná!

Během mého krátkého setkání se ChatGPT 4 působil kreativněji, chápavěji a realističtěji. Přesto je to stále stroj a může s jistotou poskytovat nesprávné odpovědi.

Ohromující je však úroveň vylepšení, kterou OpenAI u tohoto projektu provedla během několika měsíců.

A už se nemůžu dočkat, až uvidím, jakými dalšími kouzly nás příští aktualizace překvapí!

PS: Není to jen chatovací okno; využijte jeho sílu s těmito nejlepšími rozšířeními ChatGPT Chrome. A přemýšleli jste někdy o integraci ChatGPT se Siri?