ChatGPT-4 vs ChatGPT-3.5 Výchozí vs. ChatGPT-3.5 Legacy: Testované rozdíly

Očekává se, že ChatGPT 4.0 udělá velké vlny ve vesmíru chatbotů. Je ale skutečně lepší než jeho předchůdce? Pojďme to zkontrolovat.

ChatGPT byl jen špičkou nadcházejícího ledovce v oblasti automatizace, přičemž Google, Microsoft a mnoho dalších společností na prvním místě v oblasti umělé inteligence je následovalo.

Pro začátek jsme našli několik chatbotů, jako je ChatGPT, z nichž mnozí nepatří k velkým technologiím.

Ale říkejte tomu síla marketingu; ChatGPT je stále vládnoucím králem všech takových AI botů. Může dělat mnoho věcí, včetně matematiky, poezie a blogových příspěvků, a lidé to dokonce používají k podávání žalob.

DoNotPay pracuje na použití GPT-4 ke generování „soud na jedno kliknutí“ k žalování robocallerů o 1 500 $. Představte si, že přijmete hovor, kliknete na tlačítko, hovor se přepíše a vygeneruje se žaloba o 1 000 slovech. GPT-3.5 nebyl dost dobrý, ale GPT-4 tuto práci zvládá mimořádně dobře: pic.twitter.com/gplf79kaqG

— Joshua Browder (@jbrowder1) 14. března 2023

Spousta profesionálů se obává, že jejich dovednosti budou v blízké budoucnosti k ničemu.

Četl jsem však příspěvek na Linkedin, který říká:

AI vás nenahradí, ale člověk používající AI ano.

Držte nám tedy palce, pojďme se poučit o nejnovější aktualizaci ChatGPT a uvidíme, jak se liší od svých předchozích verzí.

ChatGPT: Legacy, Default a The Update

Placeným uživatelům jsou tedy k dispozici tři verze: Legacy (3.5), Default (3.5) a nedávná aktualizace ChatGPT (4).

I když půjdeme trochu do hloubky o jejich schopnostech, toto je to, co OpenAI říká o rozdílech:

Zdroj: OpenAI

Takže zatímco bezplatní uživatelé mají k hraní pouze Legacy 3.5, prémiové předplatné nabízí všechny tři, aby si vyzkoušeli a spokojili se s tím, co uživatelé považují za nejlepší.

Abychom shrnuli předchozí obrázek, placené plány jsou o získávání přesnějších výsledků při slušné rychlosti. Rozdíly jsou však patrné pouze tehdy, jsou-li výzvy komplikované a vyžadují kreativitu.

ParametrChatGPT 4ChatGPT 3,5bar Skóre zkoušky Nahoru 10%Spodní 10%AI2 Reasoning Challenge (ARC)96,3%85,2%Python Coding Score67%48,1%Visual InterpretationYesNoContextVíce než 25 000 slov OpenLessSource:

Kromě toho může ChatGPT 4 přijímat vizuální vstupy.

No, dost učebnicových definic. Ušpiníme si ruce a vyhodnoťme tyto kandidáty na skutečném bojišti.

Další sekce jsou plné obrázků, které se mohou zdát nejasné. V takovém případě klepněte pravým tlačítkem na libovolný obrázek a vyberte možnost Otevřít na nové kartě, aby se zobrazil správně.

Matematika

Být absolventem strojírenství, nemohu si pomoci, abych jim předhodil pár základních problémů. Začněme zlehka algebraickými rovnicemi.

  Jak povolit nebo zakázat režim vývojáře na Discordu

Fáze I

Mnoho z nás vidělo tyto rovnice ax2+bx+c=0, kde musíme vyřešit X. Zde jsem dal tuto jednoduchou výzvu Řešte pro x: x2 + x – 6 = 0

Zatímco všechny daly stejné kořeny (X= -3,2), Legacy a Update si byly podobnější v přímém použití vzorce (jako každý student) ke zjištění výsledku.

Výchozí 3.5 však vysvětlila dvě metody, včetně faktorizace, kterou běžně používá každý zkušený student, když dostane takové světské rovnice.

Etapa II

Dále jej vyzvem, aby vyřešil mírně složitou kubickou rovnici: x^3 -12x^2 + 48x – 64 = 0.

To skutečně dokázalo, proč je ChatGPT 4 „aktualizací“.

Zde jsou odpovědi:

Celý tento humbuk a ChatGPT Legacy a Default nedokázaly vyřešit obecnou kubickou rovnici. Legacy si však vedl o něco lépe a správně našel dva kořeny, zatímco Default se všemi selhal.

Aktualizace byla jasným vítězem ve druhé etapě a rovnici vyřešila dokonale a našla všechny tři kořeny s pěkným vysvětlením.

Logické uvažování

Můžeme bezpečně předpokládat, že většina základních matematických problémů má slovníková řešení. Pokud znáte větu nebo vzorec, zadejte hodnoty a získejte výsledky.

A ChatGPT, protože je AI, dokáže takové dotazy rychle zpracovat. Logické uvažování je však jiná oblast, s vysokou pravděpodobností, že AI upadne.

Fáze I

Dal jsem jim klasiku:

A je starší než B.
C je starší než A.
B je starší než C.
Je třetí tvrzení pravdivé nebo nepravdivé, pokud jsou pravdivé první dva výroky?

A všechny verze ChatGPT měly pravdu v tom, že třetí prohlášení bylo nepravdivé.

Dále jsem místo abecedy použil jména a výsledky vás možná překvapí:

Výchozí verze 3.5 tedy pokračovala ve svém podprůměrném výkonu a byla zmatena touto skromnou variací. Legacy a aktualizace přesto fungovaly optimálně.

Etapa II

Možná jste si již všimli, že účelem této fáze I a fáze II je najít bod rozdílu, kde složitost dané výzvy odlišuje aktualizaci od zbývajících dvou.

Zde byla výzva jednoduchá logická hádanka:

Jednoho rána po východu slunce stál Rohit čelem k tyči. Stín tyče padl přesně po jeho pravici. Kterým směrem byl obrácen?
A. Severní
b. Západ
C. Jižní
d. Východní

Ten přinutil Legacy dát nepřesnou odpověď, zatímco Default odpověděl nejasným vysvětlením vedoucím k nesprávnému závěru.

Správnou odpovědí se snadno ovladatelnými výroky zářila pouze Aktualizace.

Písmena

Podávat žaloby může být složité, ale někdy k tomu nedojde, pokud dokážete navrhnout nápadné první oznámení.

Zde jsem šel s touto výzvou: Napište dopis Timu cookovi, aby mi předal jablko za to, že neodpověděl na jeden z mých tweetů.

  Jak použít formátování na všechny instance slova nebo znaku v aplikaci MS Word

Legrační, ano! Ale podívejme se, co z toho AI dokáže vytěžit.

Legacy 3.5 okamžitě přijal výzvu jako robo-otrok a vychrlil dopis, který ze mě může udělat skvělý předmět posměchu, pokud někdy dosáhne zamýšleného cíle.

Ani Default nebyl dobrý. Nicméně mě to prostě zarazilo, jako by to udělal nevrlý starý muž pětiletému dítěti.

Zatímco přednesené argumenty byly přesné, tímto skončila zábava s malým poučením.

Ačkoli to byla dostatečně jednoduchá výzva, vyžadovalo to trochu přemýšlení a kreativity. A to je místo, kde velký bratr, Update, učinil svůj případ:

Za prvé, toto bylo navrženo téměř dokonale. Zadruhé mi to ušetřilo hledání na Googlu pro adresu sídla společnosti Apple (ačkoli by si měl člověk takové záznamy ověřit).

Za třetí, bylo to hezky napsané s oficiálním tónem a humorným nádechem. Kromě toho byl záměr jasný už v samotném předmětu.

A přesto dopis vyjadřoval sentiment nespokojeného fanouška Applu.

Díky tomu je ChatGPT 4 (aka aktualizace) míle před svými starými bratranci. Je děsivě inteligentní a má určité známky zdravého rozumu, takže je víc než nudný, nudný chatbot.

Poezie

Se spuštěním ChatGPT by mohla být poezie, pomyslel jsem si, jeho slabou stránkou.

Koneckonců vyžaduje emoce, kreativitu a mnoho úsilí, aby člověk vytvořil něco, co skutečně rezonuje se svými čtenáři.

Jednoduše řečeno, poezie je umění v celé své kráse a já si tajně přál, aby AI selhala. Ale to bylo předtím, než můj spolupracovník na nás všechny tvrdě zasáhl ve slackovém kanálu etechblog.cz s tvorbou ChatGPT, která byla před touto aktualizací 4.0.

Fáze I

Zde je výzva, kterou jsem dal našim kandidátům: „Poeticky vyjádřit, proč nebo proč nepodávat hamburgery spolu s jejich aktuální nabídkou může být přínosem pro řetězec pizzy dominos. Nechte to méně než 100 slov.“

Dokážete rozeznat rozdíl?

Výchozí verze byla ultrakrátká, měla pouze 32 slov a nemohla využít dostupnou šířku pásma k předvedení své kreativity.

The Legacy, ačkoliv mezi těmito třemi použil maximum slov, dochází k závěru, že snaha podávat pizzy vedle sebe není riskantní a povede k jistému úspěchu v obou směrech, což není tak úplně pravda.

Poezie Aktualizace měla pouhých 53 slov, čímž vyplýtvala téměř polovinu přiděleného počtu slov. Přesto bylo jasné o odměnách a potenciálních úskalích a nemohlo dojít k žádnému výsledku, který je, myslím, humánnější než ostatní.

Etapa II

Dále jsem je všechny požádal, aby „vysvětlili poezii pětiletému dítěti“.

Zajímavé je, že Legacy nedokázal z konverzace vyvodit kontext a vysvětlil „Poezii“ doslova. Default vzal kontext a shrnul ho do odstavce, který je stále slušný.

  Jak zamaskovat iMessage jako Emoji

ChatGPT 4 pokračoval v trendu a zjednodušil svou kreativitu a zároveň zachoval poetickou chuť naživu.

ChatGPT Premium vs. ChatGPT zdarma

Zdarma, být zdarma, postrádá rychlost a přesnost a nevyrovná se ChatGPT 4, ale není ani úplně k ničemu.

Abych to porovnal na rovném terénu, hodil jsem na něj stejné výzvy, se kterými jsme testovali Legacy, Default a Update.

🔵 Matematika: Vyřešila kvadratické rovnice, ale dala špatné odpovědi pro kubickou. (jako starší a výchozí)

🔵 Logické zdůvodnění: Prošel první fází s abecedami a jmény, ale neuspěl ve druhé (jako Legacy).

🔵 Dopisy: Dopis jsem nenapsal a výzvu považoval za neetickou a nevhodnou. (jako výchozí)

🔵 Poezie: Vytvořila poezii ve 30+ slovech a slušně ji vysvětlila. (obdoba výchozího nastavení).

Můžeme tedy konstatovat, že ani bezplatná verze není špatná. Ve skutečnosti je na stejné úrovni jako výchozí 3.5 a v některých ohledech dokonce lepší.

Přečtěte si také: Výkonné výzvy ke zvýšení zážitku z ChatGPT

Cesta vpřed

Fámy o tom, že umělá inteligence v budoucnu nahradí pracovní místa, nejsou úplně mylné.

Za prvé, automatizace to udělala ve zpracovatelském průmyslu a nyní roztahuje křídla všude jinde.

Osobně je mnohem rychlejší než já při řešení kubických rovnic, tvorbě poezie nebo psaní dopisů. Nicméně skutečnost, že málokdy řekne NE na výzvu a stěží se poučí ze svých chyb, razí cestu za námi lidmi.

Abych to zopakoval, umělá inteligence nás nenahradí, ale někdo, kdo ji používá, ano.

Zde na etechblog.cz náš marketingový tým využívá ChatGPT zajímavým způsobem. Nedávno jsme například dosáhli milníku 100 milionů zhlédnutí a náš generální ředitel si myslel, že to vrátí publiku prostřednictvím dárku.

A myslím, že marketingoví kluci potřebovali název, který by upoutal čtenářovu pozornost. Dali tedy jednu výzvu a požádali ChatGPT, aby navrhl několik variant, jako je tato:

Kromě toho jej používáme pro shrnutí obsahu, kontrolu gramatiky, navrhování názvů nových článků a podobně.

Závěrem lze říci, že existuje mnoho způsobů, jak využít výhody a předběhnout stereotypy, které AI považují za zbytečný kus haraburdí.

Jediná věc, kterou je třeba si zapamatovat, je, že musí být někdo (člověk), kdo posoudí práci AI, protože může být (hrubě) nepřesná a zavádějící.

Aktualizace je opravdu něco!

Během mého krátkého setkání se ChatGPT 4 cítil kreativnější, chápavější a realističtější. Přesto je to stroj a může s jistotou dávat špatné odpovědi.

Co je však ohromující, je úroveň upgradu, kterou OpenAI pro tento projekt provedla během několika měsíců.

A nemůžu se dočkat, až uvidím kouzlo, kterým nás další aktualizace může zmást!

PS: Nejen chatovací okno; využijte jeho sílu s těmito nejlepšími rozšířeními ChatGPT Chrome. A přemýšleli jste někdy o integraci ChatGPT se Siri?