AI Gemini od Googlu je tu, ale je lepší než ChatGPT?

Zásadní body

Umělá inteligence Google Gemini se prezentuje ve třech variantách – Ultra, Pro a Nano, přičemž každá je zacílena na specifické úlohy a různé úrovně náročnosti.
Gemini Ultra vykazuje nadějné výsledky v klíčových testech umělé inteligence, avšak pro veřejnost není dostupná od prosince 2023. Dle vyjádření Google se očekává její zpřístupnění v lednu 2024.
Gemini Pro je již k dispozici a přestože funguje obstojně, v současné době nedokáže sesadit GPT-4 z pozice lídra na trhu.

Společnost Google opakovaně prohlašuje, že její model umělé inteligence Gemini překoná OpenAI GPT-4, který je hnacím motorem ChatGPT Plus. Po uvedení Google Gemini na trh, můžeme konečně prověřit, jak si Gemini stojí v porovnání s GPT-4.

Když Google v březnu 2023 představil Barda, vzbudilo to velké očekávání. Konečně by měl být narušen monopol ChatGPT od OpenAI a dostali bychom plnohodnotnou konkurenci.

Nicméně, Bard nikdy nenaplnil očekávání a nezaujal pozici titána v oblasti umělé inteligence. GPT-4 nadále dominuje mezi platformami generativních chatovacích botů s umělou inteligencí. Nyní přichází na scénu Gemini od Googlu – je však tento dlouho očekávaný model skutečně lepší než ChatGPT?

Co je Google Gemini AI?

Gemini představuje nejpropracovanější generativní model umělé inteligence od Googlu. Je navržen tak, aby dokázal porozumět a pracovat s různými formáty dat, jako je text, zvuk, obrázky a video. Tento model je pokusem společnosti Google o vytvoření jednotného systému umělé inteligence, který bude čerpat z jejich nejvýkonnějších technologií. Gemini se bude nabízet ve třech variantách:

Gemini Ultra: Největší a nejvýkonnější varianta, navržená pro zvládání vysoce komplexních úloh.
Gemini Pro: Optimální model pro škálování a poskytování vysokého výkonu v široké škále úkolů, avšak s nižšími schopnostmi než Ultra.
Gemini Nano: Nejefektivnější model určený pro implementaci úloh přímo na zařízení. Vývojáři mohou například využít Gemini Nano pro tvorbu mobilních aplikací nebo vestavěných systémů, čímž přenesou výkonnou umělou inteligenci do mobilního prostoru.

V oficiálním blogovém příspěvku The Keyword Google uvádí, že Gemini Ultra překonává současnou špičku v několika benchmarkových testech. Dle jejich tvrzení, Gemini Ultra poráží lídra GPT-4 v několika klíčových srovnávacích testech.

S bezprecedentním skóre 90,0 % v náročném benchmarku MMLU se Gemini Ultra stává prvním modelem, který v tomto komplexním testu zahrnujícím 57 oborů dosáhl výkonu srovnatelného s lidmi.

Google

Gemini Ultra je také schopna porozumět, vysvětlovat a generovat kvalitní kód v některých z nejpopulárnějších programovacích jazyků, včetně Go, JavaScript, Python, Java a C++. Tyto výsledky vypadají skvěle na papíře, ale je třeba mít na paměti, že benchmarky ne vždy odrážejí realitu. Jak si tedy Gemini poradí s úkoly v reálném světě?

Jak používat Google Gemini AI

Z trojice modelů Gemini AI je v současné době dostupný Gemini Pro, který můžete využít v chatovacím robotu Bard od Googlu. Pro přístup k Gemini Pro prostřednictvím Barda, navštivte bard.google.com a přihlaste se pomocí svého účtu Google.

Spuštění Gemini Ultra je plánováno na leden 2024, proto se zatím musíme spokojit s testováním Gemini Pro proti ChatGPT.

Srovnání Gemini s GPT-3.5 a GPT-4

Při uvedení jakéhokoliv nového modelu umělé inteligence se nevyhnutelně srovnává s modely GPT od OpenAI, které jsou považovány za špičku v oboru. S pomocí Bard a ChatGPT jsme testovali schopnosti Gemini v matematice, kreativním psaní, generování kódu a zpracování obrazových vstupů.

Začali jsme jednoduchou matematickou úlohou: -1 x -1 x -1.

Bard se pokusil jako první. Opakovali jsme otázku dvakrát a pokaždé vrátil špatný výsledek. Správné odpovědi dosáhl až na třetí pokus, což se ale nepočítá.

Následně jsme otestovali ChatGPT s GPT-3.5. Ten hned napoprvé vyřešil úlohu správně.

Pro ověření schopnosti Gemini interpretovat obrázky jsme zadali úlohu interpretace některých populárních memů. Gemini odmítl s tím, že nemůže interpretovat obrázky s lidmi. ChatGPT s GPT-4V úlohu bez problémů zvládl.

Pokusili jsme se o další test, který by prověřil schopnost interpretovat obrázky a zároveň řešit problémy a kódovat. Zadali jsme Bardovi, poháněnému Gemini Pro, snímek obrazovky a požádali ho o interpretaci a vygenerování HTML a CSS kódu pro replikaci tohoto snímku.

Zde je zdrojový snímek obrazovky.

Následuje výsledek Gemini Pro při pokusu interpretovat a replikovat snímek obrazovky pomocí HTML a CSS.

A zde je pokus GPT-4 o replikaci snímku obrazovky. Výsledek není překvapivý, s ohledem na historickou sílu GPT-4 v kódování. Již dříve jsme ukázali, jak lze GPT-4 využít k vytvoření webové aplikace od nuly.

Požádali jsme Gemini Pro o vytvoření básně na téma Tesla (značka elektromobilů). Vykázal mírné zlepšení oproti dřívějším testům. Zde je výsledek:

V tuto chvíli se zdálo, že srovnání s GPT-3.5, namísto výkonnějšího GPT-4, by bylo adekvátnější. Proto jsme požádali ChatGPT s GPT-3.5 o vytvoření podobné básně.

Může se jednat o subjektivní názor, ale zdá se, že přístup Gemini Pro je o něco lepší. Nicméně, posouzení ponecháváme na vás.

Je Gemini lepší než ChatGPT?

Před uvedením Barda jsme se domnívali, že to bude konkurence pro ChatGPT, na kterou čekáme. Nicméně, to se nestalo. Nyní přichází Gemini, a Gemini Pro se zatím nejeví jako model, který by ChatGPT mohl ohrozit.

Google tvrdí, že Gemini Ultra bude mnohem výkonnější. Opravdu doufáme, že tomu tak bude a že splní či překoná sliby uvedené v oznámení o Gemini Ultra. Ale dokud neuvidíme a neotestujeme nejvýkonnější verzi generativního nástroje AI od Googlu, nemůžeme si být jisti, zda dokáže sesadit konkurenční modely umělé inteligence. V současnosti zůstává GPT-4 neohroženým šampionem mezi modely AI.