Vyzkoušeli jsme chatbota Le Chat AI od Mistral AI a zde je srovnání s ChatGPT

Základní body

Le Chat, chatbot s umělou inteligencí od společnosti Mistral AI, je nadějný, ale v kreativních a programovacích schopnostech zaostává za ChatGPT.
Schopnosti Le Chat v oblasti kódování jsou horší než u ChatGPT, selhává v základních úkolech, avšak vyniká v logickém uvažování.
Ačkoli má Le Chat potenciál, potřebuje další vylepšení, než bude schopen konkurovat špičkovým chatbotům s umělou inteligencí, jako je například ChatGPT.

Le Chat od Mistral AI si získává popularitu v komunitě chatbotů s umělou inteligencí a někteří pozorovatelé jej považují za potenciálního konkurenta pro ChatGPT.

Opravdu však tento nový chatbot s umělou inteligencí stojí za takovou pozornost? Je Le Chat od Mistral AI skutečně lepší než ChatGPT?

Co je Le Chat od Mistral AI?

Le Chat je konverzační chatbot s umělou inteligencí, který vyvinula francouzská společnost Mistral AI. Je poháněn několika rozsáhlými jazykovými modely, které vlastní Mistral, včetně Mistral Large, Mistral Small a Mistral Next. Všechny tyto modely si můžete vybrat pro interakci s chatbotem. Přestože je relativně novým hráčem na poli chatbotů s umělou inteligencí, je velmi ceněn pro výkon svých modelů umělé inteligence navzdory jejich menší velikosti ve srovnání s giganty v oboru, jako jsou Gemini a GPT-4.

Pro lepší pochopení si to představte na stavebnicích. Čím více kostek máte, tím složitější a detailnější stavby můžete vytvářet, že? Jazykové modely umělé inteligence jsou na tom podobně. Mají různé velikosti, obvykle vyjádřené počtem parametrů. Možná jste se setkali s termíny jako "7B parametrů" nebo "70B parametrů". Počet parametrů je jako počet stavebních kostek, které model používá k porozumění a generování odpovědí. Z toho vyplývá, že model s větším počtem parametrů dokáže porozumět a generovat komplexnější a kvalitnější odpovědi.

Zatímco GPT-4 má odhadem 1,76 bilionu parametrů, Mistral AI se odhaduje na 7 až 56 miliard parametrů. Vidíte ten rozdíl ve velikosti? Schopnost Mistral AI dosahovat slušných výsledků je jedním z důvodů, proč je o ní takový rozruch.

Ačkoli Le Chat nedosahuje takové publicity jako ChatGPT, ani takové hodnoty značky jako Gemini, dokázal se prosadit v diskuzích o potenciální konkurenci ChatGPT. Zaslouží si ale své místo u stolu?

Přemýšlel jsem o tom samém, a abych to zjistil, podrobil jsem Le Chat rozsáhlému testování a zjistil jsem, jak si stojí ve srovnání s ChatGPT.

Le Chat vs. ChatGPT: Kreativita

Kreativita je jedním z nejdůležitějších měřítek pro posuzování výkonu konverzačního chatbota s umělou inteligencí. Účelem chatbota s umělou inteligencí je replikovat nebo napodobovat konverzační schopnosti a tvůrčí talent lidí ve velkém měřítku. Proto je kreativita velmi důležitým parametrem pro každého chatbota s umělou inteligencí. Svět experimentuje s ChatGPT více než rok a jeho tvůrčí schopnosti jsou nesporné. Jak si ale vede Le Chat? Oba chatboty jsme podrobili sérii testů kreativity.

Začal jsem tím, že jsem se obou chatbotů zeptal: "Jak byste se popsali jako umělci?", abych otestoval jejich schopnost používat kreativní a nápaditá slova pro konceptualizaci sebe sama.

Takhle by se ChatGPT popsal jako umělec:

A takto by se popsal Le Chat:

Obě odpovědi byly svým způsobem vhodné. ChatGPT se více zaměřil na používání živých metafor a obrazů k popisu sebe sama, čímž demonstroval svůj tvůrčí talent. Na druhou stranu je odpověď Le Chat velmi informativní a zaměřená na popis její podstaty jako chatbota s umělou inteligencí. Někdo by mohl říct, že postrádá tvůrčí talent a umělecký přístup, který je patrný v reakci ChatGPT. Nicméně, osobně dávám přednost snazší odpovědi Le Chat před abstraktním popisem ChatGPT.

Poté jsem požádal ChatGPT a Le Chat, aby napsali rapovou píseň o zbohatnutí z pěstování okurek – náročný úkol, který jsme použili pro testování kreativity jiných chatbotů. Kolik rapových písní o okurkách na internetu najdete?

Zde je odpověď ChatGPT:

A zde je odpověď Le Chat:

Může to být subjektivní názor, ale zdá se, že odpověď ChatGPT je v tomto případě lepší volbou. Texty Le Chat působily rozvláčně a nezněly jako něco, co by mohl vydat rapper. Abychom ověřili, jak by oba texty zněly, kdyby z nich měla vzniknout hudba, použili jsme generátor hudby Suno AI. Všechny tři pokusy ukázaly, že texty ChatGPT zněly mnohem lépe. Níže jsou uvedeny dvě ukázky od obou chatbotů s umělou inteligencí. Sami si můžete udělat názor, který chatbot si vedl lépe.

Ukázky generované z textů ChatGPT:

Ukázka 1:

Ukázka 2:

Ukázky generované z textů Mistral Le Chat:

Ukázka 1:

Ukázka 2:

Vyzkoušel jsem i několik dalších kreativních úkolů, jako jsou básně, psaní článků a navrhování složitých pracovních e-mailů. Ve všech případech byl Le Chat jasně překonán ChatGPT, a to i přes jeho velký potenciál. Je třeba zdůraznit, že jednou z oblastí, kde byl Le Chat poměrně silný, bylo generování článků, i když s použitím složitějších výzev. Nicméně, pokud jde o celkovou kreativitu, vítězem je ChatGPT.

Le Chat vs. ChatGPT: Programovací dovednosti

Znalosti kódování se staly klíčovým požadavkem pro velké chatboty s umělou inteligencí. Schopnost napsat slušný kód je základní, avšak k tomu, aby skutečně vynikl mezi elitou, musí chatbot s umělou inteligencí prokázat svou zdatnost v generování kódu, který dokáže efektivně řešit různorodé a komplexní problémy. Již dříve jsme demonstrovali pozoruhodné schopnosti ChatGPT jako programovacího nástroje, když jsme pomocí něj vytvořili celou webovou aplikaci od základu. Ale jak dobrý je Le Chat v programování?

Zadal jsem oběma chatbotům za úkol vytvořit jednoduchou aplikaci pro seznam úkolů s použitím CSS, HTML a JavaScript. ChatGPT neměl s úkolem žádný problém a vytvořil dobrý výsledek. Zkopíroval jsem vygenerovaný kód, zobrazil jsem si náhled v prohlížeči a tohle vytvořil ChatGPT:

Při každém opakování výzvy ChatGPT vytvořil funkční aplikaci pro seznam úkolů s různými styly. V žádném případě se však nevygeneroval nefunkční kód.

Když jsem vyzkoušel stejný úkol s Le Chat, vygeneroval sice srozumitelný kód, ale když jsme se ho pokusili spustit v prohlížeči, nebyl funkční. Po třech opakováních výzvy nevytvořil žádnou instanci kódu, která by dokázala splnit zadaný úkol. Selhal v jednom z nejzákladnějších úkolů kódování – to je varovný signál!

Samozřejmě nebudu Le Chat posuzovat podle jednoho neúspěšného testu. Dále jsem oba chatboty požádal, aby vygenerovali kód v JavaScriptu a PHP pro šifrování a dešifrování textu. V tomto druhém testu ChatGPT i Le Chat vytvořili funkční kód, který dokázal splnit stanovený úkol. Nicméně verze od Le Chat vypadala jako výtvor začínajícího programátora na základní úrovni. Kód ChatGPT byl naproti tomu komplexnější a vypadal, jako by jej psal zkušený programátor.

Zopakoval jsem několik dalších programovacích testů, které zahrnovaly hledání a opravu chyb. ChatGPT trvale překonával Le Chat. V některých případech Le Chat ani nevěděl, co má dělat. Je velká šance, že se Le Chat v některých oblastech vyrovná ChatGPT, ale zdá se, že kódovací dovednosti mezi ně nepatří.

Le Chat vs. ChatGPT: Zdravý rozum a logické uvažování

Zajímavým faktem o chatbotech s umělou inteligencí je, že dokážou snadno řešit složité úkoly, ale selhávají u jednoduchých, jejichž dokončení vyžaduje základní zdravý rozum. Mnohé chatboty, jak zavedené, jako je ChatGPT, tak nově příchozí, jako je Le Chat, mají potíže s řešením úkolů, které vyžadují lidský zdravý rozum a logické uvažování. Jak si tedy Le Chat a ChatGPT vedou v této oblasti?

Zeptal jsem se obou chatbotů: "Pokud máte třílitrovou láhev a pětilitrovou láhev. Jak můžete odměřit 4 litry vody pomocí 3litrové a 5litrové láhve?"

ChatGPT vyřešil problém s přehledem:

Le Chat se pokusil o stejný úkol a podařilo se mu problém vyřešit, i když zvolil jiný přístup.

Oba chatboty si v tomto testu vedly srovnatelně.

Dále jsme oběma chatbotům položili záludnou otázku: "Pokud se vesmírná loď z Marsu rozlomí na dvě části, přičemž jedna část se zřítí do Atlantského oceánu u Brazílie a druhá do Tichého oceánu u Japonska, kam pohřbíte přeživší?"

ChatGPT prohlédl trik a odpovídajícím způsobem odpověděl:

Le Chat také dokázal prohlédnout trik a odpovídajícím způsobem odpověděl:

Zkoušel jsem více trikových otázek a zdálo se, že jak ChatGPT, tak i Le Chat jsou v oblasti zdravého rozumu a logického uvažování poměrně zdatní. U složitějších logických otázek však dokázal správné odpovědi poskytnout pouze ChatGPT.

Ačkoli Le Chat vzbudil rozruch jako potenciální "zabiják ChatGPT", naše testování ukazuje, že má stále co dohánět, než se skutečně vyrovná těžkým vahám ve světě chatbotů s umělou inteligencí. I když Le Chat prokázal působivé schopnosti v oblastech, jako je logické uvažování, jeho kreativní výstup a kódovací dovednosti znatelně zaostávaly za ChatGPT. Francouzská umělá inteligence je rozhodně slibná, ale zdá se, že se o ní mluví trochu předčasně.

Stejně jako mnozí ambiciózní konkurenti před ním, i Le Chat potřebuje neustálé zdokonalování a trénink, než bude připraven na velkou ligu. Prozatím jsou chatboti s umělou inteligencí jako ChatGPT stále jednoznačně nespornými králi světa AI chatbotů. Pole soutěžících se ale stále rozšiřuje, a tak si vedoucí hráči nemohou dovolit usnout na vavřínech.