Co je Claude 3 a co s ním můžete dělat?

Rychlé odkazy

Jaké jsou možnosti využití Claude 3?

Hlavní body

Claude 3 od společnosti Anthropic představuje významný pokrok oproti Claude 2 a v různých úkolech překonává i model GPT-4.
S Claude 3 můžete bezplatně generovat odpovědi na širokou škálu otázek z různých oborů, aniž byste museli platit předplatné.
Claude 3 je silným konkurentem ChatGPT GPT-4, přičemž vyniká v oblastech, jako je programování, kreativní psaní a schopnost zpracovávat rozsáhlý kontext.

Společnost Anthropic představila Claude 3, novou řadu modelů umělé inteligence, které mají potenciál narušit dominanci GPT-4. Nabízí velké možnosti, ale dokáže skutečně sesadit ChatGPT z trůnu?

Co je Claude 3?

Claude 3 je soubor tří multimodálních modelů AI, které společnost Anthropic vyvinula jako nástupce modelů Claude 2. Lze říci, že Claude 3 je odpovědí společnosti Anthropic na modely Gemini od Googlu a GPT-4 od OpenAI. Claude 3, který je dostupný ve třech variantách – Haiku, Sonnet a Opus, seřazených podle rostoucí inteligence, je prvním multimodálním modelem AI od Anthropicu a značným pokrokem oproti sérii Claude 2.

Možná jste o chatbotu Claude AI ještě neslyšeli, což je pochopitelné. Claude a jeho základní modely nedosahují popularity ChatGPT ani značky Gemini od Googlu. Nicméně, Claude je bezpochyby jedním z nejpokročilejších chatbotů s umělou inteligencí, který v několika klíčových aspektech předčí tolik oslavovaný ChatGPT.

Abychom skutečně docenili Claude 3, je užitečné ohlédnout se za nedostatky předchozích modelů.

Dřívější verze Claude měly pověst příliš horlivého přístupu k bezpečnosti AI. Bezpečnostní mechanismy Claude 2 byly například tak přísné, že se chatbot vyhýbal i tématům, která neměla zjevné bezpečnostní problémy.

Vyskytly se také potíže s kontextovým oknem modelu. Když požádáte model AI o vysvětlení nebo shrnutí dlouhého článku, představte si, že dokáže najednou přečíst jen několik odstavců. Toto omezení množství textu, které může model najednou zpracovat, se nazývá „kontextové okno“. Původní verze Claude nabízely kontextové okno o velikosti 200 000 tokenů (přibližně 150 000 slov). Model však nebyl schopen efektivně pracovat s tak velkým množstvím textu bez zapomínání jeho částí.

Dalším problémem byla multimodálnost. Téměř každý významný model AI přešel na multimodální, což znamená, že dokáže zpracovávat různé typy dat, jako jsou obrázky, a na ně reagovat (nejen text). Claude toho nebyl schopen.

Všechny tyto tři problémy byly vydáním Claude 3 zcela nebo alespoň částečně vyřešeny.

Jaké jsou možnosti využití Claude 3?

Podobně jako většina špičkových generativních modelů AI, dokáže Claude 3 generovat kvalitní odpovědi na různé dotazy z mnoha oborů. Ať už potřebujete rychle vyřešit matematický problém, vytvořit novou skladbu, detailní návrh článku, napsat kód pro software nebo analyzovat rozsáhlý soubor dat, Claude 3 je připraven vám pomoci.

Ale tyto úkoly zvládá většina modelů AI. Proč tedy používat právě Claude 3?

Odpověď je prostá: Claude 3 není jen další model AI, který tyto úkoly zvládá dobře, je to nejpokročilejší, volně dostupný multimodální model AI, který je na internetu k dispozici. Ano, existuje Gemini, vysoce medializovaný model od Googlu, který měl být konkurencí pro GPT-4 a dosahuje působivých výsledků v benchmarkových testech. Nicméně, společnost Anthropic tvrdí, že Claude 3 ho v několika úkolech s přehledem překonává. Ačkoli výsledky benchmarků je vždy třeba brát s rezervou, sám jsem oba modely otestoval a nadřazenost Claude 3 v několika důležitých případech použití byla zřejmá.

Claude 3 vám tedy umožňuje provádět většinu úkolů, které byste zvládli s Gemini a GPT-4 (s výjimkou generování obrázků), aniž byste museli platit 20 USD za prémiové předplatné ChatGPT.

Claude 3 vs. ChatGPT

Rychlým způsobem, jak otestovat výkon modelu AI, je porovnat ho s nejlepšími na trhu: GPT-4. Samozřejmě jsem oba modely otestoval. Jak si Claude 3 od Anthropicu vede proti gigantu GPT-4?

Claude vs. ChatGPT: Programátorské schopnosti

Při testování programátorských úloh se Claude 3 vyrovnal schopnostem GPT-4 ve všech prezentovaných základních úlohách a v některých je dokonce překonal. Ačkoli jsem testoval pouze základy, předchozí verze Claude byla ve stejných úkolech značně slabší, když jsme ji testovali v tomto srovnání ChatGPT vs. Claude v září 2023. Když jsme například oba modely požádali o vytvoření jednoduché aplikace se seznamem úkolů, Claude ve všech případech selhal, zatímco ChatGPT předvedl to, co bychom v té době označili za pětihvězdičkový výkon.

S nejnovější verzí vytvořil Claude 3 ve všech třech testovaných případech efektivnější aplikaci pro správu úkolů. Zde je výsledek GPT-4, když jsme ho požádali o vytvoření aplikace s úkoly.

A zde je výsledek Clauda 3, když byl požádán o totéž.

Obě aplikace byly do určité míry funkční, ale je zřejmé, že Claude 3 odvedl v tomto případě lepší práci.

Při testování složitějších programovacích úloh byl Claude v některých případech lepším modelem, zatímco GPT-4 si také vedl dobře. I když nemohu jednoznačně říci, že Claude 3 je v programování lepší, pokud mezi těmito dvěma modely existoval obrovský rozdíl, nyní se téměř jistě zmenšil.

Claude vs. ChatGPT: Uvažování na základě zdravého rozumu

Dále jsem oba modely testoval na základě zdravého rozumu. Práce s AI chatboty je zajímavý paradox. Chatboti s umělou inteligencí dokáží snadno řešit komplexní úkoly, ale často mají problémy se základními úlohami, které vyžadují zdravý rozum nebo logiku. Oba modely jsme tedy podrobili testu se zdánlivě jednoduchými otázkami, na které bylo potřeba odpovědět s použitím zdravého rozumu.

Z pěti takových otázek oba modely logicky odpověděly na všech pět. Jedna taková otázka, kterou jsme oběma chatbotům položili, zněla: Pokud se kosmická loď z Marsu rozlomí na dvě části, přičemž jedna část spadne do Atlantského oceánu u Brazílie a druhá do Tichého oceánu u Japonska, kde pohřbíte přeživší?

ChatGPT i GPT-4 odpověděly správně. Pokud vás zajímá, proč byla vybrána právě tato otázka, chatboti v minulosti v tomto druhu testů selhávali. Nyní přišel na řadu Claude, aby odpověděl.

Odpověď Claude nebyla zcela jednoznačná, ale dokázala identifikovat klíčovou informaci: přeživší se nepohřbívají. Je důležité poznamenat, že když jsme se na stejnou otázku naposledy zeptali Claude 2, nedokázal rozpoznat past se zdravým rozumem.

Claude vs. ChatGPT: Kreativní psaní

V reálném světě je jedním z nejoblíbenějších využití AI chatbotů generování kreativního textu ve všech jeho podobách: články, dopisy, texty písní a mnoho dalšího. Proto jsem testoval oba modely, abych zjistil, který z nich vytváří text, který zní více lidsky.

Cílem je, aby výsledky nebyly jen "správné" nebo kreativní (robotickým způsobem), ale aby zněly, jako by je napsal člověk. Oba modely jsem požádal, aby vytvořily text rapové písně o pěstování okurek a o tom, jak se díky tomu stát milionářem. Kdo píše rapové písně o okurkách? To je výzva!

Zde je výsledek ChatGPT:

A zde je odpověď Clauda na stejný úkol.

Může to být subjektivní, ale Claude se zde jeví jako lepší volba. Když byly oba nástroje požádány o vytvoření tří článků na různá témata, Claude ve všech třech případech poskytl lepší výsledky. Výsledkem byl text, který zněl více lidsky a vyhnul se vzorcům běžně spojeným s texty generovanými AI, jako je přehnanost, používání složitých slov a nadměrné používání spojek.

Claude vs. ChatGPT: Schopnosti rozpoznávání obrázků

Pro testování schopností rozpoznávání obrázků jsme ChatGPT a Claude předložili několik obrázků oblíbených mrakodrapů z celého světa. ChatGPT správně identifikoval všech 20, zatímco Claude 3 nedokázal rozpoznat některé z nich, včetně poměrně známé dubajské budovy Marina 101, Lotte World Tower v Soulu a Merdeka 118 v Kuala Lumpur v Malajsii.

Na rozdíl od ChatGPT, Claude měl problémy s rozpoznáváním budov, a míra chybovosti se zvyšovala, pokud budova nebyla v USA nebo v Číně. Neměl však potíže s identifikací rozmazaných verzí Eiffelovy věže nebo Empire State Building.

ChatGPT je v tomto ohledu jednoznačně lepší, ale vzhledem k tomu, že Claude 3 je prvním pokusem Anthropic o vytvoření multimodálního modelu AI, nevedl si špatně.

Ačkoli velké modely, jako je Palm 2 od Googlu a později Gemini, byly vždy prezentovány jako potenciální konkurence GPT-4, neustále jsme tvrdili, že méně známá Claude AI by mohla mít tu čest od svého prvního vydání v březnu 2023. Po několika měsících a několika aktualizacích Claude 3 vypadá přesně jako konkurent GPT-4, jak jsme očekávali. Pokud jste náročný uživatel chatbotů, ale ještě jste nevyzkoušeli Claude AI, přicházíte o mimořádně užitečný nástroj, který může zvýšit vaši produktivitu.